Аннотация:В настоящее время доступно ограниченное количество размеченных наборов данных, предназначенных для извлечения сущностей, содержащих информацию о национальностях, религиозных или политических группах. В данной работе мы представляем датасет под названием RuNORP, который включает разметку именованных сущностей класса NORP. Этот корпус состоит из более чем 7,5 тыс. предложений, в каждом из которых присутствуют токены, относящиеся к классу NORP.