Аннотация:В работе рассматривается проблема извлечения именованных сущностей из новостных
текстов с использованием информации из Википедии. Разработана программа, которая которая автоматически строит языковую модель для системы Stanford NER по выбранному подмножеству статей из Википедии и сервиса Викиданных. При адекватном выборе подмножества вики-статей обученная модель меньше «зашумливается» данными из несмежных областей. Полученная модель далее применяется для автоматической разметки именованных сущностей.