Аннотация:В статье обсуждаются различные способы оптимизации системы, мо-
делирующей референциальный выбор (РВ) на основе аннотирован-
ного корпуса с использованием машинного обучения. Аннотационная
схема, использовавшаяся в наших более ранних исследованиях, была
улучшена и расширена. На следующем этапе был имплементирован
более «дешевый» набор параметров с целью сокращения времени
обработки и трудозатратности аннотации. Наши результаты свиде-
тельствуют о том, что, несмотря на возможность исключения наибо-
лее «дорогих» факторов при моделировании РВ, лучшая аккуратность
предсказания достижима только при использовании максимального
количества доступной информации. Жанровая принадлежность тек-
стов была введена в систему в качестве одного из параметров и послу-
жила повышению показателя аккуратности. И наконец, была запущена
серия психолингвистических экспериментов по изучению категорич-
ности выбора, совершаемого говорящими/пишущими. Первые полу-
ченные нами результаты оказались многообещающими: они показали,
что в случаях, в которых системе не удается дать однозначное пред-
сказание, согласно человеческой оценке, возможно с равной вероят-
ность использование более одного референциального средства.