Анализ топологии и оценка точности лексикостатистических классификаций (на примере славянских языков)статья
Статья опубликована в журнале из перечня ВАК
Статья опубликована в журнале из списка Web of Science и/или Scopus
Дата последнего поиска статьи во внешних источниках: 20 апреля 2022 г.
Аннотация:В настоящее время лексикостатистические методы широко применяются в сравнительно-историческом языкознании для установления языкового родства и построения генеалогических классификаций. Особенно часто в работах отечественных компаративистов встречаются филогенетические деревья, полученные с помощью приложения Starling, разработанного С. А. Старостиным в конце XX в. В его основу была положена видоизменённая методика «присоединения соседей», дающая удовлетворительные или правдоподобные результаты в абсолютном большинстве случаев. В то же время многие исследователи указывают на ряд существенных недостатков в полученных классификациях, наиболее серьёзными среди которых являются неустойчивость древа да-же при минимальных изменениях в составе идиомов, а также наличие в нём большого количества фиктивных таксонов и узлов, плохо объяснимых или даже противоречащих существующим представлениям. В настоящей статье проводится детальное рассмотрение указанных недостатков на примере построения лексикостатистической классификации 25 славянских идиомов. По итогам рассмотрения предложена методика, позволяющая минимизировать влияние выявленных недостатков на строение древа с помощью особой процедуры, основанной на статистическом анализе полученной топологии и выявлении в ней недостоверных узлов. Особенности методики дают возможность для её практического использования реализации в виде дополнительного компонента Starling или отдельного приложения.