ИСТИНА |
Войти в систему Регистрация |
|
ИПМех РАН |
||
В статье рассматриваются следующие проблемы: определение синтаксиса и логико-семантическая структура терминов с использованием морфологического анализа и выбора иностранного эквивалента. Статистика грамматической структуры психологических терминов. В качестве исходного корпуса взяты тексты статей в журнале «Вопросы психологии». Подсчитана статистика двухсловных терминов в корпусе. Вычислены поточечная взаимная информация и расстояние между терминами в многомерном пространстве. Минимальное расстояние принято в качестве меры близости терминов. Визуализации пространства терминов выполнения средствами многомерного шкалирования. Прямой и обратный машинный перевод использовался для поиска эквивалентов научно-технических терминов. Вычислялось расстояние Левенштейна как мера семантической близости между терминами. <p> Abstract. In the article we discuss the following issues: The definition of syntax and logical-semantic structure of terms using morphological analysis and foreign equivalent selection. Statistics of the grammatical structure of the psychological terms. Texts of the articles in the “Voprosy Psichologii” journal as the source corpus. Statistics of two-word terms in the corpus. Pointwise mutual information and distance between terms. The maximal PMI for semantic field formation. Distance between multiword terms in the multidimensional space. Minimal distance as the measure of terms proximity. Terms clustering on the base of terms proximity. Multidimensional scaling for visualizing the terms space. Problems of unambiguous term definition. Machine translation as a means for finding equivalents of scientific and technical terms. Forward and reverse translation of terms using the online machine translation tools. Levenshtein distance as a measure of syntactic proximity between terms.