ИСТИНА |
Войти в систему Регистрация |
|
ИПМех РАН |
||
Лаборатория автоматизированных лексикографических систем Научно-исследовательского вычислительного центра Московского государственного университета им. М.В. Ломоносова совместно с Институтом русского языка им. В.В. Виноградова РАН 28–29 сентября 2018 года проводит Международную конференцию «От языковых машинных фондов к лингвистическим корпусам: памяти В.М. Андрющенко». Необходимость построения языковых машинных фондов – компьютерных хранилищ лингвистических данных – была осознана в конце 70-х – начале 80-х гг. прошлого века. Теоретическим проблемам «машинного фонда данных для автоматизированной системы лексикографических исследований» были посвящены три всесоюзные конференции, проводившиеся в 1983, 1987 и 1989 гг. В 1985 г. по инициативе академика А.П. Ершова начались работы по созданию машинного фонда русского языка. В работе над Машинным фондом принимало участие более 40 организаций-соисполнителей; ведущей организацией стал Институт русского языка им. В.В. Виноградова, а Лаборатория вычислительной лингвистики (ныне Лаборатория автоматизированных лексикографических систем) Научно-исследовательского вычислительного центра МГУ под руководством В.М. Андрющенко превратилась в одну из основных площадок проекта: именно здесь вводом в компьютер и лемматизацией Саратовского корпуса было положено начало русского корпуса устной речи, именно здесь был оцифрован Грамматический словарь А.А. Зализняка, без которого сейчас немыслима никакая автоматическая обработка русского текста. Тогда же параллельно с работой над компонентами машинного фонда русского языка началась работа над машинными фондами языков народов СССР. На заре создания машинных фондов вряд ли кто-то ожидал, что компьютерная техника, на которую в то время многие смотрели с пиететом и с некоторым недоверием, будет развиваться столь стремительно, что разнообразные ухищрения с целью экономии компьютерной памяти или кодирования нестандартной графики станут неактуальными, электронные текстовые корпусы достигнут невообразимых объемов, а их автоматическая обработка – немыслимой скорости, и только ручное индексирование останется узким местом на пути к светлому лингвистическому будущему. Сегодня вместо текстового модуля Машинного фонда русского языка у нас есть Национальный корпус русского языка, вместо компьютерных словарей – электронные словари онлайн. Интернет, еще одна новая технология, появившаяся с тех пор, сделала мир безграничным, а корпусы и словари общедоступными. Задача конференции – обсудить развитие тех идей, которые легли в основу языковых машинных фондов, того, в какой степени эти идеи реализованы в современных корпусах, лексических базах и лингвистических программных средствах, что было приобретено и что, возможно, потеряно с развитием технических средств, и в какой степени современные корпусы и словарные базы могут считаться наследниками первых модулей машинных фондов.
№ | Имя | Описание | Имя файла | Размер | Добавлен |
---|---|---|---|---|---|
1. | Программа конференции | Programma_konferentsii_Final.docx | 316,0 КБ | 17 сентября 2018 [kazakevich.olga] |