От языковых машинных фондов к лингвистическим корпусам: памяти В.М. Андрющенко - Конференция | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Члены программного комитета: Плунгян В.А., Казакевич О.А., Рафаева А.В., Воронцова М.И., Рафаева А.В., Шумарина И.В., Шайкевич А.Я., Перцов Н.В.
Охват: Всероссийская с международным участием
Даты проведения: 28-29 сентября 2018
Место проведения: Москва, Russia
Организаторы:
Лаборатория автоматизированных лексикографических систем Научно-исследовательского вычислительного центра Московского государственного университета им. М.В. Ломоносова
МГУ имени М.В. Ломоносова, Научно-исследовательский вычислительный центр, 4.15.Лаборатория автоматизированных лексикографических систем
Число участников: 70
Число иностранных участников: 1
Число участников из МГУ: 12
Число докладчиков: 45
Веб-сайт: http://www.lcl.srcc.msu.ru/seminar.files/andryushchenko_memorial_conference_2018.htm
Описание конференции:
Лаборатория автоматизированных лексикографических систем Научно-исследовательского вычислительного центра Московского государственного университета им. М.В. Ломоносова совместно с Институтом русского языка им. В.В. Виноградова РАН 28–29 сентября 2018 года проводит Международную конференцию «От языковых машинных фондов к лингвистическим корпусам: памяти В.М. Андрющенко». Необходимость построения языковых машинных фондов – компьютерных хранилищ лингвистических данных – была осознана в конце 70-х – начале 80-х гг. прошлого века. Теоретическим проблемам «машинного фонда данных для автоматизированной системы лексикографических исследований» были посвящены три всесоюзные конференции, проводившиеся в 1983, 1987 и 1989 гг. В 1985 г. по инициативе академика А.П. Ершова начались работы по созданию машинного фонда русского языка. В работе над Машинным фондом принимало участие более 40 организаций-соисполнителей; ведущей организацией стал Институт русского языка им. В.В. Виноградова, а Лаборатория вычислительной лингвистики (ныне Лаборатория автоматизированных лексикографических систем) Научно-исследовательского вычислительного центра МГУ под руководством В.М. Андрющенко превратилась в одну из основных площадок проекта: именно здесь вводом в компьютер и лемматизацией Саратовского корпуса было положено начало русского корпуса устной речи, именно здесь был оцифрован Грамматический словарь А.А. Зализняка, без которого сейчас немыслима никакая автоматическая обработка русского текста. Тогда же параллельно с работой над компонентами машинного фонда русского языка началась работа над машинными фондами языков народов СССР. На заре создания машинных фондов вряд ли кто-то ожидал, что компьютерная техника, на которую в то время многие смотрели с пиететом и с некоторым недоверием, будет развиваться столь стремительно, что разнообразные ухищрения с целью экономии компьютерной памяти или кодирования нестандартной графики станут неактуальными, электронные текстовые корпусы достигнут невообразимых объемов, а их автоматическая обработка – немыслимой скорости, и только ручное индексирование останется узким местом на пути к светлому лингвистическому будущему. Сегодня вместо текстового модуля Машинного фонда русского языка у нас есть Национальный корпус русского языка, вместо компьютерных словарей – электронные словари онлайн. Интернет, еще одна новая технология, появившаяся с тех пор, сделала мир безграничным, а корпусы и словари общедоступными. Задача конференции – обсудить развитие тех идей, которые легли в основу языковых машинных фондов, того, в какой степени эти идеи реализованы в современных корпусах, лексических базах и лингвистических программных средствах, что было приобретено и что, возможно, потеряно с развитием технических средств, и в какой степени современные корпусы и словарные базы могут считаться наследниками первых модулей машинных фондов.
Добавил в систему: Казакевич Ольга Анатольевна

Доклады:

2018 «Так не говорят!» Аутентичность материала при обучении иностранному языку (Устный)
Автор: Воронцова Марина Игоревна

2018 Кетский корпус: 1937-2018 (Устный)
Автор: Галямина Ю.Е.

2018 Компьютерный архив исчезающих языков Восточной Индонезии (Устный)
Автор: Членова С.Ф.

2018 Национальный корпус русского языка: история проекта и некоторые результаты (Устный)
Автор: Плунгян В.А.

2018 Словари в справочно-информационной системе СКАЗКА-2 (Устный)
Автор: Рафаева А.В.

2018 Создание корпуса русской речи носителей автохтонных языков Севера Сибири и Дальнего Востока (Устный)
Авторы: Стойнова Н.М., Плешак П.С., Хомченкова И.А.

2018 Цветы для Владислава Митрофановича (Пленарный)
Автор: Зайончковская Валерия Петровна

2018 Электронный корпус мансийских текстов: проблемы разработки и перспективы использования (Устный)
Авторы: Сизов Ф.О., Жорник Д.О.

	ИСТИНА	Войти в систему Регистрация
	ИПМех РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

ИПМех РАН

От языковых машинных фондов к лингвистическим корпусам: памяти В.М. АндрющенкоКонференция

Доклады:

Прикрепленные файлы