![]() |
ИСТИНА |
Войти в систему Регистрация |
ИПМех РАН |
||
Несмотря на очевидный интерес лингвистики к изучению устных видов речевой деятельности, который наблюдается уже несколько десятилетий, исследования устнопорождаемой речи по-прежнему не приобрели массового характера, поскольку в методологическом отношении они представляются весьма трудоемкими. Недостаток эмпирической информации о звучащей речи стал особенно ощутимым с развитием корпусной лингвистики, основной целью которой является накопление обширных, статистически значимых объемов языковых данных. Количественная асимметрия между электронными корпусами письменных текстов и мультимедийными корпусами звучащей речи вызвана целым рядом объективных трудностей, одной из которых является времязатратность орфографического транскрибирования объемных аудио- и видеофайлов. Последнее в полной мере касается и корпусов параллельных (дву- и многоязычных) текстов. В этом смысле использование технологий автоматического распознавания речи с целью осуществления автоматизированной транскрибации представляет собой метод оптимизации как отдельных лингвистических исследований, так и компиляции электронных корпусов, размещаемых на серверах открытого доступа. В докладе рассматриваются возможности ряда инструментов специализированного ПО и сетевых решений для преобразования звучащей речи в письменный текст, обобщается опыт создания трехязычного параллельного корпуса аудиовизуальных медиатекстов и намечаются перспективы метода автоматизированной транскрибации в целях лингвистического описания устного перевода и дидактики устнопереводческой деятельности