Разработка корпусного словаря старовавилонского диалекта аккадского языка - НИР | ИСТИНА – Интеллектуальная Система Тематического Исследования НАукометрических данных

Руководитель НИР: Архипов И.С.
Ответственные исполнители: Александров Б.Е., Архангельский Т.А., Мищенко А.И., Нуруллин Р.М.
Сторонняя организация: Национальный исследовательский университет "Высшая школа экономики"
Срок исполнения: 1 марта 2021 г. - 1 марта 2022 г.
Номер договора (контракта, соглашения): 20-512-22002\21
Номер ЦИТИС: АААА-А20-120081890049-6
Тип: Фундаментальная
Приоритетное направление научных исследований: другое
Рубрики ГРНТИ:
- 16.41.35 Древние языки Передней и Малой Азии
Ключевые слова: аккадский язык, лексикография, разметка корпуса, семитские языки, корпусный словарь, старовавилонский диалект, древняя месопотамия
corpus-based dictionary, old babylonian, corpus annotation, akkadian, semitic, mesopotamia
Описание:
Стратегическая цель проекта - описать в форме англоязычного словаря лексическую систему старовавилонского диалекта на основе корпуса старовавилонских писем и документов, внесенного в базу Babylonian Archives: 20th-17th centuries B.C. (www.archibab.fr). Объем корпуса оценивается в 34,000 клинописных текстов (обычный объем 50-100 слов) и 2,5 млн слов, что составляет около четверти всего аккадоязычного корпуса (по данным M. Streck, Grosses Fach Altorientalistik // Mitteilungen der deutschen Orient-Gesellschaft 142, 2010, p. 38, 47). Из них в ARCHIBAB по состоянию на сентябрь 2019 г. внесено около 40% по числу текстов и более 50% по числу слов. Число дошедших до нас лексических единиц старовавилонского диалекта (будущих словарных статей) согласно предварительной разметке корпуса составляет ок. 5 тыс. Однако очевидно, что создание такого словаря займет существенно больше трех лет (для сравнения, работа над Chicago Assyrian Dictionary шла более 50 лет). Настоящий проект направлен на решение ряда предварительных задач, без которых достижение стратегической цели невозможно: - Выработка общих лингвистически обоснованных правил разметки корпуса (подробнее см. раздел "Предлагаемые подходы и методы..."). - Разметка уже внесенных в ARCHIBAB текстов в соответствии с разработанной концепцией. Предполагается полуавтоматическая конвертация предварительной разметки, к настоящему времени выполненной примерно для 11,000 текстов, а также новая разметка ок. 3,000 текстов, внесенных в базу без аннотирования. - Оцифровка и внесение в ARCHIBAB недостающих текстов с последующей или одновременной разметкой. За 2007-2019 гг. в базу было внесено около 40% текстов, составляющих старовавилонский корпус писем и документов. Следует подчеркнуть, что в последние годы проект ARCHIBAB не получает финансирования для внесения новых текстов или развитие лексикографического направления, эти задачи выполняются фактически на общественных началах, в том числе российскими участниками заявки. Предлагаемый проект позволит значительно ускорить этот процесс. В первоочередном порядке будут вноситься тексты, наиболее существенные для лексического описания языка, главным образом письма. - Лексикографические исследования частных научных проблем, возникающих при решении вышеуказанных задач. Речь прежде всего идет об установлении или уточнении формы, значения, частеречной принадлежности тех или иных аккадских слов с учетом диалектной специфики. - Разработка концепции старовавилонского словаря с учетом его интеграции в общеаккадский лексикографический ресурс.
Abstract:
Akkadian is a Semitic language that was written in cuneiform script in Mesopotamia and adjacent regions from the late 3rd millennium BC until the first centuries of the common era. With ca. 10,000,000 words, the extant Akkadian corpus is the second-largest among the ancient languages of Western Eurasia. Akkadian divides into several varieties, of which the best-documented is Old Babylonian, written in the first half of the 2nd millennium BC and traditionally considered as “classical Akkadian”. Our long-term objective is a comprehensive lexicographic description of Old Babylonian in the form of a dictionary. This task has never been attempted before. As for Akkadian lexicography in general (including Old Babylonian), the two available multi-volume academic dictionaries were published starting from the 1950s and are now largely outdated. The Akkadian corpus has considerably expanded in the last decades; besides, the traditional dictionaries do not sufficiently consider the differences between the Akkadian varieties. The usefulness of an up-to-date Old Babylonian dictionary for all specialists of Ancient Near Eastern history and literature, as well as for related disciplines such as Semitology, cannot be overstated. We believe that any future dictionary of Akkadian, and Old Babylonian in particular, must be corpus-based, electronic and continuously updated. Many annotated electronic corpora of Akkadian texts are already available or under development. In due course, the electronic corpus-based dictionaries of Akkadian varieties will be integrated into an all-Akkadian lexicographic platform. Four our purpose, we have chosen the electronic database “Babylonian Archives: 20th-17th centuries B.C. (www.archibab.fr)”, which contains annotated transliterations of Old Babylonian letters and documents. It now encompasses about 40 per cent of the corpus and will include all Old Babylonian letters and documents in the mid-term (c. 2,500,000 words). The present three-year project focuses on the measures that will lay the groundwork for a corpus-based dictionary of Old Babylonian. These include: - Elaborating rules for annotating the ARCHIBAB corpus, in particular for a linguistics-based part-of-speech tagging, a phonologically correct lemmatization, a uniform glossing and optional bibliographic references. In many cases, the form, meaning or part-of-speech status of a given lexeme will require a specific lexicographic study. - (Re)annotation of the texts in the ARCHIBAB database according to the new rules. - Developing a concept of the Old Babylonian dictionary, in particular the templates of dictionary entries for different parts of speech, an annotation > dictionary interface and a roadmap for the dictionary’s integration into an all-Akkadian lexicographic platform.
Планируемые результаты:
В 2021 и 2022 году планировались следующие результаты: - Оцифровка старовавилонских текстов из печатных изданий по стандартам ARCHIBAB, не менее 500 единиц (А.И. Мищенко, Р.М. Нуруллин). - Внесение новых текстов в базу ARCHIBAB, не менее 500 единиц (Б.Е. Александров, И.С. Архипов). - Выработка правил разметки ARCHIBAB с учетом опыта других электронных корпусов: апробирование и окончательная версия (И.С. Архипов, Б.Е. Александров, Т.А. Архангельский). - Старовавилонский словник (И.С. Архипов, Р.М. Нуруллин). - (Пере)издание и исследование лексических особенностей раннеклассических старовавилонских писем из города Киша в коллекции Лувра (И.С. Архипов). - Исследование неоднословных лексических единиц и служебных слов старовавилонского диалекта в типологическом контексте и с учетом опыта других лингвистических корпусов (И.А. Архипов, Т.А. Архангельский).
Научный задел:
Члены коллектива имеют большой опыт работы как с электронными корпусами клинописных текстов, так и в области аккадской лексикографии. Б.Е. Александров и И.С. Архипов более десяти лет принимают самое активное участие в разработке и наполнении базы данных старовавилонских писем и документов Babylonian Archives: 20th-17th centuries B.C. (см. описание на сайте www.arhibab.fr/en в разделах Terms of Use и ARCHIBAB News). И.С. Архипов является также автором монографии и ряда статей, посвященных различным аспектам аккадской лексикографии (список публикаций см., например, на https://www.hse.ru/org/persons/190419144#sci). Р.М. Нуруллин имеет большой опыт лексикографической работы с аккадским языком, в частности является соавтором первого тома Etymological Dictionary of Akkadian (в печати, https://www.degruyter.com/view/product/448320). Б.Е. Александров и А.И. Мищенко принимают участие в создании лингвистически размеченного корпуса для хеттского языка (http://hittitecorpus.ru).
Основные результаты:
Оцифровано и внесено в базу данных ARCHIBAB около 650 текстов, проведена международная российско-французская конференция по материалам проекта, подготовлено к печати две научные статьи
Добавил в систему: Александров Борис Евгеньевич

Источник финансирования НИР

грант РФФИ

Этапы НИР

#	Сроки	Название
2	1 марта 2021 г.-1 марта 2022 г.	Разработка корпусного словаря старовавилонского диалекта аккадского языка
Результаты этапа:

Прикрепленные к НИР результаты

Для прикрепления результата сначала выберете тип результата (статьи, книги, ...). После чего введите несколько символов в поле поиска прикрепляемого результата, затем выберете один из предложенных и нажмите кнопку "Добавить".

	ИСТИНА	Войти в систему Регистрация
	ИПМех РАН
	Главная Поиск Статистика О проекте Помощь

ИСТИНА

ИПМех РАН

Разработка корпусного словаря старовавилонского диалекта аккадского языкаНИР

Laying the groundwork for a corpus-based dictionary of Old Babylonian

Источник финансирования НИР

Этапы НИР

Прикрепленные к НИР результаты