Научная деятельность лаборатории

«Пуника» Силия Италика: перевод, исторические реалии, рецепция

«Пуника» Силия Италика – крупнейший по объёму римский эпос, написанный в эпоху династии Флавиев. Открытая гуманистами в XV веке поэма пользовалась неоднозначной репутацией в литературных и научных кругах. Только в 1960-е годы появилось первое фундаментальное монографическое исследование, посвященное «Пунике». В то же время поэма представляет интереснейший источник по интеллектуальной истории римской империи. Силий Италик в античной традиции предстаёт одним из самых учёных людей эпохи. В результате «Пуника», помимо собственно исторической основы – картины Второй пунической войны – содержит большое количество географических, этнографических и исторических реалий, а также аллюзий на более ранние произведения. При этом поэма до сих пор полностью не переведена на русский язык и минимально включена в российский научный оборот. Проект поддержан Российским научным фондом.

Научный семинар лаборатории

Совместно с кафедрой машинного обучения и цифровой гуманитаристики ФПМИ МФТИ проводятся нерегулярные заседания, посвящённые широкому кругу вопросов, связанных с применением методов машинного обучения в фундаментальных гуманитарных дисциплинах. Желающие выступить на семинаре могут обращаться на почту И. С. Селиванова, научного сотрудника лаборатории МАСКИ: selivanov.is@mipt.ru.

Записки научного семинара

Семенов И.А. Сравнительный анализ статических и динамических векторных представлений для семантического поиска в корпусе классических латинских текстов.
Целью данного исследования является оценка эффективности различных методов векторизации текста для задачи семантического поиска.

Яковенко И.О. Оценка семантического сходства на основе LLM при обнаружении интертекстуальности в классической латыни.
Целью данного исследования является систематическое сравнение способности шести современных латинских и мультиязычных эмбеддинг-моделей выявлять интертекстуальные соответствия, используя в качестве «золотого стандарта» аннотированный корпус интертекстов из «Аргонавтики» Валерия Флакка.

Толченицына Е.Д. Сравнение качества методов определения авторства на латинских текстах -3-9 вв.
Данная работа преследует своей целью рассмотреть те методы определения авторства текстов, которые обладают надёжной интерпретируемостью.

Морозов К.В. Исследование применимости детерминированных и недетерминированных методов трансформации слабоструктурированных историко-биографических данных в машинно-читаемый вид.
Исследование проведено для решения практической задачи преобразования части базы служилого сословия времен Российской империи в машиночитаемый вид.

Смагина Е.М. OCR дореформенной орфографии.
Целью данного исследования является анализ эффективности различных методов распознавания — оптимизированного ABBYY FineReader или LLM-OCR —при работе с текстами дореформенной орфографии на примере решений Уголовного кассационного департамента Правительствующего Сената.

Лыкова Е.А. Семантический анализ и визуализация сенатских решений.
Исследование посвящено вопросу о том, насколько эффективно современные модели эмбеддингов выявляют устойчивые семантические кластеры в текстах сенатских решений.

Абдуллоева М.Ш. Оценка сложности правовых актов по ограниченной выборке: анализ максимальной длины синтаксических зависимостей в предложениях.
В данном проекте исследуется синтаксическая сложность судебных решений Правительствующего Сената.