Google DeepMind может переводить стародавние тексты благодаря новой модели Aeneas

artificial robot human ai

 

В античном Риме письменность была повсюду — от имперских монументов до повседневных предметов. Но до наших дней дошли лишь обрывки: многие тексты повреждены временем или преднамеренно уничтожены. Чтобы помочь историкам в их реконструкции, команда Google DeepMind разработала Aeneas — открытую модель ИИ, способную восстанавливать латинские надписи, определять их возраст и вероятное место происхождения.

 

Aeneas работает не тільки с текстом, но и с контекстом — что критически важно в эпиграфике. Историки обычно ищут параллели вручную: сравнивают формулировки, грамматические конструкции и типовые фразы, чтобы приблизительно датировать и интерпретировать находку. Aeneas делает это автоматически, обрабатывая десятки тысяч латинских текстов за секунды.

 

Разработка велась в сотрудничестве с Ноттингемским университетом, при участии исследователей из Оксфорда, Ворика и Афин. Модель обучена на специально созданном датасете LED (Latin Epigraphic Dataset), в который вошли более 176 000 надписей, собранных и упорядоченных историками за десятилетия. Надписи очищены, унифицированы и снабжены метаданными: местом находки, предполагаемой датой и контекстом.

 

Технически Aeneas использует архитектуру трансформеров. Один модуль анализирует текст, другие — восстанавливают утраченные символы и вычисляют временные и географические параметры. В качестве дополнительного ввода могут использоваться изображения, указывающие на физическое происхождение артефакта.

 

Кроме реконструкции, модель предлагает список наиболее похожих надписей — своего рода «контекстуальное родство». Система создаёт “векторный профиль” текста, где учитываются тема, стиль, период, происхождение и сходство с другими источниками.

 

Инструмент уже доступен онлайн для историков, преподавателей, студентов и музейных специалистов на сайте predictingthepast.com.

 

По словам разработчиков, Aeneas показывает передовые результаты и может стать новым стандартом в цифровой эпиграфике, а в перспективе — адаптироваться к другим древним языкам и носителям, от папирусов до монет.


Не пропустите интересное!

Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *





Статьи & тестыArticles

Обзор смартфона Oppo A6 Pro: амбициозный Oppo A6 Pro (CPH2799)

Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.


Игровой руль Logitech G29: спорткар на столе Logitech G29 Driving Force Racing Wheel

Расскажем про игровой руль Logitech G29 для ПК и PlayStation, а также дополнение в виде 6-ступенчатого переключателя передач Driving Force Shifter.


НовостиNews
| 14.09
Nothing Phone (3a) Community Edition — лимитированная версия смартфона  
Nothing Phone (3a) Community Edition

Nothing представила специальную версию своего доступного смартфона Phone (3a) – модель Phone (3a) Community Edition. Это лимитированная серия, созданная в сотрудничестве с фанатами бренда

| 13.00
Чем отличается профессиональная акустика от обычных колонок – LaNota  
yuamaha

Пользователи, которые обустраивают домашнюю студию, комнату для записи подкастов или небольшое пространство для репетиций, быстро сталкиваются с вопросом: почему обычные домашние колонки не дают того звучания, которое обещает профессиональная техника?