Технологический гигант Google начал тестирование новой и пока безымянной ИИ-модели для расшифровки рукописных документов. Предположительно модель работает на платформе AI Studio. По отзывам тех, кто видел первые результаты, ИИ показывает почти человеческий уровень в расшифровке трудночитаемых исторических текстов.

Создано ИИ Шедеврум
Ученые сравнили результат ИИ по расшифровке старинных рукописных текстов с работой человека. И остались довольны.
Как сообщают СМИ, работу ИИ по расшифровке рукописных документов показали специалисту - зав кафедрой вычислительной нейробиологии факультета естественных наук Ноттингемского университета Марку Хамфрису и он высоко оценил результат, сравнив его с работой профессиональных историков.
Для чистоты эксперимента ИИ предложили расшифровать пять сложных, ранее не публиковавшихся в сети рукописей. В результате ИИ допустил всего около 1,7% ошибок, причём большинство касалось пунктуации и заглавных букв, а не самих слов.
Если исключить мелкие неточности, то процент ошибки можно снизить до 0,56% - то есть по 1 ошибке на 200 символов. По оценке экспертов, такие ошибки делают и люди, занимающиеся расшифровкой архивных документов, добавляя в тексты расшифровки пометки [неразборчиво] или делая присущие любому живому исследователю ошибки. ИИ же успешно справился с документами XVIII-XIX веков, разобрав записи, сделанные человеком с сложным и неаккуратным почерком, а также документы с устаревшими формами написания и нестандартной грамматикой.
Экспертов удивило и то, что ИИ не только расшифровал, но и проанализировал содержание текста и даже "сделал выводы". К примеру, в одном из документов - дневнике английского торговца XVIII века - была запись о покупке сахара. Её сопровождало только число "145" без единиц измерения. ИИ расшифровал это число как "14 фунтов 5 унций". Исследователи выяснили, что модель рассчитала вес товара исходя из общей стоимости покупки и тогдашней системы мер, весов и валют.
Ранее в 2025 году Google представил система InkSight - ИИ, способный преобразовывать фотографии рукописного текста в цифровой формат с сохранением индивидуальных особенностей почерка. InkSight выделяется высокой точностью и умением учитывать каллиграфические нюансы, что значительно облегчает процесс дигитализации исторических архивов.
В России Сбер разработал собственное решение в области ИИ для работы с рукописными текстами из национальных архивов. Отдельно выделяется проект по расшифровке документов из архива Петра I - одной из самых ценных коллекций исторических бумаг, расшифровка которых помогает получить новые сведения о российской истории.
Яндекс также разрабатывает ИИ-систему для поиска и расшифровки архивных материалов, специализируясь на метрических книгах и других церковных рукописных документах. Эта технология помогает эффективно обрабатывать сложные рукописи, что облегчает доступ к генеалогическим и историческим источникам.
Развитие ИИ в работе по расшифровке архивных документов, по мнению историков, хорошее подспорье для исследователей, которое позволит ускорить обработку и анализ не введенных в научный оборот текстов. Однако для научной публикации все-же потребуется участие человека, способного дотошно сравнить оригинал и выданный машиной результат. А значит, в истории, в которой, как и в любой науке, важна точность, без участия человека, имеющего специальные навыки, не обойтись.
Подпишитесь на нас в Dzen
Новости о прошлом и репортажи о настоящем
