17.11.2025 20:00
"Родина"

Google тестирует ИИ для распознавания старинных рукописей и сложного почерка

Текст:  Эльмира Аширова
Технологический гигант Google начал тестирование новой и пока безымянной ИИ-модели для расшифровки рукописных документов. Предположительно модель работает на платформе AI Studio. По отзывам тех, кто видел первые результаты, ИИ показывает почти человеческий уровень в расшифровке трудночитаемых исторических текстов.
Ученые сравнили результат ИИ по расшифровке старинных рукописных текстов с работой человека. И остались довольны. / Создано ИИ Шедеврум
Читать на сайте RODINA-HISTORY.RU

Как сообщают СМИ, работу ИИ по расшифровке рукописных документов показали специалисту - зав кафедрой вычислительной нейробиологии факультета естественных наук Ноттингемского университета Марку Хамфрису и он высоко оценил результат, сравнив его с работой профессиональных историков.

Для чистоты эксперимента ИИ предложили расшифровать пять сложных, ранее не публиковавшихся в сети рукописей. В результате ИИ допустил всего около 1,7% ошибок, причём большинство касалось пунктуации и заглавных букв, а не самих слов.

Если исключить мелкие неточности, то процент ошибки можно снизить до 0,56% - то есть по 1 ошибке на 200 символов. По оценке экспертов, такие ошибки делают и люди, занимающиеся расшифровкой архивных документов, добавляя в тексты расшифровки пометки [неразборчиво] или делая присущие любому живому исследователю ошибки. ИИ же успешно справился с документами XVIII-XIX веков, разобрав записи, сделанные человеком с сложным и неаккуратным почерком, а также документы с устаревшими формами написания и нестандартной грамматикой.

Экспертов удивило и то, что ИИ не только расшифровал, но и проанализировал содержание текста и даже "сделал выводы". К примеру, в одном из документов - дневнике английского торговца XVIII века - была запись о покупке сахара. Её сопровождало только число "145" без единиц измерения. ИИ расшифровал это число как "14 фунтов 5 унций". Исследователи выяснили, что модель рассчитала вес товара исходя из общей стоимости покупки и тогдашней системы мер, весов и валют.

Ранее в 2025 году Google представил система InkSight - ИИ, способный преобразовывать фотографии рукописного текста в цифровой формат с сохранением индивидуальных особенностей почерка. InkSight выделяется высокой точностью и умением учитывать каллиграфические нюансы, что значительно облегчает процесс дигитализации исторических архивов.

Загадки почерка Петра I раскрыты с помощью IT-технологий

В России Сбер разработал собственное решение в области ИИ для работы с рукописными текстами из национальных архивов. Отдельно выделяется проект по расшифровке документов из архива Петра I - одной из самых ценных коллекций исторических бумаг, расшифровка которых помогает получить новые сведения о российской истории.

Яндекс также разрабатывает ИИ-систему для поиска и расшифровки архивных материалов, специализируясь на метрических книгах и других церковных рукописных документах. Эта технология помогает эффективно обрабатывать сложные рукописи, что облегчает доступ к генеалогическим и историческим источникам.

"Яндекс Поиск по архивам" пополнился справочниками по учебным заведениям царской России

Развитие ИИ в работе по расшифровке архивных документов, по мнению историков, хорошее подспорье для исследователей, которое позволит ускорить обработку и анализ не введенных в научный оборот текстов. Однако для научной публикации все-же потребуется участие человека, способного дотошно сравнить оригинал и выданный машиной результат. А значит, в истории, в которой, как и в любой науке, важна точность, без участия человека, имеющего специальные навыки, не обойтись.

23 января - день почерка
Новости