01.03.2022 12:00
Общество

Загадки почерка Петра I раскрыты с помощью IT-технологий

Загадки почерка императора, над которыми ученые бьются 150 лет, раскрыты с помощью IT-технологий
Текст:  Елена Новоселова
Родина - Федеральный выпуск: №3 (322)
Кто когда-нибудь видел скоропись Петра Первого - нервные размашистые загогулины, кириллица вперемешку с латиницей, взлеты и падения царского пера, - посочувствует архивистам, которым приходится работать с его наследием. Однако новый проект Российского исторического общества и Сбера "Digital Пётр" обещает в ближайшие годы расшифровать тысячи страниц петровских автографов с помощью специальной программы.
/ пресс-служба РИО
/ РИА Новости
/ РИА Новости
Читать на сайте RODINA-HISTORY.RU

Подробностями проекта поделился с "Родиной" председатель правления РИО Константин Могилевский.

- Константин Ильич, в этом году исполняется 350 лет Петру Первому. В каком состоянии его письменное наследие? Все ли доступно ученым?

- Самая серьезная проблема, связанная с изучением петровского наследия, - низкие темпы публикации. Судите сами: еще в 1872 году, к 200-летию Петра, было принято решение начать публиковать его рукописное наследие. Создали комиссию, которая собрала огромный материал. Издавать петровские рукописи решили в хронологическом порядке под названием "Письма и бумаги Петра Великого". Но первый том вышел только через 15 лет после юбилея. Сейчас у нас на выходе первая книга за 1714 год. Будет две. То есть впереди еще 11 лет прекрасно документированной жизни императора и публикации многих тысяч документов.

- Чем вы объясняете такую "волокиту" в работе?

- Да, я не вспомню в науке проектов, которые бы продолжались больше 130 лет и которым еще такими темпами лет 150 продолжаться. Почему так медленно? Потому что петровский почерк - это один из худших вариантов скорописи рубежа XVII-XVIII веков. Помимо того что он писал очень коряво, так еще и с сокращениями, с использованием иностранных слов и выражений. Разбирать очень трудно. Удастся ускорить темпы расшифровки без потери качества - это будет очень по-петровски. А если получится в петровский год решить эту задачу - еще и символично.

- Говорят, что искусственный интеллект позволяет за 20 минут "прочитать" 800 страниц. Это реальные цифры?

Искусственный интеллект расшифровал неразборчивый почерк императора

- Коллеги-программисты обещают такую скорость. Но начну с того, что у нас в стране наберется не более 10 человек, которые способны разобрать и интерпретировать петровские записи. И вот возникла идея попробовать применить в решении этой задачи технологии искусственного интеллекта. Пригласили специалистов из Сбера - на сегодняшний день признанного лидера в России и даже в мире в этой области. А реализовали проект ученые из Санкт-Петербургского института истории РАН и Высшей школы экономики: они разметили ранее распознанные и опубликованные петровские тексты по буквам. 9 тысяч строк таким образом было обработано и загружено в программу, которая должна была научиться разбирать петровский почерк. И получилось.

- И какова точность расшифровки? Зарубежные аналогичные программы дают 60 процентов...

- Вот и в нашем сообществе преобладало скептическое отношение к этой идее. Но Сбер объявил хакатон - конкурс на улучшение базовой программы. И команда молодых, экстра-класса программистов РЖД показала потрясающий результат - 97,5 процента точности. Скептицизма поубавилось, но не до конца: мол, что там эти технари могут распознать, гуманитариям хочется своими глазами увидеть результат. Специально созданная в Санкт-Петербургском институте истории РАН комиссия пропустила через новую программу петровские рукописи, которые машина еще "не видела", и результат оказался еще лучше - 97,8 процента.

Это, безусловно, успех. Императору бы понравилось.

- Как определили точность "перевода": текст одновременно с компьютером читали специалисты?

- Да, специалисты, конечно, читали текст, но очень долго. Машина же, утверждают коллеги-программисты, сэкономит человеку минимум 20 процентов времени. Ему не надо будет часами сидеть и ломать голову, что там у Петра за буква - С, А или Т. Впрочем, это, конечно, далеко не решение всей задачи - распознать текст. Нужно его интерпретировать, понять, что царь имел в виду, знать, каковы были обстоятельства, в которых он писал. И здесь никто не заменит историка.

- Когда можно ожидать окончания работы? За год уложитесь?

- Я думаю, что об этом говорить преждевременно. Дело в том, что петровское наследие хранится в нескольких местах. В основном это Российский государственный архив древних актов. Есть петровские автографы и в библиотеке Академии наук в Санкт-Петербурге, в Санкт-Петербургском институте истории РАН, а по мелочи - еще и в других архивохранилищах. И характер этих документов разный. Есть бумаги, которые принадлежат от первой до последней строки перу Петра I - письма, какие-то собственноручные распоряжения. Здесь речь идет о тысячах. Полного каталога нет. Второй блок документов - те, где царь делал какие-то пометки, записи на полях, поставил резолюцию или просто расписался. Таких уже десятки тысяч.

Если говорить об оцифровке в подлинном смысле этого слова, с распознаванием почерка и обработкой всего петровского наследия, то надеяться в юбилейный год выполнить эту работу до конца не приходится. Пусть юбилей даст ей импульс, а дальше при надлежащей организации она займет несколько лет.

Начнем с того, что у нас почти нет сканов петровских документов. А это ведь не то что трудовые книжки оцифровывать. Все архивы особо ценные, их в руки-то брать могут люди только со специальной подготовкой. Иногда документы перед сканированием необходимо еще и реставрировать. Здесь не нужно впадать в цифровой раж.

Оцифровать, распознать все сохранившееся петровское наследие и разместить на отдельном ресурсе вместе с уже изданным и снабженным комментариями - программа максимум. Очень красивая и модная история на стыке наук: классической истории, археографии и IT-технологий. Мне кажется, это может привлечь студентов и магистрантов, которые, к сожалению, неохотно идут специализироваться на этом периоде истории: сложновато работать с источниками, разбирать скоропись.

История Новости Реликвии