EN
 / Главная / Все новости / В России научили нейросети расшифровывать архивные документы с дореволюционной орфографией

В России научили нейросети расшифровывать архивные документы с дореволюционной орфографией

Редакция портала «Русский мир»
25.01.2023


Специалисты «Яндекса» обучили нейросети распознавать рукописные архивные документы на русском языке с дореволюционной орфографией. В компании рассказали, что площадка, обладающая названными возможностями, уже доступна. На сервисе  открыт доступ к миллионам страниц исторических документов с расшифровкой, сообщает РИА «Новости».

Особенностью архивных текстов, созданных со старой орфографией, является их сложность для расшифровки. В сервисе «Поиск по архивам» внедрена технология, базирующаяся на обученных нейросетях. Пользователи могут познакомиться с более чем двумя с половиной миллионов страниц архивных документов с расшифровкой.

Система способна распознавать особенности почерка, а также буквы, которые исчезли из современного русского языка в результате реформы. Кроме того, алгоритм осознаёт «особую структуру архивных документов».

Нейросеть проходила обучение на фрагментах из сотен тысяч рукописных строк, написанных в XVIII-XIX веках, и десятков миллионов сгенерированных примеров. В результате она получила способность распознать текст, непонятный человеку без специальных знаний и опыта чтения рукописей. Отмечается, что на расшифровку страницы исторического документа алгоритм тратит всего несколько секунд.
Метки:
нейросети, документы

Новости по теме

Новые публикации

Какое ударение в слове «христианин», в чём смысловое отличие вечери от вечерни, прописные или строчные следует писать в словах церковной тематики?.. Попробуем дать краткие ответы на эти и другие популярные вопросы о религиозной лексике.
Майские праздники дают старт новому сезону путешествий. Свои туристические программы есть во всех регионах России, но Новгород и Псков – неувядающая классика. К поездкам туда призывают учебники истории и фильмы о становлении Руси.
Цветаева