Как я дообучал Tesseract и что из этого получилось Решал я как-то задачку по поиску сущностей в отсканированн…

Как я дообучал Tesseract и что из этого получилось Решал я как-то задачку по поиску сущностей в отсканированных документах. Чтобы работать с текстом, надо его сначала получить из картинки, поэтому приходилось использовать OCR. Выбор пал на одну из самых популярных и доступных библиотек Tesseract. С ее помощью задача решается очень неплохо и процент распознавания текста достаточно высокий, особенно на хороших сканах. Но нет предела совершенству, а ... https://habr.com/ru/post/669020/?utm_source=habrahabr&amp;utm_medium=rss&amp;utm_campaign=669020

Автор: Habr все новости об IT