Как я дообучал Tesseract и что из этого получилось Решал я как-то задачку по поиску сущностей в отсканированн…
Как я дообучал Tesseract и что из этого получилось Решал я как-то задачку по поиску сущностей в отсканированных документах. Чтобы работать с текстом, надо его сначала получить из картинки, поэтому приходилось использовать OCR. Выбор пал на одну из самых популярных и доступных библиотек Tesseract. С ее помощью задача решается очень неплохо и процент распознавания текста достаточно высокий, особенно на хороших сканах. Но нет предела совершенству, а ... https://habr.com/ru/post/669020/?utm_source=habrahabr&utm_medium=rss&utm_campaign=669020
Автор: Habr все новости об IT