Приложение, позволяющее распознать текст по фото, которое поддерживает большинство известных языков, включая русский. Оно представляет собой графический GTK интерфейс к Tesseract-OCR, в свою очередь являющейся свободным движком для распознавания текста.
Особенности:
- автоматическое обнаружение расположения страницы;
- пользователь может вручную определить и настроить области распознавания;
- импорт pdf-документов и изображений с диска, сканирующих устройств, буфера обмена и скриншотов;
- поддержка многостраничных документов PDF;
- текст, который удалось распознать из фото, отображается рядом с ней;
- базовое редактирование текста на выходе, в том числе поиск / замена и удаление разрывов строк;
- проверка орфографии для текста на выходе (если установлен соответствующий словарь).
Удобный графический интерфейс к Tesseract OCR
gImageReader представляет собой интуитивно понятный интерфейс для популярного движка tesseract OCR, разработанного компаниями Hewlett-Packard и Google. Интерфейс основан на нескольких кнопках. Пользователи сочтут этот инструмент полезным, поскольку он обеспечивает интуитивно понятный доступ к одному из самых мощных движков OCR.
Инструмент хорошо интегрируется с tesseract и позволяет распознать документы в удобном для пользователя виде. Одна из замечательных особенностей - бесшовная интеграция с основным ресурсом. Любой, кто использовал tesseract, обнаружит, что gImageReader сохраняет все основные функции программного обеспечения распознавания текстовой информации из фото. Более того, этот инструмент обеспечивает хороший баланс между функциональностью и доступностью, поэтому новым пользователям будет легко начать обработку документов.
По сути, любой, кто раньше использовал tesseract, может извлечь выгоду из этого инструмента, так как он может упростить работу пользователей, когда требуется точно распознать текст из фото. Пользователям, которые плохо знакомы с tesseract, настоятельно рекомендуется использовать этот графический интерфейс.
Программа позволяет выполнять несколько операций с исходными документами. К ним относятся поворот на 90 градусов, увеличение или уменьшение масштаба, а также изменение основных элементов управления изображением. Регулировка яркости и контрастности - отличное дополнение, как и модификатор разрешения, который можно использовать для улучшения видимости некоторых файлов.
gImageReader очень хорошо интегрируется с tesseract, а обработка документов выполняется простым нажатием на кнопку «Recognize all» наверху. Выходной текст выводится на небольшую панель рядом с исходным документом, на которой пользователи могут вносить изменения.
Характеристики
Ссылки на официальный сайт и загрузку- Язык: Русский
- ОС: Windows 10, Windows 7
- Лицензия: GNU GPL v3
- Разработчик: Sandro Mani
- Категория: Сканирование
- Видеообзор: Отсутствует
- VirusTotal: отчет
- Подтверждение лицензии: Отсутствует
- Создано: 28.03.2021
- Обновлено: 15.04.2023
mrkaban
21 июня 2021 г. 22:09
Программа очень удобная! Мне очень нравится возможность в пару кликов загрузить один из великого множество языков. Я не считал сколько их там, но явно больше сотни. И распознать текст по фото на русском языке, не трудно.
Анна Михайловна
22 июня 2017 г. 17:58
Надо же, а у нас как раз со сканером шла программа для сканирования без функции распознавания текстовых документов! И в принципе, gImageReader на windows, переведена на русский язык, и наши документы сканирует почти без ошибок! Удобно!
mrkaban
22 декабря 2014 г. 21:52
Да, вы правы! спасибо вам огромное! =))) короче нужно оба словаря скачать и скинуть, и тогда работает, правда все равно кривовато... но работает!!!!
Alex
22 декабря 2014 г. 18:12
Нужно еще орфографический словарь скачать отсюда: https://континентсвободы.рф/link/6216/ Распаковать и и поставить в папку *:\Program Files\gImageReader\share\myspell\dicts ...и все заработает!
mrKaban
4 августа 2014 г. 20:16
вижу, что там хелп предлагает, но что то я там ни чего полезного не увидел.
mrKaban
4 августа 2014 г. 20:15
Может вы Михаил догадаетесь))) хотя возможно эту же схему нужно попробовать на 32-битной ОС.
mrKaban
4 августа 2014 г. 20:14
Вообще, для поддержки русскоязычных текстов нужно дополнительно установить словарь русский. При установке программы поставил полную установку, но не помогло, русский язык не появился. Скачал русский словарь от тессеракта , от [url=/link/6179/]седы [/url] и полностью распаковал содержимое архива в C:\Program Files (x86)\gImageReader\share\tessdata, хотя насколько я понимаю там нужен только rus.traineddata файл. Есть прогресс, русский язык появился. Но на выходе крокозябры, пробовал даже дополнительно тессеракт ставить...
mrKaban
4 августа 2014 г. 20:08
Само ядро - Tesseract поддерживает русский язык начиная с версии 3.0.
mrKaban
4 августа 2014 г. 16:11
Да, надо разобраться... вроде возможность то вшитая есть, но не пашет... Потом на досуге пошарюсь в инете, мб разрабу напишу. Возможно, в следующей версии проблему исправят...
mrkaban
4 августа 2014 г. 12:16
вижу, что там хелп предлагает, но что то я там ни чего полезного не увидел.
mrkaban
4 августа 2014 г. 12:15
Может вы Михаил догадаетесь))) хотя возможно эту же схему нужно попробовать на 32-битной ОС.
mrkaban
4 августа 2014 г. 12:14
Вообще, для поддержки русскоязычных текстов нужно дополнительно установить словарь русский. При установке программы поставил полную установку, но не помогло, русский язык не появился. Скачал русский словарь от тессеракта , от https://континентсвободы.рф/link/6215/ и полностью распаковал содержимое архива в C:\Program Files (x86)\gImageReader\share\tessdata, хотя насколько я понимаю там нужен только rus.traineddata файл. Есть прогресс, русский язык появился. Но на выходе крокозябры, пробовал даже дополнительно тессеракт ставить...
mrkaban
4 августа 2014 г. 12:08
Само ядро - Tesseract поддерживает русский язык начиная с версии 3.0.
Михаил
4 августа 2014 г. 10:54
Установил ее... Таких кнопок как я написал даже нету... Тоже не смог русский текст распознать...
Михаил
4 августа 2014 г. 10:33
Может помочь следующий совет: В программе предварительно нужно выбрать распознаваемый язык. Зайдите в настройки: меню "File" --> "Configure" --> "Preferred language" --> выберите "Русский язык (ru_RU)" --> кнопка "Применить". И перезапустить программу...
mrkaban
4 августа 2014 г. 8:11
Да, надо разобраться... вроде возможность то вшитая есть, но не пашет... Потом на досуге пошарюсь в инете, мб разрабу напишу. Возможно, в следующей версии проблему исправят...
michail
4 августа 2014 г. 2:54
Установил ее... Таких кнопок как я написал даже нету... Тоже не смог русский текст распознать...
michail
4 августа 2014 г. 2:33
Может помочь следующий совет: В программе предварительно нужно выбрать распознаваемый язык. Зайдите в настройки: меню "File" --> "Configure" --> "Preferred language" --> выберите "Русский язык (ru_RU)" --> кнопка "Применить". И перезапустить программу...