Свободно распространяемые программы для Windows

Rss рассылка

Хотите подписаться на обновления?

Введите email адрес:

rss-лента

Форма входа

Бесплатная программа для распознавания текста

Система пакетного распознавания текстовых документов

Программный инструмент для оптического распознавания символов, то есть программа для распознавания текста. Она была первоначально разработана в Cognitive Technologies и, после нескольких лет без развития, выпущен как бесплатное программное обеспечение 12 декабря 2007 года. Ядро системы распознавания было выпущено под открытым исходным кодом лицензии BSD в начале апреля 2008 года. Программа переведена на русский язык.

Особенности

CuneiForm может сохранить форматирование текста, а также признает сложные таблицы (любой структуры).

Это Русско-английский двуязычный, Сербский, Словенский, Испанский, Шведский, Турецкий, и украинский текст.

CuneiForm может сохранить распознанный текст в формате RTF, HTML или текстовом формате. Он может также передать текст в Microsoft Word или Microsoft Excel.

Пользовательский интерфейс


Программу для распознавания можно использовать в качестве автономного приложения из командной строки, или в качестве фонового приложения с другими программами. Она поставляется с собственным графическим интерфейсом. Система распознавания текста может быть также использована в качестве двигателя OCR в OCRFeeder.

История


После того, как лидер программного обеспечения OCR в России, CuneiForm был в конкуренции с ABBYY FineReader.

В 1993 Cognitive Technologies подписала контракт OEM с Corel Corporation, которая позволила библиотеке Cognitive признания быть встроенной в популярный пакет публикации Corel Draw 3.0 (и последующие версии).

В 1996 году, OCR CuneiForm'96 был выпущен, который был первым пакетом OCR включающим адаптивный метод распознавания символов. Этот метод основан на сочетании двух видов печатных алгоритмов распознавания символов: multifont и omnifont. Это система самообучения способна распознавать плохо напечатанные символы, создавая внутренний шрифт, порожденную этими символами, которые были напечатаны достаточно хорошо, чтобы быть признанным. Таким образом, динамическая регулировка (адаптация) для конкретного ввода символов используется.

Вводные источники


Cognitive Technologies запустила программу, чтобы сделать OCR доступным для всех пользователей. Его первый шаг освобождал CuneiForm как бесплатное программное обеспечение.

Cognitive Technologies планирует начать развивать новую версию программного обеспечения как инвестор и координатор проекта. Разработчики выбрали лицензию BSD на выпуск, чтобы принять во внимание все юридические и технические нюансы, но целая программа или ее отдельные модули могут быть опубликованы позже лицензируемые под GPL.

В сентябре 2008 часть Cognitive была выпущена как общедоступное программное обеспечение. Одна из недостающих частей - анализ таблиц, однако Cognitive обещали выпустить этот компонент в будущем.

Cuneiform в настоящее время портирована на Linux, BSD и Mac OS X.

Язык: Русский
Лицензия:
11 версия - BSD-подобная, начиная с 12 версии freeware

Протестировано на ОС: Windows 7 x64, Windows 10 x64

 

Резервная копия программы на Google Drive, версия 11


Резервная копия исходного кода: на Яндекс диске

Добавить комментарий


Комментарии  

# MG42 31.03.2015 04:12
Если нужна бесплатная, но профессиональна я программа - берите эту. Если нужно тока качество на сложной полиграфии книги - 2-3 фонта (сериф/сансериф , болд/нормал, курсив) - берите FineReader 8.0 (сканы гугла), но не последнюю, типа 12.0 (последние развалят вам весь набор на странице). Если и это не устроит, то останется тока OmniPage. Но пробуйте сами.
Ответить | Ответить с цитатой | Цитировать
# mrkaban 24.07.2014 01:09
Из большого опыта работы с данной программой для распознавания текстовых документов. Она такая же проблематичная, как и другие, включая finereader. С некоторыми сканерами были проблемы, если память не изменяет.
Насколько я помню проект некоторое время не разрабатывается .
В любом случаи, бесплатную программу для распознавания текста лучше чем эта я еще не видел.
Ответить | Ответить с цитатой | Цитировать
# rodocop 19.02.2019 00:05
Cuneiform был прекрасной программой в 90-е, превосходя FR по качеству распознавания, особенно кириллицы.

Сейчас, конечно, программа в глубоком застое, а точнее заброшена - хорошо ее хоть открыли.

Жаль, что никто не подхватит разработку (хотя бы не ядра распознавания, а фронтенда.

Да, по моему опыту, сборка Cuneiform Master работает стабильнее, чем Cognitive OpenOCR. Последняя у меня так и не заработала толком, в отличие от.
Ответить | Ответить с цитатой | Цитировать
# s-r-grass 19.02.2019 18:57
Насколько помню, Cuneiform Master распространяетс я уже по другой лицензии... уже не BSD, а довольно ограниченная.

Хотя в целом, с Вами согласен!
Ответить | Ответить с цитатой | Цитировать