Cognitive OpenOCR - Распознавание текста

Бесплатная программа для распознавания текста

26 янв

26 января 2022 г. 19:46 Русский BSD

Программный инструмент для оптического распознавания символов, то есть программа для распознавания текста. Она была первоначально разработана в Cognitive Technologies и, после нескольких лет без развития, выпущен как бесплатное программное обеспечение 12 декабря 2007 года. Ядро системы распознавания было выпущено под открытым исходным кодом лицензии BSD в начале апреля 2008 года. Программа переведена на русский язык.

Особенности

CuneiForm может сохранить форматирование текста, а также признает сложные таблицы (любой структуры).

Это Русско-английский двуязычный, Сербский, Словенский, Испанский, Шведский, Турецкий, и украинский текст.

CuneiForm может сохранить распознанный текст в формате RTF, HTML или текстовом формате. Он может также передать текст в Microsoft Word или Microsoft Excel.

Пользовательский интерфейс

Программу для распознавания можно использовать в качестве автономного приложения из командной строки, или в качестве фонового приложения с другими программами. Она поставляется с собственным графическим интерфейсом. Система распознавания текста может быть также использована в качестве двигателя OCR в OCRFeeder.

История

После того, как лидер программного обеспечения OCR в России, CuneiForm был в конкуренции с ABBYY FineReader.

В 1993 Cognitive Technologies подписала контракт OEM с Corel Corporation, которая позволила библиотеке Cognitive признания быть встроенной в популярный пакет публикации Corel Draw 3.0 (и последующие версии).

В 1996 году, OCR CuneiForm'96 был выпущен, который был первым пакетом OCR включающим адаптивный метод распознавания символов. Этот метод основан на сочетании двух видов печатных алгоритмов распознавания символов: multifont и omnifont. Это система самообучения способна распознавать плохо напечатанные символы, создавая внутренний шрифт, порожденную этими символами, которые были напечатаны достаточно хорошо, чтобы быть признанным. Таким образом, динамическая регулировка (адаптация) для конкретного ввода символов используется.

Вводные источники

Cognitive Technologies запустила программу, чтобы сделать OCR доступным для всех пользователей. Его первый шаг освобождал CuneiForm как бесплатное программное обеспечение.

Cognitive Technologies планирует начать развивать новую версию программного обеспечения как инвестор и координатор проекта. Разработчики выбрали лицензию BSD на выпуск, чтобы принять во внимание все юридические и технические нюансы, но целая программа или ее отдельные модули могут быть опубликованы позже лицензируемые под GPL.

В сентябре 2008 часть Cognitive была выпущена как общедоступное программное обеспечение. Одна из недостающих частей - анализ таблиц, однако Cognitive обещали выпустить этот компонент в будущем.

Cuneiform в настоящее время портирована на Linux, BSD и Mac OS X.

Резервная копия исходного кода: на Яндекс диске

Характеристики

Ссылки на официальный сайт и загрузку

Язык: Русский
ОС: Windows 10, Windows 7
Лицензия: BSD
Разработчик: Cognitive Technologies
Категория: Сканирование

Видеообзор: Отсутствует
VirusTotal: отчет
Подтверждение лицензии: Отсутствует
Создано: 28.03.2021
Обновлено: 26.01.2022

Похожее:

ScanToPrinter - Объединение сканера и принтера

Небольшой инструмент, который объединяет сканер и принтер, позволяющий работать в качестве копира. Полностью на русском языке.

Сканирование
Русский
GNU GPL v2
15026

Screen Translator - Перевод текста на экране

Перевод любого текста на экране. Захвата экрана, распознавания документов и средств перевода. Русский язык.

Сканирование
Русский
MIT
11674

NAPS2 - Программа для сканирования документов

Программа для сканирования документов и фотографий. Полностью на русском языке.

Сканирование
Русский
GNU GPL v2
10713

Добавить комментарий

mrKaban

26 января 2022 г. 19:47

На моей 10-ке работает без проблем
cheetah

26 января 2022 г. 13:45

на win 10 pro крашится, не стоит связываться
s-r-grass

19 февраля 2019 г. 18:57

Насколько помню, Cuneiform Master распространяется уже по другой лицензии... уже не BSD, а довольно ограниченная. Хотя в целом, с Вами согласен!
rodocop

19 февраля 2019 г. 0:05

Cuneiform был прекрасной программой в 90-е, превосходя FR по качеству распознавания, особенно кириллицы. Сейчас, конечно, программа в глубоком застое, а точнее заброшена - хорошо ее хоть открыли. Жаль, что никто не подхватит разработку (хотя бы не ядра распознавания, а фронтенда. Да, по моему опыту, сборка Cuneiform Master работает стабильнее, чем Cognitive OpenOCR. Последняя у меня так и не заработала толком, в отличие от.
MG42

31 марта 2015 г. 4:12

Если нужна бесплатная, но профессиональная программа - берите эту. Если нужно тока качество на сложной полиграфии книги - 2-3 фонта (сериф/сансериф, болд/нормал, курсив) - берите FineReader 8.0 (сканы гугла), но не последнюю, типа 12.0 (последние развалят вам весь набор на странице). Если и это не устроит, то останется тока OmniPage. Но пробуйте сами.
mrKaban

24 июля 2014 г. 9:09

Из большого опыта работы с данной программой для распознавания текстовых документов. Она такая же проблематичная, как и другие, включая finereader. С некоторыми сканерами были проблемы, если память не изменяет. Насколько я помню проект некоторое время не разрабатывается. В любом случаи, бесплатную программу для распознавания текста лучше чем эта я еще не видел.
mrkaban

24 июля 2014 г. 1:09

Из большого опыта работы с данной программой для распознавания текстовых документов. Она такая же проблематичная, как и другие, включая finereader. С некоторыми сканерами были проблемы, если память не изменяет. Насколько я помню проект некоторое время не разрабатывается. В любом случаи, бесплатную программу для распознавания текста лучше чем эта я еще не видел.

Cognitive OpenOCR - Распознавание текста

Особенности

Пользовательский интерфейс

История

Вводные источники

Характеристики

Похожее:

ScanToPrinter - Объединение сканера и принтера

Screen Translator - Перевод текста на экране

NAPS2 - Программа для сканирования документов

Комментарии:

Добавить комментарий

mrKaban

cheetah

s-r-grass

rodocop

MG42

mrKaban

mrkaban