Программный инструмент для оптического распознавания символов, то есть программа для распознавания текста. Она была первоначально разработана в Cognitive Technologies и, после нескольких лет без развития, выпущен как бесплатное программное обеспечение 12 декабря 2007 года. Ядро системы распознавания было выпущено под открытым исходным кодом лицензии BSD в начале апреля 2008 года. Программа переведена на русский язык.
Особенности
CuneiForm может сохранить форматирование текста, а также признает сложные таблицы (любой структуры).
Это Русско-английский двуязычный, Сербский, Словенский, Испанский, Шведский, Турецкий, и украинский текст.
CuneiForm может сохранить распознанный текст в формате RTF, HTML или текстовом формате. Он может также передать текст в Microsoft Word или Microsoft Excel.
Пользовательский интерфейс
Программу для распознавания можно использовать в качестве автономного приложения из командной строки, или в качестве фонового приложения с другими программами. Она поставляется с собственным графическим интерфейсом. Система распознавания текста может быть также использована в качестве двигателя OCR в OCRFeeder.
История
После того, как лидер программного обеспечения OCR в России, CuneiForm был в конкуренции с ABBYY FineReader.
В 1993 Cognitive Technologies подписала контракт OEM с Corel Corporation, которая позволила библиотеке Cognitive признания быть встроенной в популярный пакет публикации Corel Draw 3.0 (и последующие версии).
В 1996 году, OCR CuneiForm'96 был выпущен, который был первым пакетом OCR включающим адаптивный метод распознавания символов. Этот метод основан на сочетании двух видов печатных алгоритмов распознавания символов: multifont и omnifont. Это система самообучения способна распознавать плохо напечатанные символы, создавая внутренний шрифт, порожденную этими символами, которые были напечатаны достаточно хорошо, чтобы быть признанным. Таким образом, динамическая регулировка (адаптация) для конкретного ввода символов используется.
Вводные источники
Cognitive Technologies запустила программу, чтобы сделать OCR доступным для всех пользователей. Его первый шаг освобождал CuneiForm как бесплатное программное обеспечение.
Cognitive Technologies планирует начать развивать новую версию программного обеспечения как инвестор и координатор проекта. Разработчики выбрали лицензию BSD на выпуск, чтобы принять во внимание все юридические и технические нюансы, но целая программа или ее отдельные модули могут быть опубликованы позже лицензируемые под GPL.
В сентябре 2008 часть Cognitive была выпущена как общедоступное программное обеспечение. Одна из недостающих частей - анализ таблиц, однако Cognitive обещали выпустить этот компонент в будущем.
Cuneiform в настоящее время портирована на Linux, BSD и Mac OS X.
Резервная копия исходного кода: на Яндекс диске
Характеристики
Ссылки на официальный сайт и загрузку- Язык: Русский
- ОС: Windows 10, Windows 7
- Лицензия: BSD
- Разработчик: Cognitive Technologies
- Категория: Сканирование
- Видеообзор: Отсутствует
- VirusTotal: отчет
- Подтверждение лицензии: Отсутствует
- Создано: 28.03.2021
- Обновлено: 26.01.2022
mrKaban
26 января 2022 г. 19:47
На моей 10-ке работает без проблем
cheetah
26 января 2022 г. 13:45
на win 10 pro крашится, не стоит связываться
s-r-grass
19 февраля 2019 г. 18:57
Насколько помню, Cuneiform Master распространяется уже по другой лицензии... уже не BSD, а довольно ограниченная. Хотя в целом, с Вами согласен!
rodocop
19 февраля 2019 г. 0:05
Cuneiform был прекрасной программой в 90-е, превосходя FR по качеству распознавания, особенно кириллицы. Сейчас, конечно, программа в глубоком застое, а точнее заброшена - хорошо ее хоть открыли. Жаль, что никто не подхватит разработку (хотя бы не ядра распознавания, а фронтенда. Да, по моему опыту, сборка Cuneiform Master работает стабильнее, чем Cognitive OpenOCR. Последняя у меня так и не заработала толком, в отличие от.
MG42
31 марта 2015 г. 4:12
Если нужна бесплатная, но профессиональная программа - берите эту. Если нужно тока качество на сложной полиграфии книги - 2-3 фонта (сериф/сансериф, болд/нормал, курсив) - берите FineReader 8.0 (сканы гугла), но не последнюю, типа 12.0 (последние развалят вам весь набор на странице). Если и это не устроит, то останется тока OmniPage. Но пробуйте сами.
mrKaban
24 июля 2014 г. 9:09
Из большого опыта работы с данной программой для распознавания текстовых документов. Она такая же проблематичная, как и другие, включая finereader. С некоторыми сканерами были проблемы, если память не изменяет. Насколько я помню проект некоторое время не разрабатывается. В любом случаи, бесплатную программу для распознавания текста лучше чем эта я еще не видел.
mrkaban
24 июля 2014 г. 1:09
Из большого опыта работы с данной программой для распознавания текстовых документов. Она такая же проблематичная, как и другие, включая finereader. С некоторыми сканерами были проблемы, если память не изменяет. Насколько я помню проект некоторое время не разрабатывается. В любом случаи, бесплатную программу для распознавания текста лучше чем эта я еще не видел.