Скачать
Загрузить систему Cognitive OpenOCR (CuneiForm) (русский интерфейс).
Загрузить систему Cognitive OpenOCR (CuneiForm) (английский интерфейс).
Скачать исходный код программы OCR Cuneiform
Скачать исходный код интерфейса OCR Cuneiform
Скачать документацию на библиотеки ядра распознавания
Описание архива Cuneiform_src.zip
Директория Kern содержит исходные коды ядра распознавания Puma, необходимые для сборки версии.
Директория Addfiles содержит дополнительные файлы, необходимые для корректного функционирования программы, а именно:
- поддиректория API_PUMA содержит контрольные примеры и описание этих примеров;
- поддиректория Bin содержит словари, необходимые для функционирования программы;
- поддиректория System содержит утилиту, необходимую для регистрации com-серверов;
- файл lns32.ini содержит необходимые параметры конфигурации;
- файлы dbghelp.dll и zlib.dll необходимы для корректного функционирования программы;
- файл reg.bat необходим для запуска регистрации com-сервера распознавания;
- файл license.txt содержит лицензию на данный продукт.
Заявки на участие в Open Source проекте можно отправлять на cuneiform@cognitive.ru.
На сайте запущен форум для координации работы над проектом Open Source.
Информация об OCR CuneiForm:
OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи.
OCR CuneiForm это:
- высокое качество распознавания;
- высокая скорость работы;
- распознавание текстов на русском, английском, смешанном русско-английском, украинском, немецком, французском, испанском, итальянском, шведском и других (всего более 20);
- работа в режиме автофрагментации для поиска текстовых блоков, таблиц и изображений, а также мощное средство ручной и полуавтоматической фрагментации;
- распознавание таблиц любой структуры и сложности, в том числе и без отображения линий табличной сетки;
- автоматическое сохранение иллюстраций (черно-белых и цветных) и таблиц в получаемом на выходе документе;
- полное сохранение топологии страницы;
- поддержка пакетного режима сканирования и распознавания;
- простота использования и интуитивный интерфейс, встроенные помощники по работе с программой;
- встроенный текстовый редактор для работы с распознанным текстом;
- совмещенный показ изображений и результатов распознавания.
В системе используется целый ряд уникальных технологий, среди которых адаптивное распознавание, нейронные сети, когнитивный анализ альтернатив распознавания и другие.