Компания Cognitive Technologies сообщила о том, что международным сообществом независимых разработчиков создана очередная версия системы распознавания текста Cuneiform для платформы Linux. В новом релизе проведена большая работа по исправлению ошибок и чистке исходных текстов, благодаря чему, по словам разработчиков, достигнута стабилизация кодовой базы проекта.

 

В настоящее время код Cuneiform для Linux распространяется под упрощенной лицензией BSD и основан на коде, открытом компанией Cognitive Technologies в 2007 г.
По информации Cognitive Technologies, OCR CuneiForm может распознавать любые полиграфические, машинописные гарнитуры всех начертаний и шрифты, получаемые с принтеров, за исключением декоративных и рукописных. В систему встроены специальные алгоритмы для распознавания текста с матричного принтера, плохих ксерокопий факсов и машинописи. Поддерживается более чем 20 языков. Кроме того, OCR CuneiForm оснащена поддержкой распознавания текста на русском и украинском языках. Результат распознавания может быть сохранен в форматах HTML, hOCR, RTF или PDF с сохранением особенностей начертания оригинала (выделение жирным, курсивом и т.д.).