OCRopus

Google пусна тестова версия на програмния пакет OCRopus - софтуер за оптично разпознаване на символи.

Проекта OCRopus бе стартиран през пролетта на 2007. Предполага се, че в рамките на тази инициативи ще бъде създадена мощна многофункционална система, която ще може да се ползва за разпознаване на обикновени и исторически документи, ръкописен текст и така нататък. OCRopus ще може да бъде използван от различни научни организации, археолози, историци, а също и обикновени потребители.

OCRopus 0.1.0 е базирана на основа ядрото НР Tesseract. В OCRopus са реализирани функции за сегментация на текст и графика, а също и система за конфигуриране на база езика Lua. Програмата за оптическо разпознаване на символи на Google се разпространява в съответствие с лиценза Apache License 2.0.

Тестерите на OCRopus са забелязали немалко проблеми в софтуера. Системата за оптично разпознаване на символи често интерпретира символа “e” като буква “c”, а символа “o” бърка с нула. Освен това, голямо влияние върху качеството на крайния резултат оказва типа и размера на шрифта на сканирания оригинал.

Бета-версията на OCRopus е планирана за края на първото тримесечие на 2007

Още за четене :

    BIC кодБанковият идентификационен код (BIC, Bank Identifier Code) е комбинация от...

Няма коментари

Comments are closed.


« Prism
Приложенията на Google са най-популярни »