OCRopus
Google пусна тестова версия на програмния пакет OCRopus - софтуер за оптично разпознаване на символи.
Проекта OCRopus бе стартиран през пролетта на 2007. Предполага се, че в рамките на тази инициативи ще бъде създадена мощна многофункционална система, която ще може да се ползва за разпознаване на обикновени и исторически документи, ръкописен текст и така нататък. OCRopus ще може да бъде използван от различни научни организации, археолози, историци, а също и обикновени потребители.
OCRopus 0.1.0 е базирана на основа ядрото НР Tesseract. В OCRopus са реализирани функции за сегментация на текст и графика, а също и система за конфигуриране на база езика Lua. Програмата за оптическо разпознаване на символи на Google се разпространява в съответствие с лиценза Apache License 2.0.
Тестерите на OCRopus са забелязали немалко проблеми в софтуера. Системата за оптично разпознаване на символи често интерпретира символа “e” като буква “c”, а символа “o” бърка с нула. Освен това, голямо влияние върху качеството на крайния резултат оказва типа и размера на шрифта на сканирания оригинал.
Бета-версията на OCRopus е планирана за края на първото тримесечие на 2007
Още за четене :
- BIC кодБанковият идентификационен код (BIC, Bank Identifier Code) е комбинация от...
Няма коментари
Comments are closed.