От хартия към структурирани данни
Трансформирането на хартиените документи в структурирани данни преминава през заснемане, дигитализиране и архивиране. За заснемането могат да се използват скенери или мултифункционални устройства. Следва етап на софтуерна обработка, като целта е да се увеличи точността на разпознаване на текста. Или накратко казано да превърнем суровото изображение в текст, който може да бъде прочетен и използван както от информационни системи, така и от самите нас. Добрата обработка на документи се постига чрез различни софтуерни инструменти. Те подобряват качеството на изображението чрез предварителна обработка (корекция на изкривяването, премахване на шум) и добавят „слой за четене“ (слой за търсене в текст). Висококачествената обработка на документи гарантира добри резултати при последващо дигитализиране и автоматизиране на архиви. Тези стъпки подготвят документа за успешното прилагане на OCR технология (оптично разпознаване на символи). Именно тя вдъхва живот на изображенията, превръщайки ги в текст с възможност за търсене и индексиране.
English
