transferul de tehnologie de la documente de hârtie - studopediya
Spre deosebire de documentele pe hârtie, electronice pot fi prelucrate mai eficient (copiate, distribuite, stocate, etc.). Există în prezent în curs de dezvoltare în mod activ tehnologia de traducere a documentelor pe hârtie în format electronic, în vederea punerii în aplicare a managementului documentelor electronice. Să ne insista asupra tehnologiilor utilizate și terminologia utilizată.
În prima etapă a traducerii documentului în format electronic, a făcut-o scanează și creează o copie electronică a documentului ca imagine. Imaginile rezultate în urma scanării, numit, de asemenea, imaginea documentului. Scanarea este etapa inițială a oricărui sistem de captare a documentelor automatizate.
Procesul de scanare poate fi realizată prin software de procesare a imaginii și controlul calității vizuală este realizată (Fig. 3.6).
Fig. 3.6. Schema converti documentele pe hârtie în format electronic
Când este vorba de documente de intrare industriale, scanere oferă de obicei un număr de caracteristici suplimentare, cum ar fi posibilitatea ca documentele multi-format.
De obicei, procesul de scanare - o etapă de obținere a unui document electronic intermediar. Evident, cu o imagine electronică a unui document mult mai ușor de a lucra cu decât hârtia (puteți copia, trimite printr-o rețea, etc.).
Cu toate acestea, în cele mai multe cazuri, este, în sine, o imagine (imagine a documentului) oferă puține beneficii. Pentru a putea edita un document, căutați-l, sau de a folosi fragmente în pregătirea unor noi documente, etc. Avem nevoie de a traduce imaginea rezultată într-un document text, programe de birou intuitiv. Prin urmare, următoarea sarcină este în semn de recunoaștere a documentelor scanate.
Acest lucru necesită un instrument special, care poate converti o imagine într-un document electronic editabil text. Astfel de instrumente există, denumirea comună - recunoașterea optică a caracterelor (recunoașterea optică a caracterelor, OCR). C folosind computerul OCR-program poate „citi“ textul de pe o pagină scanată, separându-l de ilustrații și alte elemente de design, găsi o masă și „rezolve“ conținutul lor. Și apoi asambleze peste tot din nou, recreând aspectul paginii.
În ceea ce privește traducerea documentelor în format electronic (documente de intrare într-un calculator), lor convențional împărțită în formale, formalizate și specifică (fig. 3.7).
Fig. 3.7. Clasificarea documentelor în ceea ce privește specificul transferului în format electronic
documente formale - un document în care forma de pre-determinate: amplasarea câmpurilor obligatorii în care sunt scrise date. De exemplu, formulare, facturi, formulare, cataloage, etc. Document formalizate - un document de formă arbitrară: contracte, scrisori, etc. Pentru a include astfel de documente specializate, precum hărți și amprentele digitale.
Traducere fiecare dintre aceste tipuri de documente are propriile sale specifice. În cazul în care sunt introduse fotografii, este suficient imagine electronică, dacă documentul conține text, acesta trebuie să fie recunoscut în cazul în care acesta este formatat text cu imagini, trebuie să recunoască nu numai textul, dar, de asemenea, pentru a restabili formatul documentului, iar dacă acel profil, atunci cel mai probabil, documentul în sine nu am nevoie, este important numai la informațiile conținute de acestea. De exemplu, în prelucrarea foi de vot nu este necesar în mod normal, a unei imagini de documente, informații suficiente pentru cine să voteze.