Optical Character Recognition (OCR) è un processo di conversione di materiale stampato in file di testo o di elaborazione testi che possono essere facilmente modificati e memorizzati. La tecnologia ha permesso di tali materiali deve essere conservato con spazio di memorizzazione molto meno rispetto ai materiali copia cartacea. Tecnologia OCR ha fatto un enorme impatto sul modo le informazioni sono memorizzate, condiviso e modificato. Prima di riconoscimento ottico dei caratteri, se qualcuno voleva trasformare un libro in un file di word processing, ogni pagina dovrebbe essere digitato parola per parola.
tecnologia OCR richiede sia hardware che software. Inoltre, sofisticati sistemi di OCR richiedono una scheda supplementare circuito nel computer stesso per completare il processo. Uno scanner ottico esegue la scansione del testo su una pagina, poi rompe i caratteri in una serie di punti chiamato bitmap. Il software in grado di leggere i caratteri più comuni e distinguere in cui le linee di inizio e fine. Questo bitmap viene quindi tradotto in un testo del computer. Mentre Optical Character Recognition ha fatto passi da gigante negli ultimi anni, continua a non funzionare bene nel riconoscimento della grafia o caratteri che somigliano a grafia. Ci sono sistemi all'interno del settore bancario che la tecnologia OCR utilizzare per provare a leggere gli importi a portata di mano scritta controlli, di andare avanti con la capacità del computer di leggere il routing e numeri di conto.Per dare un l'idea della potenza di OCR, diamo un'occhiata a un esempio del mondo reale. Immaginate un dipartimento di polizia, che ha tutti i suoi precedenti penali conservati negli archivi vasto. Anche se la scansione di milioni di pagine sarebbe un'impresa costosa e richiede molto tempo, i benefici sono enormi. Una volta che il sistema OCR ha trasformato le pagine in computer-testo leggibile, un detective, per esempio, potrebbe cercare attraverso tutta la storia in pochi secondi. Manualmente la ricerca di un record particolare, potrebbe non essere troppo difficile, ma immaginate un detective cercando di ricerca per tutti i reati commessi su un certo incrocio tra le 8 e le 8:30. Questo esempio rivela solo la superficie del potere di testo per la ricerca, ed è solo una ragione per cui molte aziende e istituzioni stanno spendendo milioni di dollari per OCR loro dati legacy.
