Gentili utenti vi informiamo che il team di MyTech si è spostato sul canale Hitech & Scienza di Panorama.it

      non hai uno username? regìstrati   /   recupera la password

apple / google / microsoft
unmapped

Dallo scanner al word processor con Abby FineReader Pro 7

Scritto da Daniele Marino

Nella sua settima versione l’Ocr di Abbyy offre una qualità del riconoscimento ulteriormente migliorata e offre il il pieno supporto a Word 2003 e al formato Pdf.
La precedente versione di FineReader, il software di riconoscimento ottico dei caratteri prodotto dalla società russa Abby, offriva già prestazioni talmente buone da farci dubitare della presenza di miglioramenti significativi in questa nuova release. Al contrario, FineReader Pro 7 ci ha riservato parecchie e piacevoli sorprese.

FineReader, ricordiamo per chi non lo conoscesse, è con tutta probabilità il miglior Ocr personale sul mercato. Come tutti i software di questa categoria, è in grado di aprire delle semplici immagini (eventualmente catturandole direttamente da uno scanner) e di “leggere” il testo al loro interno, trasformando di fatto dei file grafici o dei testi in forma cartacea in documenti elettronici di qualunque formato: ad esempio pagine Html, file Pdf, documenti di Microsoft Word o - novità di quest’ultima versione - presentazioni di PowerPoint.
Anche se FineReader Pro 7 permette di lavorare in più modalità, la finestra principale dell’applicazione è ancora quella tradizionale, divisa in quattro parti: pagine del batch, pagina attuale, testo riconosciuto e zoom sulla pagina.
Le caratteristiche che hanno fatto apprezzare nel tempo FineReader sono l’alta precisione nel riconoscimento dei caratteri, fattore naturalmente fondamentale, ma soprattutto la capacità di generare documenti dall’aspetto molto simile a quello degli originali - due fattori chiave per stabilire la qualità di un programma di Ocr. Tra le novità di Pro 7 segnaliamo innanzitutto un rinnovato motore di scansione: la casa produttrice indica un aumento del 25% della precisione nel riconoscimento del testo (ma stiamo parlando di un programma che in condizioni normali offre già percentuali di precisione oltre il 95%). Nell’uso di tutti i giorni, il progresso è evidente soprattutto quando si lavora su documenti che presentano alcuni dei più tradizionali elementi di disturbo per un Ocr: testo colorato su sfondo colorato, tabelle dalla struttura complessa o con celle senza bordi e via dicendo. Il motore di FineReader Pro 7 dispone in effetti di una nuova “intelligenza artificiale”, che permette al programma anche di ricreare in modo ancor più fedele (considerando anche la dimensione dei font o la presenza di elenchi puntati e numerati) le pagine originali.
La nuova release di FineReader offre come principale novità il pieno supporto a Word 2003 e al suo nuovo formato di file basato su Xml. L’integrazione con il programma si vede anche nella possibilità di aprire all’interno di Word i documenti in fase di correzione: la finestra di zoom di FineReader viene affiancata all’applicazione Microsoft, per consentire l’analisi di eventuali errori.
Altre migliorie del programma sono da ricercare nella gestione dei Pdf e nell’integrazione con Microsoft Office. Per quanto riguarda i file Pdf, che FineReader legge e scrive ormai da tempo, è in qualche modo stato reso più intelligente il processo di riconoscimento del testo: adesso il programma sfrutta eventuali layer di testo presenti nel file, e li utilizza come punto di partenza per verificare l’esattezza dei caratteri riconosciuti. Inoltre è ora possibile creare documenti Pdf ottimizzati per il Web, in cui cioè la prima pagina può essere visualizzata senza attendere il caricamento dell’intero file (risparmiando ai navigatori i lunghi tempi di download a cui il plug-in di Adobe Reader costringe in genere gli utenti). Per quanto riguarda Microsoft Office, la miglioria più visibile è l’integrazione e il supporto a Word 2003, a partire dalla gestione del suo nuovo formato di file. FineReader Pro 7 può infatti esportare in Xml i documenti riconosciuti, utilizzando lo schema predefinito di Word 2003: le informazioni riconosciute dal motore Ocr possono così essere date immediatamente in pasto a qualunque programma in grado di gestire il formato Xml, meglio ancora se già impostato per la gestione del dialetto utilizzato all’interno di Office 2003. Sempre a proposito del salvataggio dei file, in FineReader Pro 7 sono state ottimizzate le funzioni di esportazione nel formato .doc classico e in Html: in entrambi i casi si riescono a ottenere file dalle dimensioni leggermente più contenute rispetto al passato e dalla struttura interna - ad esempio in presenza di tabelle ed elementi grafici nella pagina - più razionale e personalizzabile.
FineReader riesce a ricreare pagine dal layout molto simile a quello originale. In figura sono aperti un file Pdf, che abbiamo analizzato con il motore Ocr, e il documento Word generato dal programma. I risultati sono molto buoni, dal punto di vista sia del riconoscimento delle parole sia dell’aspetto generale della pagina.
Le funzioni dedicate all’integrazione vera e propria con Word 2003 prevedono la possibilità di utilizzare l’applicazione Microsoft come editor in cui verificare i testi riconosciuti da FineReader: quest’ultimo viene richiamato in forma di piccola finestra (in cui si vede uno zoom sulla pagina, nel punto su cui si lavora) all’interno di Word stesso. Se in passato il lavoro con un Ocr prevedeva l’apertura di un documento nella finestra di FineReader e il passaggio a Word una volta che questo era stato elaborato, ora direttamente dal word processor Microsoft è possibile utilizzare il motore Ocr su interi documenti o su loro parti: all’interno di Word viene inserito alla posizione del cursore, come normale testo, il risultato delle operazioni di riconoscimento, senza aprire nuovi documenti. In questo modo è più rapido ad esempio consolidare più documenti all’interno di un unico file elettronico. Naturalmente è sempre possibile anche lavorare in modo tradizionale, gestendo separatamente le diverse fasi del riconoscimento dei testi (acquisizione, divisione della pagina in blocchi, lettura del testo e salvataggio) o affidandosi alle procedure automatiche Scan&Read e Open&Read, che si occupano di convertire in modo automatico in testi rispettivamente immagini acquisite da scanner o file grafici salvati sul Pc. L’interfaccia di FineReader Pro 7 è in buona sostanza analoga a quella delle sue precedenti incarnazioni, anche se alcune finestre di opzioni sono state ridisegnate per risultare più intuitive.

Infine, ciliegia sulla torta, FineReader Pro 7 dispone ora di alcune funzionalità che fino alla release 6 erano esclusivo appannaggio della versione Corporate del programma: ad esempio, ora è possibile analizzare i codici a barre acquisiti tramite scanner, compiere ricerche full-text con supporto alla morfologia (con cui cioè si possono trovare forme flesse dei verbi o forme singolari e plurali degli stessi sostantivi) in tutte le 34 lingue supportate dall’applicazione e dividere le singole pagine acquisite in più immagini da elaborare separatamente - caratteristica utile ad esempio per il riconoscimento di più biglietti da visita acquisiti in un’unica scansione. Il programma supporta anche la tecnologia Hyper-Threading, per sfruttare al massimo le potenzialità dei processori Intel delle ultime generazioni, ma non offre ancora la possibilità di lavorare in modalità multithread per elaborare in contemporanea più pagine di un unico batch. Per finire una nota sul prezzo, decisamente competitivo.


FineReader Pro 7
Euro 107,50 Iva inclusa

Produttore: Abbyy, Russia.

Distributore: Novadys, via Cantù 27, 20092 Cinisello Balsamo (Mi); tel. 02-618714; fax 02-61871422.


PRO
• Alta precisione nel riconoscimento e nella creazione dei documenti.
• Pieno supporto a Word 2003 e al formato Pdf.
• Nuove caratteristiche, in precedenza presenti solo nella versione Corporate.


CONTRO
• Non lavora in modalità multithread.

Commenti   (Inserisci un commento)

Ancora nessun commento.

Effettua il login