Com traduir una imatge a un text mitjançant ABBYY FineReader?

Aquest article s’afegirà a l’anterior (i detallarà l’essència del reconeixement de text directe.

Comencem per l’essència, que molts usuaris no entenen completament.

Després d’explorar un llibre, un diari, una revista, etc., obtindreu un conjunt d’imatges (és a dir, fitxers gràfics, no text) que s’hauran de reconèixer en un programa especial (un dels millors és ABBYY FineReader). Reconeixement: aquest és el procés d’obtenció de text a partir de gràfics, i és aquest procés el qual anem a escriure amb més detall.

En el meu exemple, faré una captura de pantalla d’aquest lloc i tractaré d’obtenir el text.

1) Obrir un fitxer

Obriu les imatges que tenim previst reconèixer.

Per cert, cal assenyalar que podeu obrir no només formats d’imatge, sinó també, per exemple, fitxers DJVU i PDF. Això us permetrà reconèixer ràpidament tot el llibre que, a través de la xarxa, normalment es distribueix en aquests formats.

2) Edició

Acceptar immediatament el reconeixement automàtic no té gaire sentit. Si, per descomptat, teniu un llibre on només hi ha text, imatges i tauletes, a més d’escanejar amb una excel·lent qualitat, llavors podeu. En altres casos, és millor configurar totes les àrees manualment.

En general, primer heu d’eliminar les àrees innecessàries de la pàgina. Per fer-ho, feu clic al botó d’edició del panell.

A continuació, haureu de deixar només la zona amb la qual voleu treballar més temps. Per això, hi ha una eina per tallar fronteres innecessàries. Seleccioneu el mode a la columna de la dreta. tallar.

A continuació, seleccioneu l'àrea que voleu deixar. A la imatge següent, es ressalta en vermell.

Per cert, si teniu diverses imatges obertes, podeu aplicar la retallada a totes les imatges alhora. Convenient de no tallar cadascuna per separat. Tingueu en compte que a la part inferior d’aquest panell hi ha una altra gran eina:goma d'esborrar. Amb l’ajuda d’ella, podeu esborrar els divorcis innecessaris, els números de pàgina, les taques, els caràcters especials innecessaris i les seccions individuals de la imatge.

Després de fer clic per tallar les vores, la imatge original hauria de canviar: només es conservarà l’espai de treball.

A continuació, podeu sortir de l’editor d’imatges.

3) Selecció d’àrees

Al panell, a sobre de la imatge oberta, hi ha petits rectangles que defineixen l'àrea d’exploració. Hi ha diversos, considerem breument els més habituals.

Imatge: el programa no reconeix aquesta àrea, simplement copiarà el rectangle especificat i el pegarà al document reconegut.

El text és l'àrea principal en la qual es centrarà el programa i intentarà obtenir text de la imatge. Destacarem aquesta àrea en el nostre exemple.

Després de la selecció, la zona està pintada amb un color verd clar. A continuació, podeu passar al següent pas.

4) reconeixement de text

Després de definir totes les àrees, feu clic a l'ordre del menú per reconèixer-lo. Afortunadament, en aquest pas, no cal res més.

El temps de reconeixement depèn del nombre de pàgines del document i de la potència de l’ordinador.

De mitjana, una pàgina completa escanejada de bona qualitat dura 10-20 segons. amb el poder mitjà de PC (segons els estàndards actuals).

 

5) Comprovació d’errors

Sigui quina sigui la qualitat original de les imatges, normalment sempre hi ha errors després del reconeixement. De totes maneres, fins ara cap programa no pot eliminar completament el treball d'una persona.

Feu clic a l’opció de compra i ABBYY FineReader us començarà a enviar, al seu torn, els llocs del document on ensopega. La vostra tasca, comparant la imatge original (per cert, us mostrarà aquest lloc en una versió ampliada) amb la variant de reconeixement - per respondre afirmativament, o per corregir i aprovar. Llavors el programa anirà al següent lloc difícil i així successivament fins que es comprova tot el document.

En general, aquest procés pot ser llarg i avorrit ...

6) Preservació

ABBYY FineReader ofereix diverses opcions per desar el treball. El més utilitzat és una "còpia exacta". És a dir tot el document, el text que hi apareix, serà formatat de la mateixa manera que a la font. Una opció convenient és transferir-la a Word. Així ho vam fer en aquest exemple.

Després, veureu el text reconegut en un document de Word conegut. Crec que no té sentit que descriga més què fer amb ell ...

Per tant, hem analitzat amb un exemple concret com traduir una imatge en text sense format. Aquest procés no sempre és senzill i ràpid.

En qualsevol cas, tot dependrà de la qualitat de la imatge original, de la vostra experiència i de la velocitat del vostre ordinador.

Bon treball!