Serveis de reconeixement de text en línia

Salutacions a tots els lectors del bloc!

Crec que els que solen treballar a l’ordinador (no toquen, sinó que funcionen), han hagut de fer front al reconeixement de text. Bé, per exemple, heu escanejat un extracte del llibre i ara heu d’enganxar aquesta part al vostre document. Però el document escanejat és una imatge i necessitem text: per això necessitem programes especials i serveis en línia per reconèixer el text de les imatges.

Quant als programes de reconeixement, ja he escrit en publicacions anteriors:

- Escanejar text i reconeixement en FineReader (programa de pagament);

- Treballar en FineReader analògica - CuneiForm (programa gratuït).

Al mateix article, m'agradaria centrar-me en els serveis en línia per al reconeixement de text. Després de tot, si necessiteu obtenir ràpidament el text amb 1-2 imatges, no té sentit molestar-vos a instal·lar diversos programes ...

És important! La qualitat del reconeixement (el nombre d'errors, llegibilitat, etc.) depèn molt de la qualitat de la imatge original. Per tant, en escanejar (fotografiar, etc.), seleccioneu la qualitat el més alta possible. En la majoria dels casos, la qualitat de 300-400 dpi serà suficient (dpi és el paràmetre que caracteritza la qualitat de la imatge. En la configuració de gairebé tots els escàners, normalment s'indica aquest paràmetre).

Serveis en línia

Per mostrar el treball dels serveis, vaig fer una captura de pantalla d’un dels meus articles. Aquesta captura de pantalla es penjarà a tots els serveis, la descripció de la qual es presenta a continuació.

1) //www.ocrconvert.com/

M'agrada molt aquest servei per la seva senzillesa. El lloc, encara que en anglès, funciona bé amb la llengua russa. No necessiteu registrar-vos. Per iniciar el reconeixement, heu de fer 3 passos:

- Carregueu la vostra imatge;

- Escolliu el llenguatge del text que hi ha a la imatge;

- premeu el botó d'inici de reconeixement.

Suport al format: PDF, GIF, BMP, JPEG.

El resultat es mostra a la imatge següent. He de dir que el text està ben reconegut. A més, molt ràpidament, vaig esperar literalment 5-10 segons.

2) //www.i2ocr.com/

Aquest servei funciona de manera similar a l'anterior. Aquí també heu de descarregar el fitxer, seleccionar el llenguatge de reconeixement i fer clic al botó de text extret. El servei funciona molt ràpid: de 5 a 6 segons. una pàgina.

Formats compatibles: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.

El resultat d’aquest servei en línia és molt més convenient: immediatament veieu dues finestres: en el primer, el resultat del reconeixement, en el segon, la imatge original. Per tant, és prou fàcil fer edicions en el curs de l'edició. Registreu-vos al servei, per cert, tampoc és necessari.

3) //www.newocr.com/

Aquest servei és únic de diverses maneres. En primer lloc, suporta el format "nou" DJVU (a propòsit, la llista completa de formats: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). En segon lloc, suporta la selecció d’àrees de text a la imatge. Això és molt útil quan teniu a la imatge no només àrees de text, sinó també gràfiques que no necessiteu reconèixer.

La qualitat del reconeixement és superior a la mitjana, no cal registrar-se.

4) //www.free-ocr.com/

Un servei molt senzill per al reconeixement: carregar una imatge, especificar l'idioma, introduir captcha (per cert, l'únic servei en aquest article on necessiteu fer-ho) i premeu el botó per traduir la imatge en text. En realitat, tot!

Formats compatibles: PDF, JPG, GIF, TIFF, BMP.

El resultat del reconeixement és mitjà. Hi ha errors, però no molts. Tanmateix, si la qualitat de la captura de pantalla original seria més gran, hi hauria un ordre de magnitud menys errors.

PS

Això és tot per avui. Si coneixeu més serveis interessants per al reconeixement de text, compartiu els comentaris, estaré agraït. Una condició: és convenient que no hi hagi necessitat de registrar-se i el servei sigui gratuït.

Salutacions cordials!