ABBYY FineReader Express 8.4: tekst te herkennen uit welke bron on the fly (distributie code afgerond)
Makradar Van Technologie / / December 19, 2019
Digitale inhoud en elektronische versies van documenten omringen ons aan alle kanten. Papier in ons leven is bijna geen ruimte meer. Kranten en tijdschriften zijn verhuisd naar de online-formaat van het boek lezen we op e-ink reader of tablet, zijn de gewone letters vervangen door e-mail en sms. Maar soms moeten we sleutelen aan de eerste papieren ze een elektronische kopie te krijgen. Hier komen we aan de hand van speciale programma's die OCR-technologie gebruiken om tekst OCR (Optical Character Recognition). De meest bekende daarvan is ongetwijfeld ABBYYFineReader. U kunt het gebruiken om papieren documenten om te zetten naar bewerkbare bestanden, en sla het PDF naar doorzoekbare tekst. En vandaag hebben we een geweldige kans om meer te leren over.
* * *
Voor Macs, ABBYY biedt alleen FineReader Express, het heeft toch de nodige functionaliteit. De belangrijkste kenmerken van ABBYY FineReader Express is een OCR-nauwkeurigheid en behoud van lay-out, ondersteuning voor vele talen (171 taal om de drie talen in één document), de transformatie en de creatie van PDF (PDF-conversie naar bewerkbare formaten), editor voor manueel gebruik gebieden (tekst, tafel, foto) en een eenvoudige, gebruiksvriendelijke interface programma.
eerste blik
FineReader Express werkvenster is vrij minimalistisch, er bestaan alleen de meest noodzakelijke items. Het zijpaneel bevat sketches toegevoegd pagina's en op isntrumentov paneel knoppen met drop-down lijsten om de taal en de output bestand te selecteren. Toch is er de conversie en de zoomknop. Anders is de interface komt overeen met een snelle express versie, die inzet op de automatische uitvoering van de werkzaamheden met een minimum aan configuratie en participatie van gebruikers.
Passeren de tests
Na de lancering van FineReader komt ons een compact venster met een keuze van het scenario. Hier zijn we gevraagd om de vangst te kiezen: scanner, fax, of lezen uit een bestand. Het is ook raadzaam om een document taal te geven (of talen, als er meer dan een) - het zal helpen om de nauwkeurigheid van de herkenning van het originele document te verbeteren. Nou, eigenlijk de output bestandsformaat, alles is eenvoudig - kiezen op basis van de aard van het papieren document.
Scanner bij de hand had ik niet, maar het is nog beter - met behulp van als de bron van de foto gemaakt met de hulp van de iPhone, ik de opdracht om tekst te herkennen ingewikkeld. Als voorbeeld van de tekst, nam ik een van de boeken van zijn vrouw, maar ook een voorbeeld van de tafel - enkele oude werkende film zending van de iPhone. Nou, laten we beginnen.
Elke pagina met tekst
Bij gebrek aan een scanner heb ik gewoon een boek turn foto's - foto normale kamer licht, geen statief, en andere tweaks. Hier is het origineel:
Laten we eens kijken wat het kan doen met FineReader. We geven aan dat we willen te trekken uit de foto tekst, de taal zoals Russische definiëren, en start het proces.
Om haar krediet, moet de aanvraag worden gezegd dat de volledige tekst werd gedefinieerd, met inbegrip van per ongeluk kreeg met de aangrenzende pagina buigen. Een stukje van de tafel, die ik specifiek in het frame verlaten, gedefinieerd als de verwachte foto. Maar het is niet eng, omdat we handmatig het domein kan wijzigen, geeft u het type (als het programma niet correct is ingesteld) en verwijder het veld, waarvan de erkenning is vereist. Alle handelingen kostte me minder dan een minuut, maar uiteindelijk kreeg ik hier een zeer acceptabel resultaat:
Na een korte proeflezen en bewerkingen van het document klaar is. Ik denk dat dit een goed resultaat voor een dergelijke snelle, bijna automatisch proces herkenning.
erkennen tafel
Als een experimentele tafel serveert pretentieloze factuur, die ook werd gefilmd op de iPhone. Er is al in gebruik Ukrainian (samen met cheque taalondersteuning), dat is ook goed voor onze ervaring. Het kiezen van een nieuw script (⌘N) Geef de bron - te lezen uit een bestand, de taal - Oekraïens, en file-uitgang - tafel.
Het programma denkt een paar seconden, en hier hebben we het resultaat:
Met de tafel programma niet zo goed wordt behandeld, maar het is min of meer aanvaardbaar zijn, in principe, de tekst van de definitie, tenzij de reden om de cellen die niet in het oorspronkelijke document waren af te maken. Er zal hebben om een beetje langer sleutelen aan de uiteindelijke vorm van de kaart document te krijgen, maar het is makkelijker dan het typen van een teken met de hand van de grond af.
Opslaan als PDF
Bij het opslaan naar PDF, helaas het programma niet verbetert het oorspronkelijke beeld (contrast, helderheid) en het wordt geplaatst in het PDF-document zoals het is. Maar de minder, het zoeken tekst aanwezig is, en dat is goed.
resulteren
Zoals elke tool, FineReader heeft zijn voors en tegens. De sterke punten, in aanvulling op de genoemde kenmerken van de fabrikant, is dat de OCR tafels en werkt heel goed, en om te zetten naar PDF, zoals beloofd, ondersteunt zoeken tekst. Het nadeel is het gebrek aan opties en zeer mager middelen voor het handmatig besturen van het proces. Maar dit is gedeeltelijk gerechtvaardigd is, het feit dat het een express-versie en het werkt automatisch.
Codes voor FineReader Express programma won Gregory Ushar en Nikolai Blinov. Gefeliciteerd! Controleer je privéberichten, codes verzonden.