Vytvoření textové vrstvy ve skenech (OCR)

Vytvoření textové vrstvy ve skenech (Enhanced OCR)

Aplikace PDF-XChange Editor 8/Plus s novým Enhanced OCR plug-inem umožňuje pomocí technologie OCR převést skeny na prohledavatelné soubory PDF. To umožňuje uživateli v těchto dokumentech prohledávat text.

icons8 idea 30 Pamatujte na to, že výsledek rozpoznání textu pomocí OCR závisí na kvalitě předlohy. Pro spolehlivý převod skenů do prohledavatelného PDF je nutné zakoupit licenci s Enhanced OCR plug-inem.


Postup

odrazka 1 Otevřete skenované soubory v kartě Soubor > Otevřít.

odrazka2 Spusťte rozpoznání textu OCR volbou kartě Konverze > OCR.

odrazka3 Poté se zobrazí dialogové okno s nastavením vlastností rozpoznání textu, které je rozděleno do několika sekcí viz níže.

odrazka4  Převod skenů do editovatelného formátu PDF spustíte následně stisknutím tlačítka OK.

icons8 idea 30 Typ výstupu nastavte na Prohledavatelný obrázek. Volbu Vytvořit nový dokument ponechte vyškrtnutou. Nad původní předlohou se vytvoří neviditelná textová vrstva pro prohledávání.

V8 prevodskenudoeditovatelnehoformatu

odrazka5  Zde je možné vidět zdrojový sken před vytvořením textové vrstvy. Vlevo v panelu Obsah je zřetelně vidět, že stránka 1 neobsahuje žádnou textovou vrstvu.

V8 prevodskenudoeditovatelnehoformatu1

 

odrazka6  Po převodu do prohledavatelného souboru PDF může výsledek vypadat například takto (viz obrázek níže). Je patrné, že byl vytvořen soubor PDF, který již obsahuje prohledavatelnou textovou vrstvu.

V8 prevodskenudoeditovatelnehoformatu2

 


Nastavení Enhanced OCR plug-inu 

Rozsah stránek

V této sekci může uživatel nastavit stránky, nad kterými bude vytvořena textová vrstva. Volby jsou následující:

  • Všechny. Nad všemi stránkami bude vytvořena textová vrstva.
  • Aktuální stránka. Textová vrstva bude vytvořena pouze nad aktuální stránkou.
  • Stránky. Zde je možné nastavit rozsah stránek pro vytvoření textové vrstvy. Můžete nastavit buď jednotlivé stránky (1, 3, 5), rozsah stránek (5-12) nebo suché/liché stránky.

Možnosti rozpoznání textu

Zde je možné nastavit jazyk, ve kterých bude text rozpoznán a přesnost rozpoznání. Od verze 7 je k dispozici vícejazyčné rozpoznávání textu, takže je možné pracovat s vícejazyčnými texty.

  • Jazyky. Nastavení jazyka pro rozpoznání OCR. Můžete zaškrtnout i více jazyků v případě vícejazyčné předlohy.
  • Přesnost. Nastavení přesnosti rozpoznání OCR. Doporučujeme použít volbu Vysoká.

Výstup

Volba Typ výstupu umožňuje nastavit cílový obsah a uživatel má na výběr z těchto možností.

  • Prohledavatelný obrázek. Umožňuje nad původním skenem vytvořit neviditelnou textovou vrstvu pro prohledávání.
  • Editovatelný text a obrázky. Převede skeny a obrázky do editovatelného formátu a zachová původní předlohu.
  • Obsah stránky. Převede skeny a obrázky do editovatelného formátu a odstraní původní předlohu. 

K dispozici jsou ještě doplňkové volby:

  • Opravit zkosení a chybné natočení stránek. Doporučujeme tuto volbu zaškrtnout v případě, že není předloha naskenována rovně.
  • Vytvořit nový dokument. Skeny převedené na text a obrázky budou uloženy do nového dokumentu. V opačném případě budou všechny operace probíhat v původním dokumentu.

Pro spotřebitele

Subjekt pro mimosoudní řešení spotřebitelských sporů:

Česká obchodní inspekce
Ústřední inspektorát – oddělení ADR
Štěpánská 15
120 00 Praha 2
Email: adr@coi.cz
Web: http://adr.coi.cz

On-line řešení spotřebitelských sporů:
http://ec.europa.eu/consumers/odr/

Kontakty

TERAGON SW s.r.o.
V.Rabase 402/10
37010 České Budějovice 3

IČ: 06767800
DIČ: CZ06767800

Zapsáno u Krajského soudu v Č. Budějovicích - Spis. zn. C 27196

Datová schránka: 4mxy2ut

+420 608 209 804

obchod@pdfxchange.cz

Virtuální provozovna: www.pdfxchange.cz

 

visaverlogo  mastercardsecure

Události & média

JoomShaper