Vytvoření textové vrstvy ve skenech (OCR)
Aplikace PDF-XChange Editor 7/Plus umožňuje pomocí technologie OCR (Optical Character Recognition) rozpoznávat text ve skenovaných PDF souborech a rastrových obrázcích. To umožňuje uživateli v těchto dokumentech automaticky identifikovat text a převést ho na textovou vrstvu, ve které je možné vyhledávat nebo rozpoznaný text zkopírovat pro další použití.
Postup
Otevřete skenované soubory v kartě Soubor > Otevřít
Spusťte rozpoznání textu OCR volbou OCR na kartě Konverze
Poté se zobrazí dialogové okno s nastavením vlastností rozpoznání textu, které je rozděleno do několika sekcí viz níže.
Vlastní vytvoření textové vrstvy pomocí OCR spustíte následně stisknutím tlačítka OK.
Rozsah stránek
V této sekci může uživatel nastavit stránky, nad kterými bude vytvořena textová vrstva. Volby jsou následující:
- Všechny. Nad všemi stránkami bude vytvořena textová vrstva.
- Aktuální stránka. Textová vrstva bude vytvořena pouze nad aktuální stránkou.
- Stránky. Zde je možné nastavit rozsah stránek pro vytvoření textové vrstvy. Můžete nastavit buď jednotlivé stránky (1, 3, 5), rozsah stránek (5-12) nebo suché/liché stránky.
Rozpoznání textu
Zde je možné nastavit jazyk, ve kterých bude text rozpoznán a přesnost rozpoznání. Od verze V6 je k dispozici vícejazyčné rozpoznávání textu, takže je možné pracovat s vícejazyčnými texty.
Výstup
Volba Typ výstupu je pro vytvoření textové vrstvy klíčová a uživatel má na výběr ze svou možností:
- Zachovat původní obsah a přidat textovou vrstvu. Tato volba ponechá stávající skeny beze změny a dojde pouze k vytvoření textové vrstvy. Je vhodná pro skeny v dobré a velmi dobré kvalitě, kde se předpokládá, že nebude problém s rozpoznáním textu.
- Vytvořit prohledavatelné PDF. Pokud je kvalita skenů špatná, vyberte tuto volbu. Umožní totiž provést rasterizaci původních skenů, která pomůže rozpoznat text s lepší přesností než originál.
Pro volbu Vytvořit prohledavatelné PDF můžete také nastavit kvalitu rasterizace (72-600 DPI). Platí, že čím vyšší DPI, tím lepší přesnost rozpoznání textu, ale zároveň větší velikost výstupního souboru.
Volba Automatické narovnání slouží k tomu, aby aplikace sama natočila stránky tak, aby došlo k lepšímu rozpoznání textu. Doporučujeme tuto položku zaškrtnout.