Vytvoření textové vrstvy ve skenech (OCR)

Vytvoření textové vrstvy ve skenech (OCR)

Aplikace PDF-XChange Editor 7/Plus umožňuje pomocí technologie OCR (Optical Character Recognition) rozpoznávat text ve skenovaných PDF souborech a rastrových obrázcích. To umožňuje uživateli v těchto dokumentech automaticky identifikovat text a převést ho na textovou vrstvu, ve které je možné vyhledávat nebo rozpoznaný text zkopírovat pro další použití. 

Postup

1 Otevřete skenované soubory v kartě Soubor > Otevřít

2 Spusťte rozpoznání textu OCR volbou OCR na kartě Konverze

3 Poté se zobrazí dialogové okno s nastavením vlastností rozpoznání textu, které je rozděleno do několika sekcí viz níže.

4 Vlastní vytvoření textové vrstvy pomocí OCR spustíte následně stisknutím tlačítka OK.

EditorV6 OCR

Rozsah stránek

V této sekci může uživatel nastavit stránky, nad kterými bude vytvořena textová vrstva. Volby jsou následující:

  • Všechny. Nad všemi stránkami bude vytvořena textová vrstva.
  • Aktuální stránka. Textová vrstva bude vytvořena pouze nad aktuální stránkou.
  • Stránky. Zde je možné nastavit rozsah stránek pro vytvoření textové vrstvy. Můžete nastavit buď jednotlivé stránky (1, 3, 5), rozsah stránek (5-12) nebo suché/liché stránky.

Rozpoznání textu

Zde je možné nastavit jazyk, ve kterých bude text rozpoznán a přesnost rozpoznání. Od verze V6 je k dispozici vícejazyčné rozpoznávání textu, takže je možné pracovat s vícejazyčnými texty.

Výstup

Volba Typ výstupu je pro vytvoření textové vrstvy klíčová a uživatel má na výběr ze svou možností:

  • Zachovat původní obsah a přidat textovou vrstvu. Tato volba ponechá stávající skeny beze změny a dojde pouze k vytvoření textové vrstvy. Je vhodná pro skeny v dobré a velmi dobré kvalitě, kde se předpokládá, že nebude problém s rozpoznáním textu.
  • Vytvořit prohledavatelné PDF. Pokud je kvalita skenů špatná, vyberte tuto volbu. Umožní totiž provést rasterizaci původních skenů, která pomůže rozpoznat text s lepší přesností než originál. 

zarovkaPro volbu Vytvořit prohledavatelné PDF můžete také nastavit kvalitu rasterizace (72-600 DPI). Platí, že čím vyšší DPI, tím lepší přesnost rozpoznání textu, ale zároveň větší velikost výstupního souboru.

Volba Automatické narovnání slouží k tomu, aby aplikace sama natočila stránky tak, aby došlo k lepšímu rozpoznání textu. Doporučujeme tuto položku zaškrtnout.

Pro spotřebitele

Subjekt pro mimosoudní řešení spotřebitelských sporů:

Česká obchodní inspekce
Ústřední inspektorát – oddělení ADR
Štěpánská 15
120 00 Praha 2
Email: adr@coi.cz
Web: http://adr.coi.cz

On-line řešení spotřebitelských sporů:
http://ec.europa.eu/consumers/odr/

Kontakt

TERAGON SW s.r.o.
V.Rabase 402/10
37010 České Budějovice 3

IČ: 06767800
DIČ: CZ06767800

Zapsáno u Krajského soudu v Č. Budějovicích - Spis. zn. C 27196

Datová schránka: 4mxy2ut

+420 608 209 804

obchod@pdfxchange.cz

Virtuální provozovna: www.pdfxchange.cz

 

gplogo

Novinky

Chci být informován o nových verzích

JoomShaper