Vytvoření textové vrstvy ve skenech (OCR)

Vytvoření textové vrstvy ve skenech (OCR)

Aplikace PDF-XChange Editor V6/Plus umožňuje pomocí technologie OCR (Optical Character Recognition) rozpoznávat text ve skenovaných PDF souborech a rastrových obrázcích. To umožňuje uživateli v těchto dokumentech automaticky identifikovat text a převést ho na textovou vrstvu, ve které je možné vyhledávat nebo rozpoznaný text zkopírovat pro další použití. 

Postup

1. Otevřete skenované soubory v menu Soubor > Otevřít... nebo Soubor > Otevřít z...

2. Spusťte rozpoznání textu volbou z hlavního menu Dokument > OCR...

3. Poté se zobrazí dialogové okno s nastavením rozpoznání textu, které je rozděleno do několika sekcí viz níže.

4. Vlastní vytvoření textové vrstvy pomocí OCR spustíte následně stisknutím tlačítka OK.

EditorV6 OCR

Rozsah stránek

V této sekci může uživatel nastavit stránky, nad kterými bude vytvořena textová vrstva. Volby jsou následující:

  • Všechny. Nad všemi stránkami bude vytvořena textová vrstva.
  • Aktuální stránka. Textová vrstva bude vytvořena pouze nad aktuální stránkou.
  • Stránky. Zde je možné nastavit rozsah stránek pro vytvoření textové vrstvy. Můžete nastavit buď jednotlivé stránky (1, 3, 5), rozsah stránek (5-12) nebo suché/liché stránky.

Rozpoznání textu

Zde je možné nastavit jazyk, ve kterých bude text rozpoznán a přesnost rozpoznání. Od verze V6 je k dispozici vícejazyčné rozpoznávání textu, takže je možné pracovat s vícejazyčnými texty.

Výstup

Volba Typ výstupu je pro vytvoření textové vrstvy klíčová a uživatel má na výběr ze svou možností:

  • Zachovat původní obsah a přidat textovou vrstvu. Tato volba ponechá stávající skeny beze změny a dojde pouze k vytvoření textové vrstvy. Je vhodná pro skeny v dobré a velmi dobré kvalitě, kde se předpokládá, že nebude problém s rozpoznáním textu.
  • Vytvořit prohledavatelné PDF. Pokud je kvalita skenů špatná, vyberte tuto volbu. Umožní totiž provést rasterizaci původních skenů, která pomůže rozpoznat text s lepší přesností než originál. 

zarovkaPro volbu Vytvořit prohledavatelné PDF můžete také nastavit kvalitu rasterizace (72-600 DPI). Platí, že čím vyšší DPI, tím lepší přesnost rozpoznání textu, ale zároveň větší velikost výstupního souboru.

Volba Automatické narovnání slouží k tomu, aby aplikace sama natočila stránky tak, aby došlo k lepšímu rozpoznání textu. Doporučujeme tuto položku zaškrtnout.

Pro spotřebitele

Subjekt pro mimosoudní řešení spotřebitelských sporů:

Česká obchodní inspekce
Ústřední inspektorát – oddělení ADR
Štěpánská 15
120 00 Praha 2
Email: adr@coi.cz
Web: http://adr.coi.cz

On-line řešení spotřebitelských sporů:
http://ec.europa.eu/consumers/odr/

Evidence tržeb (EET)

Podle zákona o evidenci tržeb je prodávající povinen vystavit kupujícímu účtenku. Zároveň je povinen zaevidovat přijatou tržbu u správce daně online; v případě technického výpadku pak nejpozději do 48 hodin. Platby bankovním převodem elektronické evidenci tržeb nepodléhají.

Kontakt

TERAGON Group v.o.s.
V.Rabase 402/10
37010 České Budějovice 3

IČ: 26018101
DIČ: CZ26018101

Zapsáno u Krajského soudu v Č. Budějovicích - Spis. zn. A5786

Datová schránka: 5ts6vy3

+420 608 209 804

obchod@pdfxchange.cz

Virtuální provozovna: www.pdfxchange.cz

 

gplogo

Novinky

Chci být informován o nových verzích

JoomShaper