Vytvoření textové vrstvy ve skenech (OCR)

Vytvoření textové vrstvy ve skenech (OCR)

Aplikace PDF-XChange Editor V6/Plus umožňuje pomocí technologie OCR (Optical Character Recognition) rozpoznávat text ve skenovaných PDF souborech a rastrových obrázcích. To umožňuje uživateli v těchto dokumentech automaticky identifikovat text a převést ho na textovou vrstvu, ve které je možné vyhledávat nebo rozpoznaný text zkopírovat pro další použití. 

Postup

1. Před prvním použitím funkce OCR si doinstalujte český slovník pro OCR. Ten je ke stažení zde

2. Otevřete skenované soubory v menu Soubor > Otevřít... nebo Soubor > Otevřít z...

3. Spusťte rozpoznání textu volbou z hlavního menu Dokument > OCR...

4. Poté se zobrazí dialogové okno s nastavením rozpoznání textu, které je rozděleno do několika sekcí viz níže.

5. Vlastní vytvoření textové vrstvy pomocí OCR spustíte následně stisknutím tlačítka OK.

EditorV6 OCR

Rozsah stránek

V této sekci může uživatel nastavit stránky, nad kterými bude vytvořena textová vrstva. Volby jsou následující:

  • Všechny. Nad všemi stránkami bude vytvořena textová vrstva.
  • Aktuální stránka. Textová vrstva bude vytvořena pouze nad aktuální stránkou.
  • Stránky. Zde je možné nastavit rozsah stránek pro vytvoření textové vrstvy. Můžete nastavit buď jednotlivé stránky (1, 3, 5), rozsah stránek (5-12) nebo suché/liché stránky.

Rozpoznání textu

Zde je možné nastavit jazyk, ve kterých bude text rozpoznán a přesnost rozpoznání. Od verze V6 je k dispozici vícejazyčné rozpoznávání textu, takže je možné pracovat s vícejazyčnými texty.

Výstup

Volba Typ výstupu je pro vytvoření textové vrstvy klíčová a uživatel má na výběr ze svou možností:

  • Zachovat původní obsah a přidat textovou vrstvu. Tato volba ponechá stávající skeny beze změny a dojde pouze k vytvoření textové vrstvy. Je vhodná pro skeny v dobré a velmi dobré kvalitě, kde se předpokládá, že nebude problém s rozpoznáním textu.
  • Vytvořit prohledavatelné PDF. Pokud je kvalita skenů špatná, vyberte tuto volbu. Umožní totiž provést rasterizaci původních skenů, která pomůže rozpoznat text s lepší přesností než originál. 

zarovkaPro volbu Vytvořit prohledavatelné PDF můžete také nastavit kvalitu rasterizace (72-600 DPI). Platí, že čím vyšší DPI, tím lepší přesnost rozpoznání textu, ale zároveň větší velikost výstupního souboru.

Volba Automatické narovnání slouží k tomu, aby aplikace sama natočila stránky tak, aby došlo k lepšímu rozpoznání textu. Doporučujeme tuto položku zaškrtnout.

Pro spotřebitele

Subjekt pro mimosoudní řešení spotřebitelských sporů:

Česká obchodní inspekce
Ústřední inspektorát – oddělení ADR
Štěpánská 15
120 00 Praha 2
Email: adr@coi.cz
Web: http://adr.coi.cz

On-line řešení spotřebitelských sporů:
http://ec.europa.eu/consumers/odr/

Evidence tržeb (EET)

Podle zákona o evidenci tržeb je prodávající povinen vystavit kupujícímu účtenku. Zároveň je povinen zaevidovat přijatou tržbu u správce daně online; v případě technického výpadku pak nejpozději do 48 hodin. Platby bankovním převodem elektronické evidenci tržeb nepodléhají.

Kontakty

TERAGON Group v.o.s.
V.Rabase 402/10
37010 České Budějovice 3
Česká republika

IČ: 26018101
DIČ: CZ26018101

Po-So: 8:30 - 16:30h

+420 608 209 804

obchod@pdfxchange.cz

Virtuální provozovna: www.pdfxchange.cz

Novinky

Chci být informován o nových verzích

JoomShaper