PDF dokumenty mohou být někdy vytvořené skenováním a takové dokumenty obvykle neobsahují textovou vrstvu, která by umožnila text prohledávat nebo dokonce upravovat. K tomu slouží technologie OCR resp. nový modul Enhanced OCR od ABBYY®, který umožňuje text ve skenech nebo obrázcích identifikovat a převést do prohledavatelné nebo editovatelné textové vrstvy. Po úspěšném provedení funkce OCR pak lze s textem pracovat podobným způsobem jako v běžném textovém editoru - samozřejmě s ohledem na vlastnosti formátu PDF.



V aplikacích PDF-XChange Editor 9 Plus a PDF-XChange PRO 9 je k nyní dispozici nová generace modulu Enhanced OCR, který je založený na knihovnách od ABBYY® OCR SDK (FineReader®). Díky těmto knihovnám je rozpoznání a vytěžování textu na špičkové úrovni a to zejména u textů s diakritikou. A nejen to, nyní lze také nastavit, aby modul OCR nerozpoznával text v grafice jako jsou například razítka, kde rozpoznání textu obvykle nedává smysl. Modul Enhanced OCR podporuje 196 jazyků.

Obsah kapitoly