Z PDF do Wordu i jinak: ABBYY FineReader vyšel ve verzi 14 a opět více usnadňuje digitalizaci dokumentů

Na digitalizaci dokumentů se hodí tzv. OCR nástroje, které převedou obrázek na editovatelný text. Nejznámějším nástrojem v tomto oboru je ABBYY FineReader, který nedávno vyšel ve verzi 14. Má vylepšenou OCR technologii, novou funkci pro porovnávání dokumentů a je rychlejší.

Program jsem při této příležitosti krátce vyzkoušel. Rozpoznávání textů je na velmi dobré úrovni a kromě samotných znaků pracuje i na základě slovníků. Čeština je k dispozici, ostatně v češtině je dostupné i prostředí programu. Výsledky převodu grafického textu na editovatelný jsou tak perfektní.

Klepněte pro větší obrázekKlepněte pro větší obrázek
ABBYY FineReader 14 a čistý naskenovaný text do formátu PDF. Žádný problém s převodem do editovatelného DOCX.

Jednoduché OCR dnes nabízí i různé webové služby zdarma. Jenže při digitalizaci dokumentů nejde jen o samotné texty, ale také o jejich strukturu, formátování, styly a v neposlední řadě také o doplňky v podobě tabulek, grafů či obrázků. V ideálním případě bude vše převedeno do editovatelného dokumentu s grafickými objekty, nicméně texty a tabulky zůstanou editovatelné.

ABBYY FineReader 14 nabízí obstojné výsledky. Dokumenty jako jsou smlouvy, technické zprávy, zápisy z jednání, tabulky s ceníky apod. převede s minimem chyb. S více strukturovanými dokumenty, jako je například stránka z časopisu, už je to horší. S různorodou typografií a grafickými prvky si občas neporadí korektně. Stěžejní text článku je ale převeden dobře.

Klepněte pro větší obrázekKlepněte pro větší obrázek
Strukturovaná tisková zpráva také dopadla výborně, formátování zůstalo zachováno

Pro rychlé převádění je určený přímý převod (lze i hromadně), ve kterém se ale občas může objevit nějaká chyba. Při požadavku na zcela přesný převod je vhodné převáděný dokument otevřít v tzv. OCR editoru. Tam program vyznačí všechny místa, kde si „není jistý“. Postupně jimi můžete proskákat a dohlédnout na každé sporné písmenko.

Klepněte pro větší obrázekKlepněte pro větší obrázek
Stránka z časopisu už se bez chyby neobešla. Samotný text článku je v pořádku, ale nadpisu s atypickým písmem kus chybělo. To už je pak nutné doladit ručně v editoru

Podobně funguje i nová funkce pro porovnávání dokumentů. Ta se hodí například při porovnávání různých verzí smluv apod. Zdroje mohou být různorodé - fotka, scan, originál... Porovnává se samotný text. Program vyhledá rozdíly nebo sporné prvky, a tyto označí.

Vstupními formáty pro převod textů do editovatelné podoby jsou všechny verze PDF dokumentů a nejrozšířenější formáty obrázků (IFF, JPEG, JBIG2, PNG, BMP, PCX, GIF, DjVu, XPS). Dokumenty se následně ukládají do DOC(X), XLS(X), PPTX, HTML, RTF, TXT, CSV, ODT, EPUB či FB2. Převod je možný i obráceně, tedy z editovatelného textu na obrázek či do PDF.

Dokument na vstupu nemusí být precizní scan či nějak upravená fotografie, stačí obyčejná fotka z mobilu, klidně trochu šikmo. Stačí, když je fotografie ostrá a písmena od podkladu rozpoznatelná. Program si hranice papíru najde a dokument srovná. Samozřejmě platí, čím kvalitnější zdroj, tím menší riziko chyby při převodu.

Klepněte pro větší obrázekKlepněte pro větší obrázek
Porovnávání - vlevo fotka z mobilu, napravo originál. Změnilo se něco?

ABBYY FineReader je šikovný nástroj. Dřív byl celkem rozšířen i v domácnostech, ale tam už si zpravidla vystačíme s jednoduššími OCR funkcemi dodávaným ke skenerům či multifunkčním tiskárnám, případně jednorázové online řešení. A tak FineReader cílí už primárně do firem. Tomu odpovídá i nabídka licencí:

Klepněte pro větší obrázek
Diskuze (4) Další článek: Apple koupil startup RealFace zaměřený na rozpoznávání obličeje

Témata článku: Software, PDF, Digital, Více, Epub, Ostré písmo, PPTX, Dokument, Verze, Editovatelný text, Nadpis, Převádění, Přímý převod, Nejznámější nástroj, TXT, Upravená fotografie, Nejrozšířenější formát, CSV, PPT, Dok, Fin, Nová funkce, Multifunkční tiskárna


Určitě si přečtěte

Sonda Dawn prolétá jen 35 km od trpasličí planety Ceres a posílá úchvatné fotografie!

Sonda Dawn prolétá jen 35 km od trpasličí planety Ceres a posílá úchvatné fotografie!

** Sonda Dawn zkoumá trpasličí planetu Ceres od března 2015 ** Sonda nyní přešla na novou dráhu, nejblíže se dostává k povrchu na vzdálenost jen 35 km ** Ceres je největší planetkou hlavního pásu mezi Marsem a Jupiterem

Petr Kubala | 4

Mobil letí z výšky na zem a nic se mu nestane! Podívejte se, jak ho ochrání unikátní aktivní pouzdro

Mobil letí z výšky na zem a nic se mu nestane! Podívejte se, jak ho ochrání unikátní aktivní pouzdro

** Toto pouzdro zaručeně ochrání mobil při pádu ** Německý inženýr na něm pracoval 4 roky ** V letu vytáhne pružnou ochrannou konstrukci

Karel Kilián | 26


Aktuální číslo časopisu Computer

Jak mobily určují svoji polohu?

Velký test notebooků pro studenty

Nejlepší reproduktory na párty

Služby a aplikace pro výuku angličtiny