Z PDF do Wordu i jinak: ABBYY FineReader vyšel ve verzi 14 a opět více usnadňuje digitalizaci dokumentů

Na digitalizaci dokumentů se hodí tzv. OCR nástroje, které převedou obrázek na editovatelný text. Nejznámějším nástrojem v tomto oboru je ABBYY FineReader, který nedávno vyšel ve verzi 14. Má vylepšenou OCR technologii, novou funkci pro porovnávání dokumentů a je rychlejší.

Program jsem při této příležitosti krátce vyzkoušel. Rozpoznávání textů je na velmi dobré úrovni a kromě samotných znaků pracuje i na základě slovníků. Čeština je k dispozici, ostatně v češtině je dostupné i prostředí programu. Výsledky převodu grafického textu na editovatelný jsou tak perfektní.

Klepněte pro větší obrázekKlepněte pro větší obrázek
ABBYY FineReader 14 a čistý naskenovaný text do formátu PDF. Žádný problém s převodem do editovatelného DOCX.

Jednoduché OCR dnes nabízí i různé webové služby zdarma. Jenže při digitalizaci dokumentů nejde jen o samotné texty, ale také o jejich strukturu, formátování, styly a v neposlední řadě také o doplňky v podobě tabulek, grafů či obrázků. V ideálním případě bude vše převedeno do editovatelného dokumentu s grafickými objekty, nicméně texty a tabulky zůstanou editovatelné.

ABBYY FineReader 14 nabízí obstojné výsledky. Dokumenty jako jsou smlouvy, technické zprávy, zápisy z jednání, tabulky s ceníky apod. převede s minimem chyb. S více strukturovanými dokumenty, jako je například stránka z časopisu, už je to horší. S různorodou typografií a grafickými prvky si občas neporadí korektně. Stěžejní text článku je ale převeden dobře.

Klepněte pro větší obrázekKlepněte pro větší obrázek
Strukturovaná tisková zpráva také dopadla výborně, formátování zůstalo zachováno

Pro rychlé převádění je určený přímý převod (lze i hromadně), ve kterém se ale občas může objevit nějaká chyba. Při požadavku na zcela přesný převod je vhodné převáděný dokument otevřít v tzv. OCR editoru. Tam program vyznačí všechny místa, kde si „není jistý“. Postupně jimi můžete proskákat a dohlédnout na každé sporné písmenko.

Klepněte pro větší obrázekKlepněte pro větší obrázek
Stránka z časopisu už se bez chyby neobešla. Samotný text článku je v pořádku, ale nadpisu s atypickým písmem kus chybělo. To už je pak nutné doladit ručně v editoru

Podobně funguje i nová funkce pro porovnávání dokumentů. Ta se hodí například při porovnávání různých verzí smluv apod. Zdroje mohou být různorodé - fotka, scan, originál... Porovnává se samotný text. Program vyhledá rozdíly nebo sporné prvky, a tyto označí.

Vstupními formáty pro převod textů do editovatelné podoby jsou všechny verze PDF dokumentů a nejrozšířenější formáty obrázků (IFF, JPEG, JBIG2, PNG, BMP, PCX, GIF, DjVu, XPS). Dokumenty se následně ukládají do DOC(X), XLS(X), PPTX, HTML, RTF, TXT, CSV, ODT, EPUB či FB2. Převod je možný i obráceně, tedy z editovatelného textu na obrázek či do PDF.

Dokument na vstupu nemusí být precizní scan či nějak upravená fotografie, stačí obyčejná fotka z mobilu, klidně trochu šikmo. Stačí, když je fotografie ostrá a písmena od podkladu rozpoznatelná. Program si hranice papíru najde a dokument srovná. Samozřejmě platí, čím kvalitnější zdroj, tím menší riziko chyby při převodu.

Klepněte pro větší obrázekKlepněte pro větší obrázek
Porovnávání - vlevo fotka z mobilu, napravo originál. Změnilo se něco?

ABBYY FineReader je šikovný nástroj. Dřív byl celkem rozšířen i v domácnostech, ale tam už si zpravidla vystačíme s jednoduššími OCR funkcemi dodávaným ke skenerům či multifunkčním tiskárnám, případně jednorázové online řešení. A tak FineReader cílí už primárně do firem. Tomu odpovídá i nabídka licencí:

Klepněte pro větší obrázek

Témata článku: Software, Epub

4 komentáře

Nejnovější komentáře

  • jakub novotný 15. 3. 2017 14:58:12
    Kdyby to někoho zajímalo, tak česká služba AppOnFly nabízí ABBYY bez...
  • alIien.cz 20. 2. 2017 20:32:31
    V tom posledním obrázku s cenovým přehledem chybí první sloupec - verze...
  • Vojtěch Šimon 20. 2. 2017 15:37:58
    Reklama se tu už neoznačuje či co?
Určitě si přečtěte

11 tipů, jak efektivně a přesně sledovat počasí pomocí internetu

11 tipů, jak efektivně a přesně sledovat počasí pomocí internetu

** Sledujte počasí z více zdrojů a podrobněji, přesněji tak určíte, jaké počasí vás potká na dovolené ** Na webu najdete hromadu pokročilých předpovědí počasí, ale i specializované meteorologické služby ** Vybrali jsme 14 služeb na počasí, které se vám můžou hodit

23.  6.  2017 | Jakub Čížek | 19

Herní počítač vs. Xbox One X: Kvalita obrazu není všechno

Herní počítač vs. Xbox One X: Kvalita obrazu není všechno

** Nový Xbox One X slibuje hraní ve 4K s HDR za 13 tisíc korun ** Aby stejnou kvalitu obrazu zvládl počítač, museli byste za něj dát minimálně dvakrát tolik ** Přesto herní počítače stále svůj smysl mají

24.  6.  2017 | Tomáš Holčík | 58

Nejlepší program pro střih videa na doma: 9 video editorů, ze kterých si vyberete

Nejlepší program pro střih videa na doma: 9 video editorů, ze kterých si vyberete

** Pokročilé střihové programy pro neprofesionální využití stojí do 3 000 Kč, jsou ale i zdarma ** Podpora 4K, hromada editačních funkcí a efektové filtry jsou samozřejmostí ** Vybrali jsme 9 nejzajímavějších programů pro nejrozšířenější operační systém Windows

25.  6.  2017 | Stanislav Janů | 32


Aktuální číslo časopisu Computer

Bojujeme proti Fake News

Dva velké testy: fotoaparáty a NASy

Co musíte vědět o změně evropského roamingu

Radíme s výběrem základní desky