Software

Z PDF do Wordu i jinak: ABBYY FineReader vyšel ve verzi 14 a opět více usnadňuje digitalizaci dokumentů

Na digitalizaci dokumentů se hodí tzv. OCR nástroje, které převedou obrázek na editovatelný text. Nejznámějším nástrojem v tomto oboru je ABBYY FineReader, který nedávno vyšel ve verzi 14. Má vylepšenou OCR technologii, novou funkci pro porovnávání dokumentů a je rychlejší.

Program jsem při této příležitosti krátce vyzkoušel. Rozpoznávání textů je na velmi dobré úrovni a kromě samotných znaků pracuje i na základě slovníků. Čeština je k dispozici, ostatně v češtině je dostupné i prostředí programu. Výsledky převodu grafického textu na editovatelný jsou tak perfektní.

Klepněte pro větší obrázekKlepněte pro větší obrázek
ABBYY FineReader 14 a čistý naskenovaný text do formátu PDF. Žádný problém s převodem do editovatelného DOCX.

Jednoduché OCR dnes nabízí i různé webové služby zdarma. Jenže při digitalizaci dokumentů nejde jen o samotné texty, ale také o jejich strukturu, formátování, styly a v neposlední řadě také o doplňky v podobě tabulek, grafů či obrázků. V ideálním případě bude vše převedeno do editovatelného dokumentu s grafickými objekty, nicméně texty a tabulky zůstanou editovatelné.

ABBYY FineReader 14 nabízí obstojné výsledky. Dokumenty jako jsou smlouvy, technické zprávy, zápisy z jednání, tabulky s ceníky apod. převede s minimem chyb. S více strukturovanými dokumenty, jako je například stránka z časopisu, už je to horší. S různorodou typografií a grafickými prvky si občas neporadí korektně. Stěžejní text článku je ale převeden dobře.

Klepněte pro větší obrázekKlepněte pro větší obrázek
Strukturovaná tisková zpráva také dopadla výborně, formátování zůstalo zachováno

Pro rychlé převádění je určený přímý převod (lze i hromadně), ve kterém se ale občas může objevit nějaká chyba. Při požadavku na zcela přesný převod je vhodné převáděný dokument otevřít v tzv. OCR editoru. Tam program vyznačí všechny místa, kde si „není jistý“. Postupně jimi můžete proskákat a dohlédnout na každé sporné písmenko.

Klepněte pro větší obrázekKlepněte pro větší obrázek
Stránka z časopisu už se bez chyby neobešla. Samotný text článku je v pořádku, ale nadpisu s atypickým písmem kus chybělo. To už je pak nutné doladit ručně v editoru

Podobně funguje i nová funkce pro porovnávání dokumentů. Ta se hodí například při porovnávání různých verzí smluv apod. Zdroje mohou být různorodé - fotka, scan, originál... Porovnává se samotný text. Program vyhledá rozdíly nebo sporné prvky, a tyto označí.

Vstupními formáty pro převod textů do editovatelné podoby jsou všechny verze PDF dokumentů a nejrozšířenější formáty obrázků (IFF, JPEG, JBIG2, PNG, BMP, PCX, GIF, DjVu, XPS). Dokumenty se následně ukládají do DOC(X), XLS(X), PPTX, HTML, RTF, TXT, CSV, ODT, EPUB či FB2. Převod je možný i obráceně, tedy z editovatelného textu na obrázek či do PDF.

Dokument na vstupu nemusí být precizní scan či nějak upravená fotografie, stačí obyčejná fotka z mobilu, klidně trochu šikmo. Stačí, když je fotografie ostrá a písmena od podkladu rozpoznatelná. Program si hranice papíru najde a dokument srovná. Samozřejmě platí, čím kvalitnější zdroj, tím menší riziko chyby při převodu.

Klepněte pro větší obrázekKlepněte pro větší obrázek
Porovnávání - vlevo fotka z mobilu, napravo originál. Změnilo se něco?

ABBYY FineReader je šikovný nástroj. Dřív byl celkem rozšířen i v domácnostech, ale tam už si zpravidla vystačíme s jednoduššími OCR funkcemi dodávaným ke skenerům či multifunkčním tiskárnám, případně jednorázové online řešení. A tak FineReader cílí už primárně do firem. Tomu odpovídá i nabídka licencí:

Klepněte pro větší obrázek
Diskuze (4) Další článek: Apple koupil startup RealFace zaměřený na rozpoznávání obličeje

Témata článku: Software, PDF, Editovatelný text, Přímý převod, Nadpis, Multifunkční tiskárna, Epub, PPT, Více, CSV, Word, Digital, Dok, Fin, Nejrozšířenější formát, Upravená fotografie, TXT, Nejznámější nástroj, Nová funkce, Verze, Dokument, Převádění, PPTX, Ostré písmo


Určitě si přečtěte

Užitečné funkce ve Windows 10, o kterých možná ani nevíte

Užitečné funkce ve Windows 10, o kterých možná ani nevíte

** Operační systém Windows 10 nabízí spoustu užitečných drobností ** O některých funkcích mnoho uživatelů není ** Ukážeme vám některé užitečné vychytávky

Vladislav Kluska | 86

Levný televizor místo drahého 4K HDR monitoru? Na co si musíte dát pozor

Levný televizor místo drahého 4K HDR monitoru? Na co si musíte dát pozor

** 43", 4K, 60 Hz a HDR k tomu za deset tisíc ** Televizor takových parametrů stojí téměř polovinu, co monitor ** Využití televize jako monitoru přináší řadu kompromisů, ale jde to

Tomáš Holčík | 63

Nejlepší hardware: Skládáme nenáročnou sestavu i extrém na hry

Nejlepší hardware: Skládáme nenáročnou sestavu i extrém na hry

** Poradíme, jaký se teď vyplatí koupit hardware ** Procesory, desky, paměti, grafické karty... je z čeho vybírat ** Počítač ale nemusíte skládat, ukážeme i výhodné hotové počítače

Stanislav Janů | 8

Řidiče Tesly ukolébal autopilot, policisté ho zastavili až po 11 kilometrech

Řidiče Tesly ukolébal autopilot, policisté ho zastavili až po 11 kilometrech

** Policisty poblíž San Franciska zaujala Tesla se spícím řidičem ** Donutili vozidlo zpomalit a následně probudili překvapeného řidiče ** Vozidlo podle dostupných informací jelo v režimu autopilota

Karel Kilián | 70

Photolemur 3: Prostě do něj přetáhnete fotky a začne se dít magie. Tedy údajně...

Photolemur 3: Prostě do něj přetáhnete fotky a začne se dít magie. Tedy údajně...

** Je lepší nabušený Photoshop, nebo program s jedním tlačítkem? ** Photolemur si myslí to druhé ** Tento fotoeditor neumí skoro nic, a přitom (skoro) všechno

Jakub Čížek | 21



Aktuální číslo časopisu Computer

Jak nastavit a ochránit nový mobil

Velký test bezdrátových klávesnicí a myší

Počítače v roce 2019

Srovnání barevných laserových multifunkcí