Z papíru rovnou do Wordu či Excelu

Digitalizace dokumentů často odrazuje svým zdlouhavým postupem a nepřesným zpracováním. Existují ale skenery, které z papíru vytvoří přesnou kopii v docx i bez počítače.

S postupným nástupem digitalizace dokumentů bylo nutné řešit, jak propojit digitalizovaný svět s tím papírovým. Původně počítače sloužily především pro tvorbu, ze které nakonec vzešla papírová dokumentace určená k dalšímu zpracování či archivaci. Teď už se ale situace obrací a papírové dokumenty je nutné zdigitalizovat, aby byly použitelné dál.

Nejde jen o text, ale i o jeho podobu

Převod z digitálního prostředí na papírové řešily odjakživa tiskárny, které se za desítky let vypracovaly v zařízení schopná velmi rychlého a přesného převodu „z obrazovky na papír“. Ovšem naopak je to trochu komplikovanější – skenery jsou sice běžné, ale oskenovaný dokument má podobu obrazové informace, kterou si ve Wordu k editaci neotevřete. Musí tak přijít software, který oskenovaný obrázek „pochopí“ a přepracuje ho do běžného editovatelného dokumentu.

K novému skeneru či multifunkční tiskárně/kopírce zpravidla nějaký takový software na převod obrázku do editovatelných dokumentů dostanete. Ovšem použitelnost bývá program od programu různá a především je to další zdržující krok, který musíte provést v počítači. Jde to ale i rovnou, což předvádí nové multifunkční tiskárny/kopírky Bizhub kategorie „e“ od Konica Minolta. Vložené dokumenty se do počítače nebo třeba síťové úložiště pošlou přímo v editovatelném formátu.

Klepněte pro větší obrázek Klepněte pro větší obrázek

Rozpoznávání obsahu dokumentů není až tak jednoduchá disciplína, jak se může zdát. Je potřeba rozpoznat nejen jednotlivá písmena, ale také speciální znaky a především formátování a další grafické součásti dokumentu. Rozpoznat se tedy musí i font písma, jeho velikost, tučnost, velikosti mezer, formátování tabulek, záhlaví, oddělených sekcí atp.

Vestavěný software v nových Bizhubech se snaží o přesnou digitální reprodukci tištěného dokumentu, nezůstává jen u převodu textů. Nepřesnosti mohou vznikat u drobností jako je velikost odsazení, mezer či řádkování, na první pohled by však měl dokument odpovídat originálu. Software umí například i doplňovat hypertextové odkazy, pokud v papírovém dokumentu rozpozná internetovou adresu.

Do Wordu i do Excelu

Pro správný převod je nutné, aby software znal znakové nuance různých jazyků. V tomto případě je podporováno 189 jazyků včetně češtiny, přitom 144 jazyků má kromě rozpoznávání znaků i slovníkovou podporu, což ještě zpřesňuje rozpoznávání. K dispozici jsou i alternativní znakové sady jako je azbuka, arabština, čínština, korejština a další. V rámci jedné strany dokumenty lze rozpoznávat více jazyků, systém to automaticky rozpozná

Výsledkem skenu budiž dokument ve starších i nových formátech Wordu či Excelu, rtf, xml, pdf, txt, csv, html či pro případ skenování větších publikací epub. Délka trvání skenu jedné stránky závisí na obsahu, nicméně jedna stránka A4 s použitím jednoho jazyka a jen formátovaného textu by měla být zpracována přibližně za osm sekund, čas však narůstá při přesném rozpoznávání tabulek, grafických doplňků v textu a hlavně při použití více jazyků zároveň.

Zajímavé řešení rychlého přímého převodu papírových dokumentů do editovatelné podoby bez potřeby počítače se uplatní především ve firmách. Pro občasné domácí použití si můžete vystačit se skenerem připojeným k počítači, v jehož výbavě nějaký software pro základní převod dokumentů do editovatelné podoby často najdete. Nelze však počítat s takovou rychlostí a přesností jako u profesionálního stroje.

Témata článku: Microsoft Office, Excel, Kopírky, Tiskárny k počítači, Epub, Nuance

7 komentářů

Nejnovější komentáře

  • mungo 20. 6. 2013 18:11:07
    ... přímo v editovatelném formátu. Záleží opět jenom na úhlu pohledu....
  • Majsner 20. 6. 2013 15:08:51
    Autor o problematice OCR zjevně neví zhola nic a svojí laickou dedukcí to...
  • umiyaki.cz 20. 6. 2013 13:53:10
    Touto problematikou se poměrně zabývám a od počátku automatických převodů...
Určitě si přečtěte

Původní Starcraft: Brood War je nyní zdarma. Konec práce! Jde se pařit

Původní Starcraft: Brood War je nyní zdarma. Konec práce! Jde se pařit

** Legendární hra Starcraft je nyní k dispozici zdarma ** Chystá se i nová remasterovaná verze s hezčí grafikou

19.  4.  2017 | Jakub Čížek | 25

Brno otevřelo největší českou dílnu pro bastlíře. Kladívka, vrtačky, 3D tiskárny, laserové řezačky. Je tu vše

Brno otevřelo největší českou dílnu pro bastlíře. Kladívka, vrtačky, 3D tiskárny, laserové řezačky. Je tu vše

** Máte nápad, ale chybí vám stroje a pořádná dílna? ** Chcete postavit ptačí budku, nebo krabičku pro Arduino? ** Brno otevřelo svůj FabLab – laboratoř pro bastlíře

19.  4.  2017 | Jakub Čížek | 31

Český Google Překladač začal používat umělou inteligenci. Konec „drahoušků zákazníků“

Český Google Překladač začal používat umělou inteligenci. Konec „drahoušků zákazníků“

** Google ve svém překladači roky používal statistickou technologii ** Nyní zavádí strojové učení a neuronové sítě ** Rozdíl by měl být zvláště na větších textech patrný už nyní

20.  4.  2017 | Jakub Čížek | 31


Aktuální číslo časopisu Computer

První test AMD Ryzen

Velké testy: 22 powerbank a 8 bezdrátových setů

Radíme s koupí Wi-Fi routeru

Co dokáží inteligentní domy?