reklama

Z papíru rovnou do Wordu či Excelu

Digitalizace dokumentů často odrazuje svým zdlouhavým postupem a nepřesným zpracováním. Existují ale skenery, které z papíru vytvoří přesnou kopii v docx i bez počítače.

S postupným nástupem digitalizace dokumentů bylo nutné řešit, jak propojit digitalizovaný svět s tím papírovým. Původně počítače sloužily především pro tvorbu, ze které nakonec vzešla papírová dokumentace určená k dalšímu zpracování či archivaci. Teď už se ale situace obrací a papírové dokumenty je nutné zdigitalizovat, aby byly použitelné dál.

Nejde jen o text, ale i o jeho podobu

Převod z digitálního prostředí na papírové řešily odjakživa tiskárny, které se za desítky let vypracovaly v zařízení schopná velmi rychlého a přesného převodu „z obrazovky na papír“. Ovšem naopak je to trochu komplikovanější – skenery jsou sice běžné, ale oskenovaný dokument má podobu obrazové informace, kterou si ve Wordu k editaci neotevřete. Musí tak přijít software, který oskenovaný obrázek „pochopí“ a přepracuje ho do běžného editovatelného dokumentu.

K novému skeneru či multifunkční tiskárně/kopírce zpravidla nějaký takový software na převod obrázku do editovatelných dokumentů dostanete. Ovšem použitelnost bývá program od programu různá a především je to další zdržující krok, který musíte provést v počítači. Jde to ale i rovnou, což předvádí nové multifunkční tiskárny/kopírky Bizhub kategorie „e“ od Konica Minolta. Vložené dokumenty se do počítače nebo třeba síťové úložiště pošlou přímo v editovatelném formátu.

Klepněte pro větší obrázek Klepněte pro větší obrázek

Rozpoznávání obsahu dokumentů není až tak jednoduchá disciplína, jak se může zdát. Je potřeba rozpoznat nejen jednotlivá písmena, ale také speciální znaky a především formátování a další grafické součásti dokumentu. Rozpoznat se tedy musí i font písma, jeho velikost, tučnost, velikosti mezer, formátování tabulek, záhlaví, oddělených sekcí atp.

Vestavěný software v nových Bizhubech se snaží o přesnou digitální reprodukci tištěného dokumentu, nezůstává jen u převodu textů. Nepřesnosti mohou vznikat u drobností jako je velikost odsazení, mezer či řádkování, na první pohled by však měl dokument odpovídat originálu. Software umí například i doplňovat hypertextové odkazy, pokud v papírovém dokumentu rozpozná internetovou adresu.

Do Wordu i do Excelu

Pro správný převod je nutné, aby software znal znakové nuance různých jazyků. V tomto případě je podporováno 189 jazyků včetně češtiny, přitom 144 jazyků má kromě rozpoznávání znaků i slovníkovou podporu, což ještě zpřesňuje rozpoznávání. K dispozici jsou i alternativní znakové sady jako je azbuka, arabština, čínština, korejština a další. V rámci jedné strany dokumenty lze rozpoznávat více jazyků, systém to automaticky rozpozná

Výsledkem skenu budiž dokument ve starších i nových formátech Wordu či Excelu, rtf, xml, pdf, txt, csv, html či pro případ skenování větších publikací epub. Délka trvání skenu jedné stránky závisí na obsahu, nicméně jedna stránka A4 s použitím jednoho jazyka a jen formátovaného textu by měla být zpracována přibližně za osm sekund, čas však narůstá při přesném rozpoznávání tabulek, grafických doplňků v textu a hlavně při použití více jazyků zároveň.

Zajímavé řešení rychlého přímého převodu papírových dokumentů do editovatelné podoby bez potřeby počítače se uplatní především ve firmách. Pro občasné domácí použití si můžete vystačit se skenerem připojeným k počítači, v jehož výbavě nějaký software pro základní převod dokumentů do editovatelné podoby často najdete. Nelze však počítat s takovou rychlostí a přesností jako u profesionálního stroje.

Témata článku: Microsoft Office, Excel, Epub, Nuance

7 komentářů

Nejnovější komentáře

  • mungo 20. 6. 2013 18:11:07
    ... přímo v editovatelném formátu. Záleží opět jenom na úhlu pohledu....
  • Majsner 20. 6. 2013 15:08:51
    Autor o problematice OCR zjevně neví zhola nic a svojí laickou dedukcí to...
  • umiyaki.cz 20. 6. 2013 13:53:10
    Touto problematikou se poměrně zabývám a od počátku automatických převodů...
reklama
Určitě si přečtěte

UPC překopli páteřní kabel. V Brně i druhý den nejede internet ani kabelovka

UPC překopli páteřní kabel. V Brně i druhý den nejede internet ani kabelovka

** V Brně byl velký výpadek služeb UPC ** Důvodem je překopnutý páteřní kabel ** V některých lokalitách služby stále nefungují

Včera | Jakub Čížek | 94

ASUS ZenBook 3 se začal prodávat v Česku. Je ve všem lepší než MacBook, ale bude to stačit?

ASUS ZenBook 3 se začal prodávat v Česku. Je ve všem lepší než MacBook, ale bude to stačit?

** Novinka od Asusu míří přímo proti MacBooku od Applu ** Nabídne daleko více výkonu za stejné peníze

2.  12.  2016 | David Polesný | 137


reklama