Z papíru rovnou do Wordu či Excelu

Digitalizace dokumentů často odrazuje svým zdlouhavým postupem a nepřesným zpracováním. Existují ale skenery, které z papíru vytvoří přesnou kopii v docx i bez počítače.

S postupným nástupem digitalizace dokumentů bylo nutné řešit, jak propojit digitalizovaný svět s tím papírovým. Původně počítače sloužily především pro tvorbu, ze které nakonec vzešla papírová dokumentace určená k dalšímu zpracování či archivaci. Teď už se ale situace obrací a papírové dokumenty je nutné zdigitalizovat, aby byly použitelné dál.

Nejde jen o text, ale i o jeho podobu

Převod z digitálního prostředí na papírové řešily odjakživa tiskárny, které se za desítky let vypracovaly v zařízení schopná velmi rychlého a přesného převodu „z obrazovky na papír“. Ovšem naopak je to trochu komplikovanější – skenery jsou sice běžné, ale oskenovaný dokument má podobu obrazové informace, kterou si ve Wordu k editaci neotevřete. Musí tak přijít software, který oskenovaný obrázek „pochopí“ a přepracuje ho do běžného editovatelného dokumentu.

K novému skeneru či multifunkční tiskárně/kopírce zpravidla nějaký takový software na převod obrázku do editovatelných dokumentů dostanete. Ovšem použitelnost bývá program od programu různá a především je to další zdržující krok, který musíte provést v počítači. Jde to ale i rovnou, což předvádí nové multifunkční tiskárny/kopírky Bizhub kategorie „e“ od Konica Minolta. Vložené dokumenty se do počítače nebo třeba síťové úložiště pošlou přímo v editovatelném formátu.

KM C284e.jpg Ovládání.jpg

Rozpoznávání obsahu dokumentů není až tak jednoduchá disciplína, jak se může zdát. Je potřeba rozpoznat nejen jednotlivá písmena, ale také speciální znaky a především formátování a další grafické součásti dokumentu. Rozpoznat se tedy musí i font písma, jeho velikost, tučnost, velikosti mezer, formátování tabulek, záhlaví, oddělených sekcí atp.

Vestavěný software v nových Bizhubech se snaží o přesnou digitální reprodukci tištěného dokumentu, nezůstává jen u převodu textů. Nepřesnosti mohou vznikat u drobností jako je velikost odsazení, mezer či řádkování, na první pohled by však měl dokument odpovídat originálu. Software umí například i doplňovat hypertextové odkazy, pokud v papírovém dokumentu rozpozná internetovou adresu.

Do Wordu i do Excelu

Pro správný převod je nutné, aby software znal znakové nuance různých jazyků. V tomto případě je podporováno 189 jazyků včetně češtiny, přitom 144 jazyků má kromě rozpoznávání znaků i slovníkovou podporu, což ještě zpřesňuje rozpoznávání. K dispozici jsou i alternativní znakové sady jako je azbuka, arabština, čínština, korejština a další. V rámci jedné strany dokumenty lze rozpoznávat více jazyků, systém to automaticky rozpozná

Výsledkem skenu budiž dokument ve starších i nových formátech Wordu či Excelu, rtf, xml, pdf, txt, csv, html či pro případ skenování větších publikací epub. Délka trvání skenu jedné stránky závisí na obsahu, nicméně jedna stránka A4 s použitím jednoho jazyka a jen formátovaného textu by měla být zpracována přibližně za osm sekund, čas však narůstá při přesném rozpoznávání tabulek, grafických doplňků v textu a hlavně při použití více jazyků zároveň.

Zajímavé řešení rychlého přímého převodu papírových dokumentů do editovatelné podoby bez potřeby počítače se uplatní především ve firmách. Pro občasné domácí použití si můžete vystačit se skenerem připojeným k počítači, v jehož výbavě nějaký software pro základní převod dokumentů do editovatelné podoby často najdete. Nelze však počítat s takovou rychlostí a přesností jako u profesionálního stroje.

Diskuze (7) Další článek: Testlab: na co si dát pozor při výběru LED projektoru

Témata článku: , , , , , , , , , , , , , , , , , , , ,