reklama

Z papíru rovnou do Wordu či Excelu

Digitalizace dokumentů často odrazuje svým zdlouhavým postupem a nepřesným zpracováním. Existují ale skenery, které z papíru vytvoří přesnou kopii v docx i bez počítače.

S postupným nástupem digitalizace dokumentů bylo nutné řešit, jak propojit digitalizovaný svět s tím papírovým. Původně počítače sloužily především pro tvorbu, ze které nakonec vzešla papírová dokumentace určená k dalšímu zpracování či archivaci. Teď už se ale situace obrací a papírové dokumenty je nutné zdigitalizovat, aby byly použitelné dál.

Nejde jen o text, ale i o jeho podobu

Převod z digitálního prostředí na papírové řešily odjakživa tiskárny, které se za desítky let vypracovaly v zařízení schopná velmi rychlého a přesného převodu „z obrazovky na papír“. Ovšem naopak je to trochu komplikovanější – skenery jsou sice běžné, ale oskenovaný dokument má podobu obrazové informace, kterou si ve Wordu k editaci neotevřete. Musí tak přijít software, který oskenovaný obrázek „pochopí“ a přepracuje ho do běžného editovatelného dokumentu.

K novému skeneru či multifunkční tiskárně/kopírce zpravidla nějaký takový software na převod obrázku do editovatelných dokumentů dostanete. Ovšem použitelnost bývá program od programu různá a především je to další zdržující krok, který musíte provést v počítači. Jde to ale i rovnou, což předvádí nové multifunkční tiskárny/kopírky Bizhub kategorie „e“ od Konica Minolta. Vložené dokumenty se do počítače nebo třeba síťové úložiště pošlou přímo v editovatelném formátu.

Klepněte pro větší obrázek Klepněte pro větší obrázek

Rozpoznávání obsahu dokumentů není až tak jednoduchá disciplína, jak se může zdát. Je potřeba rozpoznat nejen jednotlivá písmena, ale také speciální znaky a především formátování a další grafické součásti dokumentu. Rozpoznat se tedy musí i font písma, jeho velikost, tučnost, velikosti mezer, formátování tabulek, záhlaví, oddělených sekcí atp.

Vestavěný software v nových Bizhubech se snaží o přesnou digitální reprodukci tištěného dokumentu, nezůstává jen u převodu textů. Nepřesnosti mohou vznikat u drobností jako je velikost odsazení, mezer či řádkování, na první pohled by však měl dokument odpovídat originálu. Software umí například i doplňovat hypertextové odkazy, pokud v papírovém dokumentu rozpozná internetovou adresu.

Do Wordu i do Excelu

Pro správný převod je nutné, aby software znal znakové nuance různých jazyků. V tomto případě je podporováno 189 jazyků včetně češtiny, přitom 144 jazyků má kromě rozpoznávání znaků i slovníkovou podporu, což ještě zpřesňuje rozpoznávání. K dispozici jsou i alternativní znakové sady jako je azbuka, arabština, čínština, korejština a další. V rámci jedné strany dokumenty lze rozpoznávat více jazyků, systém to automaticky rozpozná

Výsledkem skenu budiž dokument ve starších i nových formátech Wordu či Excelu, rtf, xml, pdf, txt, csv, html či pro případ skenování větších publikací epub. Délka trvání skenu jedné stránky závisí na obsahu, nicméně jedna stránka A4 s použitím jednoho jazyka a jen formátovaného textu by měla být zpracována přibližně za osm sekund, čas však narůstá při přesném rozpoznávání tabulek, grafických doplňků v textu a hlavně při použití více jazyků zároveň.

Zajímavé řešení rychlého přímého převodu papírových dokumentů do editovatelné podoby bez potřeby počítače se uplatní především ve firmách. Pro občasné domácí použití si můžete vystačit se skenerem připojeným k počítači, v jehož výbavě nějaký software pro základní převod dokumentů do editovatelné podoby často najdete. Nelze však počítat s takovou rychlostí a přesností jako u profesionálního stroje.

Témata článku: Microsoft Office, Excel, Epub, Nuance

7 komentářů

Nejnovější komentáře

  • mungo 20. 6. 2013 18:11:07
    ... přímo v editovatelném formátu. Záleží opět jenom na úhlu pohledu....
  • Majsner 20. 6. 2013 15:08:51
    Autor o problematice OCR zjevně neví zhola nic a svojí laickou dedukcí to...
  • umiyaki.cz 20. 6. 2013 13:53:10
    Touto problematikou se poměrně zabývám a od počátku automatických převodů...
reklama
Určitě si přečtěte

Pojďme programovat elektroniku: Sestavíme si mobil a pošleme SMS

Pojďme programovat elektroniku: Sestavíme si mobil a pošleme SMS

** Kolik stál váš mobilní telefon? ** Základní GSM modem koupíte za stovku ** Umí telefonovat, posílat SMS a zvládne i GPRS

13.  1.  2017 | Jakub Čížek | 27

Do nitra zákeřného ransomwaru. Takto vypadá útok na počítače personalistek

Do nitra zákeřného ransomwaru. Takto vypadá útok na počítače personalistek

** Jmenuje se Rolf a chce práci ** Jeho životopis je ale trošku jiný ** Rolf je totiž ransomware

11.  1.  2017 | Jakub Čížek | 44

Auta budoucnosti: V tomto se budete za pár let vozit

Auta budoucnosti: V tomto se budete za pár let vozit

** Velký prostor patřil na letošním veletrhu CES automobilům ** Automobilová budoucnost je elektrická a inteligentní ** Podívejte se, jak je vývoj futuristických autonomních aut daleko

12.  1.  2017 | David Polesný | 34

Český státní blacklist už funguje. Ministerstvo financí se pochlubilo s detaily

Český státní blacklist už funguje. Ministerstvo financí se pochlubilo s detaily

** Dva týdny po Novém roce zajím zeje prázdnotou ** Ministerstvo vydalo metodický pokyn ** Takhle to bude fungovat v praxi

Včera | Jakub Čížek | 41


Aktuální číslo časopisu Computer

99 nejlepších programů pro váš počítač

Zvykejte si na umělou inteligenci

Velké testy PC zdrojů a gamepadů

Alternativní zdroje energie

reklama
reklama