» Poradna » Programy

Převod naskenovaného PDF dokumentu do wordu

 |   |  Microsoft Windows 10 Chrome 111.0.0.0

Dobrý den, mám naskenovanou knihu v PDF, problém je ten že když je to naskenované tak nemohu jednotlivé části kopírovat ani pomocí ctrl+f vyhledávat jednotlivá slova, což mi hodně stěžuje práci, protože musím vše pak dlouho hledat v knize. Vím že existují programy které dokážou převod PDF souboru do Wordu, některé jsem zkoušel ale vždy mi to buď odmítlo udělat, protože je velký soubor nebo mi to převedlo do Wordu zase jako obrázek. Chtěl bych se zeptat jestli existují nějaké programy které mi převedou naskenovaný PDF soubor buď do textového souboru PDF nebo do textového souboru ve Wordu.Děkuji za rady

Mohlo by vás také zajímat

Odpovědi na otázku

 | Microsoft Windows 10 Chrome 110.0.0.0

Ano existují OCR skenery, které ti obrázek převedou na text, ale když jsem je zkoušel tak kvalita mizerná. Pokud ten sken byl v angličtině a jednoduchý text typu novinový článek, tak to ještě nějak fungovalo. Ale s českou diakritikou to mělo velké problémy a když tam byly nějaké speciality jako různé vzorečky tak jsi byl totálně v análu. Jestli máš ještě mizerný sken, který je nějak zašumnělý, a nebo je špatně naskenovaný hřbet knihy, kde to správně nedolehlo a nebo tam prosvítá tisk z další strany papíru tak se o to ani nesnaž a radši si to přepiš, protože z toho nic použitelného nevzejde.

Souhlasím  |  Nesouhlasím  |  Odpovědět
 | Android AppleMAC-Safari 5.0

Tak logicky, když to v tom PDF máš vložené jako naskenovaný obrázek, tak s tím samozřejmě nejde pracovat jako s textem Nejprve to musíš z obrázku nechat nějakým OCR konvertorem převést na text a s tím pak můžeš pracovat.

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 10 Chrome 105.0.0.0

Takže je kniha naskenovaná jako obrázky. Které programy jsi zkoušel? Pokud je soubor příliš velký, převáděj ho po částech.

Souhlasím  |  Nesouhlasím  |  Odpovědět
 |   |  Microsoft Windows 10 Chrome 111.0.0.0

PDF-XChange Viewer má OCR, které přidá textovou vrstvu, takže se pak dá vyhledávat. Jen je potřeba si češtinu pro OCR doinstalovat - je to zdarma.

Souhlasím  |  Nesouhlasím  |  Odpovědět
 | Microsoft Windows 10 Chrome 111.0.0.0

Pro převod naskenovaných knih v PDF souborů slouží OCR software a to jejich verze s podporou českého jazyka. Jednotlivé stránky naskenované knihy jsou tvořeny obrázky obsahující texty. OCR software převádí tyto obrázky (fotky textu) na klasický textový dokument (každé slovo pak není tvořeno obrázkem, ale písmeny). Při tomto softwarovém převodu dochází obvykle k chybám a proto je nutné výsledný převod "sporných" slov opravit ještě ručně.Výborným OCR programem pro knihu v češtině je ABBYY FineReader. Je placený, je i na uloz.to .Seznam OCR programů zdarma: https://lightpdf.com/cz/bezplatny-ocr-software... Zdarma i placené OCR programy: https://nanonets.com/blog/ocr-software-best-oc...

Souhlasím  |  Nesouhlasím  |  Odpovědět
 | Microsoft Windows 10 Chrome 111.0.0.0

NAPS2 vie ocr a je zdarma.

Souhlasím  |  Nesouhlasím  |  Odpovědět
avatar
 | Microsoft Windows 10 Firefox 111.0

jo jen to asi neumí z PDF ? Z naskenovaných případně do něj nahraných obrázků to umí...

Souhlasím  |  Nesouhlasím  |  Odpovědět

Související témata: PDF, Velký soubor, Jednotlivé části, Ctrl + F