Dobrý den, mám naskenovanou knihu v PDF, problém je ten že když je to naskenované tak nemohu jednotlivé části kopírovat ani pomocí ctrl+f vyhledávat jednotlivá slova, což mi hodně stěžuje práci, protože musím vše pak dlouho hledat v knize. Vím že existují programy které dokážou převod PDF souboru do Wordu, některé jsem zkoušel ale vždy mi to buď odmítlo udělat, protože je velký soubor nebo mi to převedlo do Wordu zase jako obrázek. Chtěl bych se zeptat jestli existují nějaké programy které mi převedou naskenovaný PDF soubor buď do textového souboru PDF nebo do textového souboru ve Wordu.Děkuji za rady
Ano existují OCR skenery, které ti obrázek převedou na text, ale když jsem je zkoušel tak kvalita mizerná. Pokud ten sken byl v angličtině a jednoduchý text typu novinový článek, tak to ještě nějak fungovalo. Ale s českou diakritikou to mělo velké problémy a když tam byly nějaké speciality jako různé vzorečky tak jsi byl totálně v análu. Jestli máš ještě mizerný sken, který je nějak zašumnělý, a nebo je špatně naskenovaný hřbet knihy, kde to správně nedolehlo a nebo tam prosvítá tisk z další strany papíru tak se o to ani nesnaž a radši si to přepiš, protože z toho nic použitelného nevzejde.
Tak logicky, když to v tom PDF máš vložené jako naskenovaný obrázek, tak s tím samozřejmě nejde pracovat jako s textem 🙂 Nejprve to musíš z obrázku nechat nějakým OCR konvertorem převést na text a s tím pak můžeš pracovat.
Takže je kniha naskenovaná jako obrázky. Které programy jsi zkoušel? Pokud je soubor příliš velký, převáděj ho po částech.
PDF-XChange Viewer má OCR, které přidá textovou vrstvu, takže se pak dá vyhledávat. Jen je potřeba si češtinu pro OCR doinstalovat - je to zdarma.
Pro převod naskenovaných knih v PDF souborů slouží OCR software a to jejich verze s podporou českého jazyka. Jednotlivé stránky naskenované knihy jsou tvořeny obrázky obsahující texty. OCR software převádí tyto obrázky (fotky textu) na klasický textový dokument (každé slovo pak není tvořeno obrázkem, ale písmeny). Při tomto softwarovém převodu dochází obvykle k chybám a proto je nutné výsledný převod "sporných" slov opravit ještě ručně.Výborným OCR programem pro knihu v češtině je ABBYY FineReader. Je placený, je i na uloz.to .Seznam OCR programů zdarma: https://lightpdf.com/cz/bezplatny-o...tware.htmlZdarma i placené OCR programy: https://nanonets.com/blog/ocr-softw...-software/
NAPS2 vie ocr a je zdarma.
jo jen to asi neumí z PDF ? Z naskenovaných případně do něj nahraných obrázků to umí...
Potvrďte prosím přezdívku, kterou jsme náhodně vygenerovali, nebo si zvolte jinou. Zajistí, že váš profil bude unikátní.
Tato přezdívka je už obsazená, zvolte prosím jinou.