Zdravim,jedna prosba, casto potrebujem konvertovat na text pdf subory s textom v 2 stlpcoch. Bezne sa tak publikuju vedecke clanky. Vedel by niekto poradit software na korektny export do textoveho fomatu. Vacsina otestovaneho softw. urobi z textu zmes z tych 2 stlpcov. Alebo mozno existuje nejaky dobry postup ako na to. Dakujem vopred, Tono.
Skúsil by som Adobe Acrobat alebo ABBY Finereader
ABBYY FR mám plnou verzi a tam si vyberu pořadí čtení sloupců bez problému. Mají i zkušební verzi na 7 dní a 100 stran textu.
pokud chces poradit tak dej odkaz na nejakou tu typickou PDF stranku o kterou ti jde. Zalezi jak je to prevedene do PDF. Ale obecne jak bys chtel prevest dva sloupce do cisteho textu, kdyz v TXT zadny sloupce vedle sebe delat nedaji ? Prevest korektne takovy slozity vicesloupcovy dokument do TXT je mozna spis prace pro AI - a proc TXT.. do Wordu by to nestacilo ?
ale klidne mi misto tech minusu napiste jak jednoduse prevadite vic sloupcu do .txt vy, ja se urcite rad poucim 🙂
Možná jsou minusy za to, že zbytečně bereš dotaz doslova. Převod do textu je pro spoustu lidí prostě synonymem pro převod do textového formátu, tedy wordu. Rozdíl mezi čistým a formátovaným textem si bfú obvykle neuvědomuje.Jednoduše to ovšem převést nejde, to máš pravdu. Některé programy a webové služby to ale zvládají. Nepotřebuju to pravidelně, takže nemám nic vysledováno. Samozřejmě záleží na tom, zda obsahem pdf je text, nebo grafika, ale i tak jsem opakovaně uspěl na bezplatných webových službách. Po vyhledání "pdf do wordu" mi google nabídne několik odkazů služeb různé kvality. Zatím vždy jsem uspěl i se sloupcovými texty v pdf, ale konkrétní adresu uloženou nemám. Jen tedy sdílím zkušenost, že takové webové služby jde najít.
U každého souboru .pdf může být postup úplně jiný. Nebo nemožný. Čistý text ve dvou sloupcích udělá např. Foxit Reader, Uložit jako text. Text je ob řádek a druhý sloupec odsazen 60 mezerami. Záleží, co s tím chceš dělat dál.
Obávám se, že to asi moc řešení nemá. Ty články nemají přesně definovaný formát, obvykle je část ve dvou sloupcích (vlastní odborný text) ale záhlaví, zápatí a úvodní informace (název článku, autoři, abstrakt) je zas v jednom sloupci.Zkusil jsem PDF-XChange editor na jeden namátkou vybraný článek v PDF a převedl do DOC - rozložení to celkem zachovalo, ale i tak se část formátování rozsypala a jestli z toho fakt chceš TXT tak to bude ještě horší...Možná fakt nějaká ta AI by to zvládla...
Mozno som mal napisat skor export ako akykolvek editovatelny text, nejedna sa o ciste txt, nezalezi na tom. Dolezite je aby nebol popleteny text. Ak vieme urobit z toho napr. html so spravnou navaznostou textu. Jedna sa hlavne o jadro textu, ostatne zalezitosti v texte su sekundarne.
Pak ti poslouží .doc formát, jak psal kolega. Stačí připravit prázdný dokument jako dvousloupcový a text zkopírovaný z .pdf do něj vložit.
Vzorovej PDF si nedal a delas s tim tajnosti, tak tezko radit.. ale v Adobe Acrobatu kdyz prevedu vicesloupcovy PDF i s obrazkama do docx, tak to vypada takhle (vlastně stejny jako v PDF).. https://www.uschovna.cz/zasilka/STHL5P...AEPTM-SBW/ Podobný budou asi ostatní editory (InfixPDF, ABBY finereader atp), ale opravdu hodne zalezi jak je to zdrojovy PDF udelany a jestli jsou tam ty bloky nejak logicky po sobe a PDF konvertor to zaroven nejak neskurvil - PDF je cilovy format pro cteni a tisk a nikdo nepredpoklada ze se to bude prevadet zpatky do nejakyho dokumentu.
já jsem spokojenej s wondershare pdfelement pro.Akorát není počeštěn, ale OCR v češtině je.
Ten je celkom fajn. Hlavnou vyhodou je, ze sa da kupit TRVALA licencia bez mesacnych poplatkov.Taktiez sa v nom da urobit nieco ako naskenovanie dokumentu. Teda nemusim clanok vytlacit a papiere naskenovat na scaneri. Ale otvorim pdf subor a dam prikaz scan. Vysledkom bude novy dokument, kde na kazdej stranke je len obrazok s pismenkami. A takyto dokument s obrazkami mozem dat znovu OCR-kovat. Takto OCR-kovany novy dokument moze byt niekedy lepsi (na ziskanie) textu ako original.
Potvrďte prosím přezdívku, kterou jsme náhodně vygenerovali, nebo si zvolte jinou. Zajistí, že váš profil bude unikátní.
Tato přezdívka je už obsazená, zvolte prosím jinou.