Princip je jednoduchý a vše se nastavuje při konverzi (nebo v nastavení) v menu Struktura Detekce
zaškrtněte odstranit patičku stránky a vyplňte Patičkový regulární výraz
-( )\n|(?
Tento výraz spojí rozdělená slova na konci řádku a dále spojí do jednoho odstavce řádky delší než 50 znaků pokud nekončí znaky .!?": , tedy pokud se ukončí odstavec, tak určitě ne uprostřed věty, ale vždy až po interpunkčním znaménku, nebo pokud je řádek kratší než 50 znaků. Délku řádku si můžete
změnit podle potřeby změnou čísla v regulárním výrazu.
následující hlavičkový regulární výraz pomůže odstranit některé číslování (kliknutím na kouzelnickou hůlku můžete vyzkoušet jestli funguje správně)
(\d+) ( \s*) (\s* )| (\s* )|( )(\s* )(\d+) ( \s*)(.*)( )|( )(\s* )(.*)( \s*)(\d+) ( )