Regulární výraz - nahrazení mezer v části textu

Question

Regulární výraz - nahrazení mezer v části textu

Zobrazit bez stromu | | 10 nových odpovědí

Alois Novák (checheche)

06. 01. 2020 10:14 |

Zdravím,mám text, kde každý řádek vypadá následovně:Obecný text @## ##,# # #/# ### ## #####Kde "obecný text" je prostě text obsahující libovolné znaky včetně mezer a číslic# je číslice@## je kód, který se v obecném textu nevyskytujeChci nahradit všechny mezery za @## tabulátorem. Počet skupin číslic je různý desetiny a lomítka nemusí být všude.Chtěl jsem to udělat takto:Najít: (@\d+)( ([\d,/]+))+Nahradit: $1\t$3Jenže jsem očividně špatně pochopil referenci, protože $3 mi vrací poslední výskyt (Obecný text @## #####)Teď nevím jak dál. Ani mě nenapadá, co bych měl Googlit.Dokáže mě, prosím, někdo popostrčit správným směrem? Používám Notepad++Díky.

Mohlo by vás také zajímat

Excel - Vzorec na hledání sekvence znaků (9) Programy
Ztráta napsaných stránek v dokumentu (9) Programy ztráta napsaných stránek v dokumentu
Aplikace na vyhledávání v textových souborech (23) Programy
Jak vystřihnout z obrazové části videa úsek menší než 0,5 sec. ve Videopadu (11) Mobily
Word, zápatí (9) Programy Word, zápatí

Odpovědi na otázku

Milan Kopsa

06. 01. 2020 10:27 |

výraz: (@\d+)( +)náhrada: $1\tZ textu:Obecný text @12 12,3 1 1/1 123 12 12345 @123454 @1235 4565udělá:Obecný text @12\t12,3 1 1/1 123 12 12345 @123454\t@1235\t4565

Souhlasím | Nesouhlasím

Alois Novák (checheche)

07. 01. 2020 07:12 |

Díky za odpověď. Špatně jsem se vyjádřil. Chtěl bych to takto:Původní:Obecný text @## ##,# # #/# ### ## #####Nahrazený:Obecný text @##\t##,#\t#\t#/#\t###\t##\t#####

Howg

Souhlasím | Nesouhlasím

Alois Novák (checheche)

08. 01. 2020 18:13 |

Dá se to řešit tak, že si to rozdělím na dva soubory. Jeden bude obsahovat část před @ a druhý za.V části za nahradím všechny mezery za tabulátory a potom zase spojím.Jenže to je "moc práce" a ten regex mi nedá spát.

Howg

Souhlasím | Nesouhlasím

Milan Kopsa

07. 01. 2020 10:11 |

Aha, tak to jsem špatně pochopil. Tipnul bych si, že to pomocí regexu nepůjde, ale třeba se pletu.

Souhlasím | Nesouhlasím

Slajfka | 07. 01. 2020 08:13 |

Na testování regulárních výrazů používám tuto web stránku https://regexr.com/

Souhlasím | Nesouhlasím

Jirka Vejražka

07. 01. 2020 08:26 |

To je zajimavy problem - nejak mne nenapada, jak to pres regularni vyraz udelat. Osobne bych na to napsal kratky skript, treba v Pythonu by to bylo cca na pet radek. Bylo by to pro tebe reseni?

Souhlasím | Nesouhlasím

Alois Novák (checheche)

08. 01. 2020 18:16 |

Díky za odpověď. Skriptem je to jednoduché - split() a potom replace(). Problém řešení má. Ale pořád přemýšlím, jestli by to nešlo jedním výrazem.

Howg

Souhlasím | Nesouhlasím

Nargon

07. 01. 2020 13:25 |

V podstatě je to celkem jednoduché nahrazení "mezery" za "tabelátor", ale jen v textu, který je za zavináčem.Tohle by to chtělo řešit nějakým dvoukrokovým prográmkem který nejprve nalezne oblast čísel/mezer/lomítek/čárek, které jsou za zavináčem a na tuto oblast aplikuje jednoduché nahrazení mezery za tabelátor. Řešit to kompletně pomocí regulárních výrazů je "možné", ale v praxi problematicky proveditelné. Jde to pomocí regex:Najít: "(?<=@.*) " (bez uvozovek, já je tam dal aby bylo vidět tu mezeru na konci)Nahradit: \tTento regulární výraz využívá "positive lookbehind s variabilní délkou" a defakto dělá to co jsem popsal. Vyhledává mezery, pomocí lookbehind před mezerou hledá text, který začíná zavináčem a následuje libovolný počet libovolných znaků. Tj mezera před zavináčem (v obecném textu) to nesplňuje a nebude vybrána k nahrazení. Jediný problém tohoto je, že není moc regex enginů, které podporují lookbehind s variabilní délkou. Co vím tak to podporuje regex engine v .NET Frameworku a pak nejspíš Javascriptový engine (ale tam taky nevím zda to umí všechny prohlížeče). Co za regex engine používá Notepad++ netuším a nevím zda to tam bude fungovat.

Souhlasím | Nesouhlasím

Alois Novák (checheche)

08. 01. 2020 18:27 |

Díky za skvělou odpověď!Notepad++ to sice nepodporuje. Ale překvapila mě částečná podpora (Chromium a deriváty viz https://caniuse.com/ ) v Javascriptu.

Howg

Souhlasím | Nesouhlasím

albi · Accepted Answer · 2020-01-07T07:49:47Z

albi | 07. 01. 2020 08:49 |

A není jednodušší obecný text nechat v Excelu podle mezer a lomítek nasekat do sloupců a uložit jako .txt. Položky tak rovnou zůstanou oddělené tabelátory.

Souhlasím | Nesouhlasím

Regulární výraz - nahrazení mezer v části textu

Mohlo by vás také zajímat

Odpovědi na otázku

{{values.title}}

Doporučujeme

Dubnový Computer

O webu

Kdy se vyplatí soundbar a kdy domácí kino. Jak vybrat správné ozvučení televizoru

Proč si předplatit Netflix? Třeba kvůli těmto seriálům. Všechny mají dabing nebo české titulky

FOTO: Krásky z bazénů. Simona Baumrtová a 22 dalších nejhezčích (ex)plavkyň světa

Chystá se bitka za dobrou věc. Krev bude cedit i bodyguard od Pavla.

Probuďme se! Nejsme ochotni si připustit hrozby a podceňujeme je, varuje bývalý zpravodajec a diplomat

Hodina dějepichu: Válčilo se už kvůli zatoulanému psovi, croissantům i vážně pěknýmu kyblíku

Chcete rozbít ChatGPT? Stačí zadat jediné slovo. Matematici kroutí hlavou, jak je to možné

Zapomeňte na Gmail, Outlook.com nebo Seznam. Těchto 6 alternativ s e-mailem pracuje jinak

Takřka dvojnásobný dojezd. Skotská firma uvádí powerbanky pro elektrické dodávky

Vzácné SUV Monteverdi Sahara je na prodej. Předběhlo dobu a dnes stojí pakatel

Regulární výraz - nahrazení mezer v části textu

Mohlo by vás také zajímat

Odpovědi na otázku

Doporučujeme

O webu

Nastavte si přezdívku