reklama

Staňte se programátorem: Tajemné regulární výrazy II.

V první části jsme se seznámili s regulárními výrazy, nyní se podíváme, jak s nimi lze pracovat v jazyku C#. Jak tedy vlastně funguje náš program na kontrolu regulárních výrazů?

V minulém díle jsme si ve stručnosti vysvětlili, co to jsou regulární výrazy, jaké skýtají možnosti a jakým způsobem je můžete efektivně využívat. V dnešním pokračování se podíváme na programovou implementaci v jazyce C#.


Jak na regex v C#

Pro práci s regulárními výrazy je v prostředí .NET vyhrazen speciální jmenný prostor System.Text.RegularExpressions. Samotný regulární výraz je realizovaný třídou Regex, která leží v tomto jmenném prostoru. Pro přiřazení regulárního výrazu třídě Regex musíme použít konstruktor. Pro vyhledání prvního shodujícího řetězce slouží metoda Match, která jako argument očekává text, ve kterém budete vyhledávat. Tato metoda vrací instanci třídy Match, která představuje nalezený podřetězec a některé další doplňující informace. Pro získání hodnoty slouží vlastnost Value. Může se stát, že metoda Regex.Match nic nevyhledá. V tomto případě bude instance třídy Match mít nastavenou vlastnost Success na hodnotu False.

Připadá vám to složité? Podívejte se na následující praktickou ukázku. Metoda níže vyhledá v textu sekvenci po sobě jdoucích čísel:

public void GetNumber(string text)
{
  Regex reg = new Regex(@"\d{1,}");
  Match shoda = reg.Match(text);
  if (shoda.Success)
  {
    Console.WriteLine("Nalezené číslo je: " + shoda.Value + “ na pozici “ + shoda.Index
                       +” o délce “ +shoda.Length);
  }
  else
    Console.WriteLine("V textu se nevyskutuje žádné číslo");
}

Všimněte si použitých vlastností Length a Index třídy Match. První z nich vrací délku nalezeného podřetězce a druhá pak pozici jeho prvního znaku.

Rozšířené volby vyhledávání

Pokud budete chtít nastavit přesnější způsob vyhledávání, je nutné použít vlastnosti RegexOptions třídy Regex a k ní přiřadit položku výčtového typu RegexOptions. Popis nejpoužívanějších položek uvádím v násldující tabulce:

Compiled Regulární výraz je přeložen „na tvrdo“ do aplikace, takže vyhledávání běží rychleji.
IgnoreCase Ignoruje velikost písmen.
MultiLine Poupraví výrazy ^ a $ tak, že vyhledávají na začátcích a koncích jednotlivých řádků textu.
RightToLeft Vyhledávání probíhá v textu zprava doleva.
SingleLine Poupraví význam znaku „.“ tak, že ignoruje nové řádky.

Vyhledávání více podřetězců

Pro vyhledání více podřetěců použijeme metodu Matches, která vrací kolekci typu MatchCollection. Ke zjištění počtu prvků této kolekce použijeme, stejně tak jako u jakékoli jiné kolekce, vlastnost Length. V našem programu tedy tuto metodu použijeme v případě, že zaškrtnete políčko „Vyhledat všechny vzory“. V opačném případě se použije první jednoduchá metoda, která naleze pouze první výskyt řetězce.

Klepněte pro větší obrázek
Hotový program spuštěný ve Windows

Regex reg = new Regex(@"\d{1,}");
MatchCollection shody = reg.Matches(text);
foreach (Match shoda in shody)
{
  if (shoda.Success)
  {
    Console.WriteLine("Nalezené číslo je: " + shoda.Value);
  }
  else
    Console.WriteLine("V textu se nevyskutuje žádné číslo");
}

Grafické zvýraznění textuv komponentě RichTextBox

K barevnému zvýraznění určitého textu v komponentě RichTextBox musíme řetězec vybrat pomocí metody Select a následně nastavit barvu vybraného záznamu pomocí vlastnosti SelectionColor. Poté je nutné výběr zrušit metodou DeselectAll a posunout kurzor. na konec.

Klepněte pro větší obrázek  Klepněte pro větší obrázek
Pokud si nainstalujete Mono, můžete EXE program spustit i na Mac OS X nebo na LInuxu

Regex reg = new Regex(textBox1.Text);
i Match match = reg.Match(this.richTextBox1.Text);
if (match.Success)
{
  // Vybere podřetězec vyhovující regulárnímu výrazu
  this.richTextBox1.Select(match.Index, match.Length);
  this.richTextBox1.SelectionColor = Color.Green;
}
richTextBox1.DeselectAll();
// Posune kurzor na konec
richTextBox1.SelectionStart = richTextBox1.Text.Length;

A to je vše. Nakonec si regulární výrazy můžete sami vyzkoušet, ke stažení totiž opět nabízíme zdrojové kódy včetně projektu pro Visual Studio 2008 (Express Edition) a spustitelný program jednoduchého testeru.

 

 


Mareš, Amadeo: 1001 tipů a triků pro C#

Klepněte pro větší obrázekNestačí vám náš seriál? Pořiďte si knihu jeho autora, ve které vás seznámí s tisícovkou programovacích tipů a technik.Díky velkému počtu tipů, návodů, triků a rad kniha poslouží při každé příležitosti. Kdykoli si nevíte rady, stačí nalistovat příslušnou stranu a problém okamžitě vyřešit. Tipy a triky míří především na začínající programátory; užitečné rady tu ovšem najdou i pokročilejší vývojáři a ostřílení znalci. SOučástí publikace je i přiložené DVD, na kterém najdete bezplatné vývojové prostředí Visual C#, databázový server a především všechny zdrojové kódy z knihy, takže je budete moci okamžitě použít.Webové stránky knihy.

Témata článku: Programování, Mozila, Match, Origin, Clip, 1001, Success

5 komentářů

Nejnovější komentáře

  • Tomáš Mareda 5. 10. 2009 22:56:49
    Trochu mne zarazila věta "Ke zjištění počtu prvků této kolekce použijeme,...
  • ricmat 2. 10. 2009 10:46:08
    Presne tak. Regexy jsou zde proto, ze poskytuji potrebny interface pro...
  • petrf 1. 10. 2009 16:49:54
    Primárně bych se držel čitelnosti RV. Rychlost zpracování je dána...
reklama
Určitě si přečtěte

Vybíráte herní periferii nebo hardware? Pak zapomeňte na nálepku Gaming

Vybíráte herní periferii nebo hardware? Pak zapomeňte na nálepku Gaming

** Herní hardware se od toho běžného často liší jen vzhledem ** Při výběru stále nezapomínejte na základní parametry ** Poradíme jak vybrat herní hardware i periferie

20.  2.  2017 | Stanislav Janů | 35

10 nejhorších produktů v historii Microsoftu

10 nejhorších produktů v historii Microsoftu

20.  2.  2017 | Karel Javůrek | 132

Pojďme programovat elektroniku: Žádný bastlíř se neobejde bez armády švábů

Pojďme programovat elektroniku: Žádný bastlíř se neobejde bez armády švábů

** Každý bastlíř se po čase neobjede bez armády švábů ** Dnes si některé z nich vyzkoušíme ** Třeba zázračný posuvný registr

19.  2.  2017 | Jakub Čížek | 39

AMD oficiálně představilo procesory Ryzen. Známe i jejich české ceny

AMD oficiálně představilo procesory Ryzen. Známe i jejich české ceny

** AMD uvedlo první tři procesory Ryzen 7 ** Všechny budou pracovat s osmi jádry a šestnácti vlákny ** Na pulty obchodů se dostanou už za týden

22.  2.  2017 | Stanislav Janů | 121

Vyhledávání ve Windows není dokonalé, zkuste to 5× jinak

Vyhledávání ve Windows není dokonalé, zkuste to 5× jinak

** V macOS funguje vyhledávání Spotlight, ve Windows podobně propracovaná funkce chybí ** Alternativy se zaměřují na rychlé hledání souborů i externí zdroje ** Mnohé mohou vyhledávání ve Windows kompletně nahradit

18.  2.  2017 | Stanislav Janů | 58

EU se děsí Windows 10. Prý o nás vědí až příliš. Microsoft chystá změny

EU se děsí Windows 10. Prý o nás vědí až příliš. Microsoft chystá změny

** Evropští úředníci chtějí, aby byly Desítky transparentnější ** Microsoft od jara skutečně chystá změny ** Ochráncům soukromí to ale nestačí

21.  2.  2017 | Jakub Čížek | 217


Aktuální číslo časopisu Computer

Stavba 3D tiskárny

Výbava domácí elektrodílničky

Budoucnost 5G sítí

Velké testy microSD karet a vodních chladičů

Přehled mobilních tarifů

reklama
reklama