Categories: Regulární výrazy

Regulární výrazy a JavaScript (3) – metody match() a split()

Jak už jsme si řekli v předchozím článku, objekt String disponuje celkem čtyřmi metodami sloužícími pro práci s regulárními výrazy. Metody search() a replace() již znáte, podívejme se tedy, co nám přinášejí zbývající dvě metody match() a split().

Zapisujeme ve tvaru řetězec.match(regexp), kde řetězec je text, v němž hledáme shodu s regulárním výrazem regexp. Funkce vrací pole. Obsah tohoto pole závisí na tom, zda regulární výraz obsahuje (respektive neobsahuje) modifikátor g a zda se tak provádí (respektive neprovádí) globální vyhledávání:

  • Pokud je modifikátor g nastaven, pole obsahuje všechny (pod)řetězce v řetězci, které odpovídají (celému) regulárnímu výrazu regexp. Pod indexem 0 je uložen první vyhovující (pod)řetězec, pod indexem 1 druhý (pod)řetězec a tak dále.
  • Pokud modifikátor g nastaven není, pole obsahuje v prvku s indexem 0 řetězec odpovídající celému regulárnímu výrazu a v dalších prvcích pole (s indexy 1, 2, 3 a dále) části řetězce odpovídající jednotlivým subvýrazům regulárního výrazu (za předpokladu, že regulární výraz má nějaké subvýrazy).

Z výše uvedeného plyne, že při globálním vyhledávání nelze získat části řetězce odpovídající subvýrazům regulárního výrazu. Tento problém je možno vyřešit pomocí metody exec() objektu RegExp, o níž budeme hovořit později.

Podívejme se nyní na příklady demonstrující rozdílné chování s použitím a bez použití modifikátoru g.

//match() – příklad 1

alert(„Globální vyhledávání“);

var str=“15 USD, 10 EUR, 300 CZK“;

var re1=/(\d+)\s(\w+)/g;

var result1=str.match(re1);

for(var i=0;result1[i];i++) alert(„[„+i+“]: „+result1[i]);

V tomto případě bude navrácené pole (indexované od nuly) obsahovat 15 USD, 10 EUR a 300 CZK.

//match() – příklad 2

alert(„Neglobální vyhledávání“);

var str=“15 USD, 10 EUR, 300 CZK“;

var re2=/(\d+)\s(\w+)/;

var result2=str.match(re2);

for(var i=0;result2[i];i++) alert(„[„+i+“]: „+result2[i]);

V tomto případě bude navrácené pole (indexované od nuly) obsahovat 15 USD, 15 a USD.

Malá poznámka – v obou příkladech (ukázkách) jsem pro zobrazení jednotlivých prvků pole použil for cyklus, kde proměnná i (inicializovaná na 0 a při každém průchodu inkrementovaná o jedničku) slouží k procházení polem shod (result1 respektive result2). Cyklus se provádí do té doby, dokud existuje prvek pole s příslušným indexem. Tento for cyklus budu pro výpis obsahu pole používat i v dalších příkladech.

Zapisujeme ve tvaru řetězec.split(regexp,limit), kde řetězec je text, který chceme rozdělit na části, přičemž jako oddělovač bude použita část řetězce odpovídající regulárnímu výrazu regexp. Nepovinný parametr limit udává maximální počet částí, na které bude řetězec rozdělen. Funkce vrací pole řetězců, které představují jednotlivé části. Pokud v řetězci nebyl nalezen žádný oddělovač odpovídající regexpu, v prvním prvku navráceného pole (s indexem nula) bude původní text řetězce (viz druhý příklad).

//split() – příklad 1

var str=“Jarda,Pavel; Honza Karel ,Pepa“;

var re1=/[ ,;]+/;

var result1=str.split(re1);

for(var i=0;result1[i];i++) alert(„[„+i+“]: „+result1[i]);

V udedeném příkladu může být jako oddělovač použita libovolná kombinace znaků (mezera), , (čárka) a ; (středník). Navrácené pole (indexované od nuly) pak bude obsahovat prvky Jarda, Pavel, Honza, Karel a Pepa.

//split() – příklad 2

var str=“Jarda,Pavel; Honza Karel ,Pepa“;

var re2=/@/;

var result2=str.split(re2);

for(var i=0;result2[i];i++) alert(„[„+i+“]: „+result2[i]);

V tomto případě (kde se jako oddělovač předpokládá pouze znak @) nebude řetězec str vůbec rozdělen a v result2[0] tak bude shodný text jako v str.

//split() – příklad 3

var str=“Jarda,Pavel; Honza Karel ,Pepa“;

var re3=/[ ,;]+/;

var result3=str.split(re3,3);

for(var i=0;result3[i];i++) alert(„[„+i+“]: „+result3[i]);

Třetí příklad se od prvního liší pouze tím, že byl použit výše zmíněný nepovinný parametr limit, který omezuje počet částí, jež se mají do výsledného pole uložit. Při v příkladu uvedeném limitu 3 se tak do pole result3 uloží jen Jarda, Pavel a Honza.

Veškeré zde uvedené příklady si můžete stáhnout a otestovat přímo ve svých prohlížečích, samozřejmě jen v případě, že podporují JavaScript a regulární výrazy.

Tento článek byl původně publikován na serveru Interval.cz, kde naleznete
originální verzi článku.
Miroslav Pecka

Share
Published by
Miroslav Pecka

Recent Posts

GA4 (not set) problém & jeho řešení

Jak se zbavit (not set) v Session Source a Session Medium?

2 roky ago

Měření QR kódů a offline zdrojů do Google Analytics

Chcete doměřit efekt vaší offline reklamy, ze které vedete lidi na váš web? Jde to…

2 roky ago

5+1 věcí, které se online markeťák může naučit od ajťáka

Tenhle článek jsem měl rozepsaný fakt dlouho, ale je stále aktuální… Trápí mě, že opakovaně…

4 roky ago

Profesionál v onlinu: řemeslo + kontext + přesahy

Poslední dobou jsem se setkal s pár majiteli malých firem, kteří mají web a snaží…

4 roky ago

Nástroje pro tvorbu screencast videí

Občas se mě někdo ptá, co používám pro tvorbu screencastů a online videí. Které nástroje…

4 roky ago

7 Google Analytics video návodů pro efektivnější práci

V rámci 5 videí najdete 7 krátkých video tipů pro zefektivnění práce s Google Analytics…

5 roky ago