<meta http-equiv='pics-label' content='(pics-1.1 "http://www.icra.org/ratingsv02.html" comment "ICRAonline EN v2.0" l gen true for "http://interval.cz" r (nz 1 vz 1 lz 1 oz 1 cz 1) "http://www.rsac.org/ratingsv01.html" l gen true for "http://interval.cz" r (n 0 s 0 v 0 l 0))' />
<h2>Perl-compatible regulßrnφ v²razy v PHP - modifikßtory a lφnΘ kvantifikßtory</h2>
<p id='prepend'>V p°edchozφm Φlßnku jsme nakousli tΘma modifikßtor∙, a proto₧e modifikßtory jsou p°φliÜ velk²m soustem pro jeden Φlßnek, budeme v tomto tΘmatu pokraΦovat a ukß₧eme si dalÜφ Φty°i modifikßtory.</p>
<h3>"Single line"</h3>
<p>Jak jsem psal ji₧ <a href='http://interval.cz/clanek.asp?article=3758' title='Pecka, Miroslav: Perl-compatible regulßrnφ v²razy v PHP - zßkladnφ konstrukce'>v prvnφm Φlßnku</a>, metaznaku <samp>.</samp> (teΦka) odpovφdajφ vÜechny znaky krom∞ <samp>\n</samp>. Pokud je vÜak pou₧it modifikßtor "single line" (kter² mß ovÜem v PHP internφ oznaΦenφ "PCRE_DOTALL"), metaznak <samp>.</samp> bude odpovφdat i znaku konce °ßdku <samp>\n</samp>. Modifikßtor "single line" mß zkratku "s".</p>
<h3>"Extended" aneb komentß°e v regulßrnφch v²razech</h3>
<p>Pokud pou₧ijeme modifikßtor "extended" (kter² mß zkratku "x"), zp∙sobφ to dv∞ zm∞ny ve vyhodnocovßnφ regulßrnφho v²razu:</p>
<ol>
<li>TakzvanΘ "bφlΘ znaky" v regulßrnφm v²razu budou ignorovßny, s v²jimkou bφl²ch znak∙ zapsan²ch v rßmci skupiny znak∙ a s v²jimkou p°φpadu, kdy bφlΘmu znaku bude p°edchßzet zp∞tnΘ lomφtko <samp>\</samp>.</li>
<li>╚ßst regulßrnφho v²razu vpravo od znaku <samp>#</samp> a₧ po znak konce °ßdku <samp>\n</samp> (vΦetn∞) bude ignorovßna. To umo₧≥uje vklßdat ve slo₧it²ch regulßrnφch v²razech komentß°e za znak <samp>#</samp>.</li>
</ol>
<p>Pou₧itφ p°edvedu op∞t na ukßzce:</p>
<div class='sample'>
$re="/^ ah\n\toj$#m∙j vlastnφ komentß°/x";
<br />$str="ahoj";
<br />preg_match($re,$str); //vrßtφ int(1), tedy shodu
</div>
<p>V uvedenΘm regulßrnφm v²razu jsou obsa₧eny jak bφlΘ znaky <samp> </samp> (mezera), <samp>\n</samp>, <samp>\t</samp>, tak i text komentß°e (<samp>#m∙j vlastnφ komentß°</samp>), kter² bude zcela ignorovßn.</p>
<p>Modifikßtor se zkratkou "e" (odvozeno od "evaluate", anglicky "vyhodnotit") m∙₧e b²t pou₧it pouze v regulßrnφch v²razech, kterΘ jsou argumentem funkce <code>preg_replace()</code> (respektive jinde je jeho pou₧itφ ignorovßno). Pou₧ijeme-li tento modifikßtor, °et∞zec obsahujφcφ "text nßhrady" (v naÜich p°φkladech jsme pro n∞j pou₧φvali prom∞nnou <samp>$replacement</samp>) bude vyhodnocen jako PHP k≤d. Pou₧itφ si ukß₧eme na p°φkladu, kdy bude naÜφm cφlem p°evΘst vÜechny HTML tagy na malß pφsmena (pozor, pouze tagy, nikoli atributy).</p>
<p>V²sledkem (obsahem prom∞nnΘ <samp>$result</samp>) pak je HTML k≤d:</p>
<div class='sample'>
<h1>Nadpis</h1>
<br /><p>Text1</p>
<br /><p>Text1</p>
</div>
<p>VÜimn∞te si, ₧e krom∞ modifikßtoru "e" jsme pou₧ili i modifikßtor "i" (case insensitive). Jak vidφte, modifikßtory lze tedy kombinovat. StaΦφ je zapsat za sebou za koncov² odd∞lovaΦ <samp>/</samp> (na po°adφ zßpisu modifikßtor∙ p°itom nezßle₧φ).</p>
<p>Regulßrnφmu v²razu v prom∞nnΘ <samp>$re</samp> odpovφdajφ otevφracφ i uzavφracφ (p°φpadn∞ nepßrovΘ) HTML tagy (s i bez atribut∙). V²raz je slo₧en ze t°φ subv²raz∙. Prvnφmu subv²razu odpovφdß <samp><</samp> (otvφracφ tag) nebo <samp></</samp> (uzavφracφ tag). DruhΘmu subv²razu odpovφdß sekvence znak∙ a-z (respektive A-Z, proto₧e je pou₧it modifikßtor "i"), kterß p°edstavuje tag samotn². T°etφmu subv²razu odpovφdß sekvence tΘm∞° libovoln²ch znak∙ (vÜe krom∞ znaku <samp>></samp>) nßsledovanß znakem <samp>></samp>.</p>
<p>Jak jste si asi vÜimli, tento p°φklad nenφ nepodobn² p°φkladu Φφslo 3 z p°edchozφho Φlßnku. V tomto p°φpad∞ vÜak zpracujeme °et∞zec p°edstavovan² zp∞tnou referencφ na druh² subv²raz (<samp>\\2</samp>) pomocφ PHP funkce <code>strtolower()</code>, kterß p°evßdφ °et∞zec na malß pφsmena. Proto₧e je nynφ (kv∙li modifikßtoru "e") °et∞zec v prom∞nnΘ <samp>$replacement</samp> vyhodnocovßn jako PHP k≤d, musφ b²t zp∞tnΘ reference <samp>\\1</samp> a <samp>\\3</samp> uzav°eny (jako₧to °et∞zce) do jednoduch²ch uvozovek a spojeny s dalÜφmi °et∞zci (respektive °et∞zcem vracejφcφm volßnφ funkce <samp>strtolower('\\2')</samp>) pomocφ b∞₧nΘho PHP operßtoru pro spojovßnφ °et∞zc∙ (<samp>.</samp> - teΦka).</p>
<h3>Kvantifikßtory podruhΘ - "lenost" kontra "nenasytnost"</h3>
<p>Ji₧ v prvnφm Φlßnku jsme si uvedli seznam vÜech kvantifikßtor∙ a doposud jsme p°edpoklßdali, ₧e se bude kvantifikßtor sna₧it "poz°φt" co mo₧nß nejdelÜφ °et∞zec. Tedy nap°φklad, kdy₧ porovnßme °et∞zec <samp>abbb</samp> s regulßrnφm v²razem <samp>^a(b+)</samp>, pak prvnφmu subv²razu bude odpovφdat °et∞zec <samp>bbb</samp>. Dan² regulßrnφ v²raz by se samoz°ejm∞ "spokojil" (p°esn∞ji °eΦeno "by odpovφdal") i s °et∞zcem <samp>ab</samp>, mß-li vÜak k dispozici delÜφ °et∞zec, pou₧ije nejdelÜφ mo₧nou variantu, kterß jeÜt∞ vede ke shod∞. Proto °φkßme, ₧e kvantifikßtory jsou standardn∞ "nenasytnΘ" (greedy).</p>
<p>Pomocφ "ungreedy" modifikßtoru (kter² mß zkratku "U" a v PHP internφ oznaΦenφ "PCRE_UNGREEDY") je mo₧no p°epnout chovßnφ kvantifikßtor∙ z "nenasytnΘho" na "lφnΘ" (lazy). Pokud se budou kvantifikßtory chovat lφn∞, bude se kvantifikßtor sna₧it "poz°φt" minimßlnφ poΦet znak∙, kterΘ jsou t°eba, aby °et∞zec odpovφdal regulßrnφmu v²razu. Pokud pou₧ijeme (v "ungreedy" m≤du) op∞t °et∞zec <samp>abbb</samp> a regulßrnφ v²raz <samp>^a(b+)</samp>, prvnφmu subv²razu bude odpovφdat jednoznakov² °et∞zec <samp>b</samp>. Zbytek °et∞zce bude ignorovßn (nep°ehlΘdn∞te, ₧e je pou₧ito pouze ukotvenφ za zaΦßtku pomocφ <samp>^</samp> - vpravo od prvnφho v²skytu <samp>b</samp> a₧ do konce °et∞zce tak m∙₧e b²t cokoli).</p>
<p>Modifikßtor "U" zapne "lφnΘ" chovßnφ kvantifikßtor∙ globßln∞ pro cel² v²raz. Je vÜak takΘ mo₧nΘ, aby "zleniv∞ly" jen vybranΘ kvantifikßtory v °et∞zci. Ka₧d² konkrΘtnφ kvantifikßtor, kter² mß "zleniv∞t", musφ b²t bezprost°edn∞ nßsledovßn otaznφkem (<samp>?</samp>).</p>
<p>Mφsto kvantifikßtor∙ <samp>?</samp>, <samp>*</samp>, <samp>+</samp>, <samp>{<em>m</em>,<em>n</em>}</samp>, <samp>{<em>m</em>,}</samp> (kde <em>m</em> je minimßlnφ poΦet v²skyt∙ a <em>n</em> je maximßlnφ poΦet v²skyt∙ - vφce viz prvnφ Φlßnek), m∙₧eme pou₧φt jejich lφnΘ varianty <samp>??</samp>, <samp>*?</samp>, <samp>+?</samp>, <samp>{<em>m</em>,<em>n</em>}?</samp>, <samp>{<em>m</em>,}?</samp>. </p>
<p>Nßsledujφcφ tabulka nßzorn∞ ukazuje rozdφly v chovßnφ "nenasytn²ch" a "lφn²ch" kvantifikßtor∙, respektive jakß Φßst z modelovΘho °et∞zce <samp>bbbbbb</samp> bude odpovφdat (vytvß°et shodu) jednotliv²m regulßrnφm v²raz∙m.</p>
<div class='table'>
<table cellspacing='0'>
<tr><th>Regulßrnφ v²raz</th><th>Shoda</th></tr>
<tr><td>b?</td><td>b</td></tr>
<tr><td>b??</td><td>(prßzdn² °et∞zec)</td></tr>
<tr><td>b*</td><td>bbbbbb</td></tr>
<tr><td>b*?</td><td>(prßzdn² °et∞zec)</td></tr>
<tr><td>b+</td><td>bbbbbb</td></tr>
<tr><td>b+?</td><td>b</td></tr>
<tr><td>b{2, 4}</td><td>bbbb</td></tr>
<tr><td>b{2, 4}?</td><td>bb</td></tr>
<tr><td>b{3,}</td><td>bbbbbb</td></tr>
<tr><td>b{3,}?</td><td>bbb</td></tr>
<tr><td>b{5}</td><td>bbbbb</td></tr>
</table>
</div>
<p>Dopl≥me jeÜt∞, ₧e pokud je pomocφ modifikßtoru "U" zapnuta globßlnφ "lenost", p°idßnφm otaznφku za konkrΘtnφ kvantifikßtor se jeho (lokßlnφ) chovßnφ p°epne na "nenasytnΘ".</p>
<div class='page-right-box reading'><h3 title='NejΦten∞jÜφ Φlßnky za poslednφch 14 dn∙'>NejΦten∞jÜφ</h3><div class='page-right-box-in'><ul><li><a href='http://interval.cz/__redirect/redirect.asp?what=interval_offline&url=http://interval.cz/clanek.asp?article=3829'>Interval.cz a jeho Φtenß°i v roce 2005</a></li><li><a href='http://interval.cz/__redirect/redirect.asp?what=interval_offline&url=http://interval.cz/clanek.asp?article=3830'>Pou₧φvßme nßvrhovΘ vzory v .NET - Singleton</a></li><li><a href='http://interval.cz/__redirect/redirect.asp?what=interval_offline&url=http://interval.cz/clanek.asp?article=3827'>SUN Java Studio Creator</a></li><li><a href='http://interval.cz/__redirect/redirect.asp?what=interval_offline&url=http://interval.cz/clanek.asp?article=3824'>Perl-compatible regulßrnφ v²razy v PHP - modifikßtory a lφnΘ kvantifikßtory</a></li><li><a href='http://interval.cz/__redirect/redirect.asp?what=interval_offline&url=http://interval.cz/clanek.asp?article=3831'>GNU Gettext - sprßva p°eklad∙</a></li></ul></div></div><div class='page-right-box cauldron'><h3 title='Nejdiskutovan∞jÜφ Φlßnky za poslednφch 21 dn∙'>Diskuznφ kotel</h3><div class='page-right-box-in'><ul><li><a href='http://interval.cz/__redirect/redirect.asp?what=interval_offline&url=http://interval.cz/clanek.asp?article=3818' title='(36 komentß°∙)'>PHP a MS SQL - vklßdßnφ a naΦφtßnφ soubor∙</a></li><li><a href='http://interval.cz/__redirect/redirect.asp?what=interval_offline&url=http://interval.cz/clanek.asp?article=3811' title='(26 komentß°∙)'>GNU Gettext - prvnφ kroky</a></li><li><a href='http://interval.cz/__redirect/redirect.asp?what=interval_offline&url=http://interval.cz/clanek.asp?article=3829' title='(20 komentß°∙)'>Interval.cz a jeho Φtenß°i v roce 2005</a></li><li><a href='http://interval.cz/__redirect/redirect.asp?what=interval_offline&url=http://interval.cz/clanek.asp?article=3815' title='(11 komentß°∙)'>H°φchy pro ÜφlenΘho korektora - jak se vyhnout zbyteΦn²m chybßm</a></li><li><a href='http://interval.cz/__redirect/redirect.asp?what=interval_offline&url=http://interval.cz/clanek.asp?article=3825' title='(11 komentß°∙)'>Ovlßdacφ prvok CAPTCHA v ASP.NET</a></li></ul></div></div>