电竞比分网-中国电竞赛事及体育赛事平台

分享

preg_match 與 preg_match_all 函數(shù)

 昵稱10503611 2012-08-28

正則表達(dá)式在 PHP 中的應(yīng)用

在 PHP 應(yīng)用中,正則表達(dá)式主要用于:

  • 正則匹配:根據(jù)正則表達(dá)式匹配相應(yīng)的內(nèi)容
  • 正則替換:根據(jù)正則表達(dá)式匹配內(nèi)容并替換
  • 正則分割:根據(jù)正則表達(dá)式分割字符串

在 PHP 中有兩類正則表達(dá)式函數(shù),一類是 Perl 兼容正則表達(dá)式函數(shù),一類是 POSIX 擴(kuò)展正則表達(dá)式函數(shù)。二者差別不大,而且推薦使用Perl 兼容正則表達(dá)式函數(shù),因此下文都是以 Perl 兼容正則表達(dá)式函數(shù)為例子說明。

定界符

Perl 兼容模式的正則表達(dá)式函數(shù),其正則表達(dá)式需要寫在定界符中。任何不是字母、數(shù)字或反斜線()的字符都可以作為定界符,通常我們使用 / 作為定界符。具體使用見下面的例子。

提示

盡管正則表達(dá)式功能非常強(qiáng)大,但如果用普通字符串處理函數(shù)能完成的,就盡量不要用正則表達(dá)式函數(shù),因?yàn)檎齽t表達(dá)式效率會(huì)低得多。關(guān)于普通字符串處理函數(shù),請(qǐng)參見《PHP 字符串處理》。

preg_match()

preg_match() 函數(shù)用于進(jìn)行正則表達(dá)式匹配,成功返回 1 ,否則返回 0 。

語法:

int preg_match( string pattern, string subject [, array matches ] )
參數(shù)說明:
參數(shù) 說明
pattern 正則表達(dá)式
subject 需要匹配檢索的對(duì)象
matches 可選,存儲(chǔ)匹配結(jié)果的數(shù)組, $matches[0] 將包含與整個(gè)模式匹配的文本,$matches[1] 將包含與第一個(gè)捕獲的括號(hào)中的子模式所匹配的文本,以此類推

例子 1 :

<?php
if(preg_match("/php/i", "PHP is the web scripting language of choice.", $matches)){
    print "A match was found:". $matches[0];
} else {
    print "A match was not found.";
}
?>

瀏覽器輸出:

A match was found: PHP

在該例子中,由于使用了 i 修正符,因此會(huì)不區(qū)分大小寫去文本中匹配 php 。

提示

preg_match() 第一次匹配成功后就會(huì)停止匹配,如果要實(shí)現(xiàn)全部結(jié)果的匹配,即搜索到subject結(jié)尾處,則需使用 preg_match_all() 函數(shù)。

例子 2 ,從一個(gè) URL 中取得主機(jī)域名 :

<?php
// 從 URL 中取得主機(jī)名
preg_match("/^(http://)?([^/]+)/i","http://www./index.html", $matches);
$host = $matches[2];
// 從主機(jī)名中取得后面兩段
preg_match("/[^./]+.[^./]+$/", $host, $matches);
echo "域名為:{$matches[0]}";
?>

瀏覽器輸出:

域名為:

preg_match_all()

preg_match_all() 函數(shù)用于進(jìn)行正則表達(dá)式全局匹配,成功返回整個(gè)模式匹配的次數(shù)(可能為零),如果出錯(cuò)返回 FALSE 。

語法:

int preg_match_all( string pattern, string subject, array matches [, int flags ] ) 
參數(shù)說明:
參數(shù) 說明
pattern 正則表達(dá)式
subject 需要匹配檢索的對(duì)象
matches 存儲(chǔ)匹配結(jié)果的數(shù)組
flags

可選,指定匹配結(jié)果放入 matches 中的順序,可供選擇的標(biāo)記有:

  1. PREG_PATTERN_ORDER:默認(rèn),對(duì)結(jié)果排序使 $matches[0] 為全部模式匹配的數(shù)組,$matches[1] 為第一個(gè)括號(hào)中的子模式所匹配的字符串組成的數(shù)組,以此類推
  2. PREG_SET_ORDER:對(duì)結(jié)果排序使 $matches[0] 為第一組匹配項(xiàng)的數(shù)組,$matches[1] 為第二組匹配項(xiàng)的數(shù)組,以此類推
  3. PREG_OFFSET_CAPTURE:如果設(shè)定本標(biāo)記,對(duì)每個(gè)出現(xiàn)的匹配結(jié)果也同時(shí)返回其附屬的字符串偏移量

下面的例子演示了將文本中所有 <pre></pre> 標(biāo)簽內(nèi)的關(guān)鍵字(php)顯示為紅色。

<?php
$str = "<pre>學(xué)習(xí)php是一件快樂的事。</pre><pre>所有的phper需要共同努力!</pre>";
$kw = "php";
preg_match_all('/<pre>([sS]*?)</pre>/',$str,$mat);
for($i=0;$i<count($mat[0]);$i++){
    $mat[0][$i] = $mat[1][$i];
    $mat[0][$i] = str_replace($kw, '<span style="color:#ff0000">'.$kw.'</span>', $mat[0][$i]);
    $str = str_replace($mat[1][$i], $mat[0][$i], $str);
}
echo $str;
?>

正則匹配中文漢字

正則匹配中文漢字根據(jù)頁面編碼不同而略有區(qū)別:

  • GBK/GB2312編碼:[x80-xff>]+ 或 [xa1-xff]+
  • UTF-8編碼:[x{4e00}-x{9fa5}]+/u

例子:

<?php
$str = "學(xué)習(xí)php是一件快樂的事。";
preg_match_all("/[x80-xff]+/", $str, $match);
//UTF-8 使用:
//preg_match_all("/[x{4e00}-x{9fa5}]+/u", $str, $match);
print_r($match);
?>

輸出:

Array
(
    [0] => Array
        (
            [0] => 學(xué)習(xí)
            [1] => 是一件快樂的事。
        )
 
)

    本站是提供個(gè)人知識(shí)管理的網(wǎng)絡(luò)存儲(chǔ)空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點(diǎn)。請(qǐng)注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹(jǐn)防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請(qǐng)點(diǎn)擊一鍵舉報(bào)。
    轉(zhuǎn)藏 分享 獻(xiàn)花(0

    0條評(píng)論

    發(fā)表

    請(qǐng)遵守用戶 評(píng)論公約

    類似文章 更多