电竞比分网-中国电竞赛事及体育赛事平台

分享

第14集參考資料

 第一資料收藏館 2014-02-24

詞庫軟件 的應(yīng)用

[正則表達式基本知識】


1.匹配單個單詞:\b單詞\b
 he→\bhe\b


2.將每行第一個字符刪除:^.→空
 行首:^
 任意單個字符:.


3.將每行第一個字母刪除:^[a-z]或^\l→空
 匹配范圍內(nèi)的字符:[ ]
 匹配單個字母:[a-z](可不區(qū)分大小寫)或\l(小寫)或\u(大寫)
 匹配數(shù)字:[0-9]或\d
 匹配中文:[\x{4e00}-\x{9fa5}]


4.將每行前兩個字母刪除:^\l{2}→空
 最少匹配n次,最多匹配m次:{n,m}
 匹配n次:{n}


5.將所有編碼刪除:^\l{1,4}_或^\l+_→空(“_”指空格)
 匹配1次或多次:+
 匹配0次或多次:*
 匹配0次或1次:?
 非貪婪模式:+?或*?或??或{n,m}?
 【貪婪模式】:在整個表達式匹配成功的前提下,盡可能多地匹配;
 【非貪婪模式】:在整個表達式匹配成功的前提下,盡可能少地匹配。


6.將所有空行刪除:^[_\t]*\n→空
 【空行】:含有零個或零個以上空格或制表符,不含其他字符的行)
 將行末的空格刪除:_+$→空(行末:$)
 換行符:\n


7.每行前面加兩個全角空格:^→(兩個全角空格)


8.轉(zhuǎn)義符
 匹配 ^$.*+?\ 等字符需要用轉(zhuǎn)義符:
 \^  \$  \.  \*  \+  \?  \\
 其他轉(zhuǎn)義符:\n換行 \t制表符


9.將前300字調(diào)整為每字一行:.→\0\n
 引用整個表達式:\0


10.將前300調(diào)整為每字一/兩行交替:(.{2})(.)→\1\n\2\n
 子表達式分組:( )
 引用第z個表達式(z=1,2,3...):\z


11.去掉詞庫中的生僻字
 ①~.→空(去掉生僻字)
?、?+$→空(去掉行末空格)
 ③^\l{1,4}\n(去掉純編碼行)

    本站是提供個人知識管理的網(wǎng)絡(luò)存儲空間,所有內(nèi)容均由用戶發(fā)布,不代表本站觀點。請注意甄別內(nèi)容中的聯(lián)系方式、誘導(dǎo)購買等信息,謹防詐騙。如發(fā)現(xiàn)有害或侵權(quán)內(nèi)容,請點擊一鍵舉報。
    轉(zhuǎn)藏 分享 獻花(0

    0條評論

    發(fā)表

    請遵守用戶 評論公約

    類似文章 更多