西西軟件下載最安全的下載網(wǎng)站、值得信賴的軟件下載站!

首頁編程開發(fā)javascript|JQuery → JS正則表達(dá)式的RegExp對象和括號(hào)的使用等需要注意的

JS正則表達(dá)式的RegExp對象和括號(hào)的使用等需要注意的

相關(guān)軟件相關(guān)文章發(fā)表評論 來源:西西整理時(shí)間:2013/4/11 17:23:48字體大。A-A+

作者:西西點(diǎn)擊:0次評論:0次標(biāo)簽: 正則表達(dá)式

  • 類型:電子教程大小:9.5M語言:中文 評分:7.5
  • 標(biāo)簽:
立即下載

RegExp對象的創(chuàng)建:

常規(guī)的正則表達(dá)式的創(chuàng)建可用直接量,即斜杠 “/” 括起來的字符。但在要求參數(shù)變化的環(huán)境下,RegExp()構(gòu)造函數(shù)是更好的選擇:

var reg1 = /'\w+'/g;
var reg2 = new RegExp('\'\\w+\'','g');

對比兩種創(chuàng)建方式,RegExp中的第一個(gè)參數(shù)為要?jiǎng)?chuàng)建的正則字符串,一方面注意,因?yàn)椴皇侵苯恿康谋硎拘问,因此不用斜杠?/ ”括起來了;而是字符串中必須要對引號(hào)“ ‘ ”和轉(zhuǎn)義符號(hào)“ \ ”進(jìn)行二次轉(zhuǎn)義。

此外,無論是直接量還是RegExp()構(gòu)造函數(shù),都是生成了新的RegExp對象,并將其賦值給變量。

在《Javascript權(quán)威指南》一書中講到,對于正則表達(dá)式的直接量,ECMAscript 3規(guī)定在每次它時(shí)都會(huì)返回同一個(gè)RegExp對象,因此用直接量創(chuàng)建的正則表達(dá)式的會(huì)共享一個(gè)實(shí)例。直到ECMAScript 5才規(guī)定每次返回不同的實(shí)例。

各瀏覽器中,IE一直遵守ECMAScript 5中的規(guī)定,其他瀏覽器的較老版本則遵循ECMAScript 3的規(guī)定。因此在實(shí)際應(yīng)用中,采取構(gòu)造函數(shù)創(chuàng)建的方法比較安全,或者在使用lastIndex屬性時(shí)要記得歸0。

括號(hào)()的使用:

1、分組

即把單獨(dú)項(xiàng)組合成子表達(dá)式統(tǒng)一處理,一般用于?、+、*、{n,m}等的重復(fù)處理。見例子:

var reg = /Java(script)?/;

式子里將script進(jìn)行統(tǒng)一處理。

2、向后引用

即在正則表達(dá)式中用“\n”(n代表引用的序號(hào))引用式中前面括號(hào)中匹配的文本。見例子:

var reg = /(\d+)[a-z]{3}\1/;    
//20man20
//20man23 錯(cuò)
//reg = /\1[a-z]{3}(\d+)/; 錯(cuò)

注意 “\n”引用的是前面匹配的文本" 20 ",而不是匹配的正則表達(dá)式" \d+ "。另外,JS里只能引用前面的匹配文本,像例子中的將 \1寫在括號(hào)引用的前面,將不會(huì)匹配到任何文本,瀏覽器中會(huì)提示出錯(cuò)。同樣,JS里也不支持類似“ (?<name>exp) ”(exp為正則字符)的引用命名規(guī)則,只支持?jǐn)?shù)字的引用。

既然提到了分組和引用,如果只想進(jìn)行分組,而不想引用,則可用 "(?: exp)"的形式,既不匹配文本,也不給引用編號(hào)。見例子:

var reg = /(\w{3})(?:\d+)([a-z]{2})\2/;
//man7788abab

顯然 \2 匹配的是 "ab" 而不是 "7788" 。這樣便于分組處理,也加快了查詢的效率。

3、子模式匹配

有時(shí)我們想直接引用操作括號(hào)匹配的本文,那么可以用子模式匹配的功能(權(quán)威指南里叫子模式匹配,有點(diǎn)別扭,實(shí)際就是用一個(gè)變量形式替換匹配的文本);拘问绞怯 ’$n’的形式替代匹配編號(hào)為n的文本,常用在String對象里的replace()方法,見例子,等號(hào)兩邊交換單詞:

var reg = /(\w+)=(\w+)/;
var str = ‘love=hate’;
str.replace(reg,'$2=$1');
//"hate=love"

次序、貪婪、懶惰:

一般的重復(fù)匹配字符如?、+、*、{n,m}在匹配的過程中,采用貪婪匹配的方法,即盡可能多的匹配到結(jié)果字符。與之對應(yīng)的是懶惰匹配,即盡可能少的匹配結(jié)果,使用形式只需在重復(fù)匹配字符后加上問號(hào)" ? "即可,如??、+?、*?、{n,m}?。見例子:

var str = 'goooogle‘;
var reg1 = /o+/;         //"goooo"
var reg2 = /o+?/;        //"go"
        

現(xiàn)在對例子稍加改動(dòng):

var str = 'goooogle‘;
var reg1 = /o+gle/;       //"oooogle"
var reg2 = /o+?gle/;      //"oooogle"

改過后的例子結(jié)果變?yōu)橄嗤,為什?/o+?gle/ 沒有匹配到“ogle”呢?原來正則表達(dá)式中總是從左往右進(jìn)行匹配的,不會(huì)從右邊獲取子串進(jìn)行匹配。

雖然上面的結(jié)果相同,但匹配的原理不太一樣。在reg1中,首先o+會(huì)匹配所有的"o",然后接著匹配"gle",從而完成整體匹配。而在reg2中,o+?會(huì)先匹配一個(gè)"o",然后gle在字符串的第2位到第4位(即原串的"ooo")匹配失敗。進(jìn)而回溯至o+?去匹配第二個(gè)"o",成功后再在第3位到第4位匹配"gle",以此類推……最后匹配到整個(gè)字符串。

總體要記住,從優(yōu)先級(jí)來說,從左往右的次序匹配 > 貪婪 / 懶惰匹配。

零寬斷言:

關(guān)于零寬斷言的總體解釋可參考博文《正則表達(dá)式30分鐘入門教程》,值得注意的是,JS里只支持零寬先行斷言。即零寬正預(yù)測先行斷言"(?=exp)"和零寬負(fù)預(yù)測先行斷言“(?!exp)"。

所謂“零寬”,就是它并不在匹配的結(jié)果字符中占據(jù)空間。例如“\w","\s"就會(huì)占據(jù)一個(gè)或幾個(gè)空間,依匹配的字符長度決定。而像”^","$"這種對應(yīng)的首末位置,不占據(jù)空間,零寬就是屬于這一類。

所謂“正 / 負(fù)預(yù)測”,是指斷言中要求滿足的情況!罢北硎疽獫M足exp,“負(fù)”表示要不滿足exp的。

所謂"先行",是指被匹配的字符串在前面,零寬斷言跟在后面。即串的后一部分是否滿足斷言。

所謂“斷言”,就是判斷的條件。

看兩種零寬斷言的例子:

var str = 'java coffeescript';
var reg1 = /\b\w+(?=script\b)/;    //coffee    
var reg2 = /\b\w+(?!script\b)/;    //java

reg1為零寬正預(yù)測先行斷言,"(?=script\b)"表示某單詞需以“script”結(jié)尾,它代表著一種條件,不占有任何空間大小。

同樣,reg2為零寬負(fù)預(yù)測先行斷言,"(?!script\b)"表示不以“script”結(jié)尾的單詞。

另外,因?yàn)闆]有零寬后顧斷言,不能判斷某字符串的前面部分滿足什么條件。但在JS中可以用多次正則表達(dá)式來實(shí)現(xiàn):先匹配到要找的串,然后截取開頭到index的字符子串,再匹配子串末尾是否符合需要的斷言條件。具體用法可另外嘗試一下。

match()與exec()的異同:

match和exec是正則表達(dá)式匹配字符串的常用方法。兩者實(shí)現(xiàn)的功能差不多,有些細(xì)微的區(qū)別:

1、使用方式

match是字符串包裝對象的方法,用法:String.match(RegExp);

exec是正則表達(dá)式對象的方法,用法:RegExp.exec(String);

2、返回的結(jié)果

當(dāng)RegExp沒有設(shè)置全局標(biāo)志 "g" 時(shí):

兩者的返回結(jié)果相同。即無匹配值時(shí)返回null,有匹配值時(shí)返回一個(gè)數(shù)組(令array)。array[0]為匹配的字符串,array[1]、array[2]……則對應(yīng)為正則表達(dá)式中圓括號(hào)匹配的子字符串$1、$2……。同時(shí)數(shù)組帶有兩個(gè)屬性,array.index表示匹配字符串的初始位置,array.input表示正在檢索的字符串。

當(dāng)RegExp有設(shè)置全局標(biāo)志 "g" 時(shí):

match在有值時(shí)返回一個(gè)數(shù)組array。數(shù)組的每項(xiàng)依次表示匹配到的所有的字符串,因此不再有圓括號(hào)匹配的子字符串了。此時(shí)數(shù)組沒有index屬性和input屬性。

exec則與沒有全局標(biāo)示 "g" 的表現(xiàn)無異。此時(shí)返回的是數(shù)組array,array[0]為當(dāng)前匹配的字符串,array[1],array[2]……則為當(dāng)前匹配下的圓括號(hào)匹配的字串。此時(shí)要注意RegExp對象的lastIndex屬性,表示原字符串中匹配的字符串末尾的后一個(gè)位置。當(dāng)沒有進(jìn)一步的匹配結(jié)果時(shí),lastIndex屬性置0。因此,可用lastIndex的循環(huán)找出所有的匹配字符串。來看看例子:

var str = 'I love1 my job22';

var reg = /\b[a-z]+(\d+)\b/g;

array = str.match(reg);
//array = ["love1", "job22"]    
//array.index = undefind
//array.input = undefined
------------------------------------
array = reg.exec(str);
//array = ["love1", "1"]
//array.index = 2
//array.input = "I love1 my job22"
//reg.lastIndex = 7

//run again
reg.exec(str);
//array = ["job22", "22"]
//array.index = 11
//array.input = "I love1 my job22"
//reg.lastIndex = 16
//run again
reg.exec(str);
//reg.lastIndex = 0

最后,考慮到ECMAScript 3 和ECMAScript 5的版本區(qū)別,每次匹配完之后記得要手動(dòng)將RegExp對象的lastIndex屬性置0,以滿足老非IE瀏覽器的要求。

    相關(guān)評論

    閱讀本文后您有什么感想? 已有人給出評價(jià)!

    • 8 喜歡喜歡
    • 3 頂
    • 1 難過難過
    • 5 囧
    • 3 圍觀圍觀
    • 2 無聊無聊

    熱門評論

    最新評論

    發(fā)表評論 查看所有評論(0)

    昵稱:
    表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
    字?jǐn)?shù): 0/500 (您的評論需要經(jīng)過審核才能顯示)
    推薦文章

    沒有數(shù)據(jù)