JS技巧:Javascript正則表達式基礎
當前位置:點晴教程→知識管理交流
→『 技術文檔交流 』
RegExp對象的語義和使用: 檢查字符串匹配 獲取字符串中的部分內容 在原字符串的基礎上構建一個新的字符串(包括添加、刪除和修改) 構建一個RegExp對象主要有兩種方法: 使用literal,如/\w/g 使用構造函數,如 new RegExp(/\w/) 構建RegExp對象有以下幾個注意點: literal常用來構建非runtime產生的靜態的RegExp對象 literal之后可以直接添加flag用來對匹配字符串的執行結果進行限制,常用flag包括g和i,分別用來表示全局匹配(global)和忽略大小寫匹配(case-insensitive) RegExp構造函數的第一個參數提供該對象的pattern,如果pattern是一個RegExp literal,那么就不能提供第二個參數(即指定flag)。如果pattern是一個string,那么可以使用第二個參數 RegExp構造函數常用于構建runtime產生的動態RegExp對象 RegExp的pattern為string時所有literal中的”\”都必須寫成”\\”,因為”\”在string中需要被轉義 以上兩種方法構建的都一個javascript對象,因此/\w/ == /\w/返回false RegExp對象相關的功能: 要檢查字符串的匹配,可以使用 regExp.test(string) 方法,該方法檢查string是否匹配regExp提供的pattern。還可以使用 string.search(regExp)方法,如果兩者不匹配將會返回-1 要獲取字符串中的部分內容,可以使用 regExp.exec(string) 方法,也可以使用string.match(regExp)方法 要在原有字符串上構建一個新的字符串,通常使用string.replace(searchValue, replaceValue)方法 RegExp對象中提供pattern的語義: RegExp可以定義多個Alternative用”|”分割,該運算的優先級最低,因此如果存在”|”,那么它首先把RegExp分割成幾大部分 每個Alternative由多個term組成,term分為assertion(用于位置限定),atom(匹配的單元),帶Quantifier(修飾符)的atom assertion分為”^”用于匹配字符串開頭,在multiInput(即flag包含m時),也可以匹配一行的開頭,”$”用于匹配字符串結尾,在multiInput(即flag包含m時),也可以匹配一行的結尾,”\b”用于匹配一個\w和\W間隔,注意它并不匹配任何字符串中的內容,而只是用來判斷一個位置的匹配情況 atom的情況比較復雜,我們首先來看atom的Quantifier,可以包含* + ? {n} {m,} {m,n},其中*表示atom可以有0次或以上的重復,+表示1次或以上的重復,?表示0或1次,{n}表示恰巧n次重復,{m,}表示m或以上的重復,{m,n}表示重復次數在m和n之間(包含m和n),在以上的Quantifier之后還可以跟一個?用來啟動non-greedy模式,我將在后文中說明這種模式的意義。 atom包含patternCharacter(普通字符,即在pattern中沒有特殊語義的字符,匹配時將按照字面進行匹配) “.” 匹配所有非line-terminator字符 \AtomEscape 包含數字型 \1(用于引用之前的括號中的匹配成功的內容)。一些字符的引用\n \f \r \t \v \xNN \uXXXX \cX等。一些特殊含義的字符,如\d \D \s \S \w \W CharacterClass,包含[...]和[^...]兩種形式。其中可以包含很多字符,如-、 \n等字符引用、\b、\d等特殊含義字符。注意如果”-”左右有字符,那么語義變為從某一字符到某一字符。如果”-”左或者右沒有字符,那么”-”僅表示dash字符。 (group),以上模式進行group就可以在group之后使用Quantifier修飾 (?:group),僅作為group使用,而不會記錄group匹配的內容從而不算在\1..\n中 (?=group),要求匹配但不會在返回的匹配string中包含group匹配的內容 (?!group),要求不匹配且不會在返回的匹配string中包含group匹配的內容 下面我要講一下RegExp的兩個比較重要的運作模式: 匹配Alternative總是從左到右,如果遇到第一個匹配的就不再嘗試之后的匹配,如 /ab|abc/.exec("abc") 以上字符串”abc”僅匹配pattern中的ab,而不會去匹配abc 匹配時總是一般不在Quantifier后添加?的都使用greedy模式,添加?后使用non-greedy模式,如 /\w+bc/.exec("abcbcbc") 匹配時\w+總是先盡可能多的匹配(即greedy模式),因此它會匹配”abcbcbc”,如果改為 /\w+?bc/.exec("abcbcbc") 那么他會盡可能少的匹配(即non-greedy模式),因此僅匹配”abc”。 對于一般的解析字符串的要求,一般可以使用exec或match方法解析,如果字符串很大那么往往需要使用循環結構進行解析,配合while等語句,RegExp是很強大的。 對于要將現有的一個字符串通過修改轉變為另一個字符串時,一般總是使用replace方法,這個方法是我覺得RegExp中最重要的方法,它的多態性使他具有多種形式,幾乎能夠滿足所有修改字符串的需求。
該文章在 2010/8/17 23:30:28 編輯過 |
關鍵字查詢
相關文章
正在查詢... |