本書自第一版開始著力于教會讀者 “以正則表達式來思考”,來讓讀者真正“精通”正則表達式。該版對PHP的相關內(nèi)容、Java1.5和Java1.6的新特性作了可觀的擴充講解。任何有機會使用正則表達式的讀者都將因本書而受益匪淺。
目錄:
前言.
第1章:正則表達式入門 1
解決實際問題 2
作為編程語言的正則表達式 4
以文件名做類比 4
以語言做類比 5
正則表達式的知識框架 6
對于有部分經(jīng)驗的讀者 6
檢索文本文件:egrep 6
egrep元字符 8
行的起始和結束 8
字符組 9
用點號匹配任意字符 11
多選結構 13
忽略大小寫 14
單詞分界符 15
小結 16
可選項元素 17
其他量詞:重復出現(xiàn) 18
括號及反向引用 20
.神奇的轉義 22
基礎知識拓展 23
語言的差異 23
正則表達式的目標 23
更多的例子 23
正則表達式術語匯總 27
改進現(xiàn)狀 30
總結 32
一家之言 33
第2章:入門示例拓展 35
關于這些例子 36
perl簡短入門 37
使用正則表達式匹配文本 38
向更實用的程序前進 40
成功匹配的副作用 40
錯綜復雜的正則表達式 43
暫停片刻 49
使用正則表達式修改文本 50
例子:公函生成程序 50
舉例:修整股票價格 51
自動的編輯操作 53
處理郵件的小工具 53
用環(huán)視功能為數(shù)值添加逗號 59
text-to-html轉換 67
回到單詞重復問題 77
第3章:正則表達式的特性和流派概覽 83
在正則的世界中漫步 85
正則表達式的起源 85
最初印象 91
正則表達式的注意事項和處理方式 93
集成式處理 94
程序式處理和面向對象式處理 95
查找和替換 98
其他語言中的查找和替換 100
注意事項和處理方式:小結 101
字符串,字符編碼和匹配模式 101
作為正則表達式的字符串 101
字符編碼 105
正則模式和匹配模式 110
常用的元字符和特性 113
字符表示法 115
字符組及相關結構 118
錨點及其他“零長度斷言” 129
注釋和模式量詞 135
分組,捕獲,條件判斷和控制 137
高級話題引導 142
第4章:表達式的匹配原理 143
發(fā)動引擎 143
兩類引擎 144
新的標準 144
正則引擎的分類 145
幾句題外話 146
測試引擎的類型 146
匹配的基礎 147
關于范例 147
規(guī)則1:優(yōu)先選擇最左端的匹配結果 148
引擎的構造 149
規(guī)則2:標準量詞是匹配優(yōu)先的 151
表達式主導與文本主導 153
nfa引擎:表達式主導 153
dfa引擎:文本主導 155
第一想法:比較nfa與dfa 156
回溯 157
真實世界中的例子:面包屑 158
回溯的兩個要點 159
備用狀態(tài) 159
回溯與匹配優(yōu)先 162
關于匹配優(yōu)先和回溯的更多內(nèi)容 163
匹配優(yōu)先的問題 164
多字符“引文” 165
使用忽略優(yōu)先量詞 166
匹配優(yōu)先和忽略優(yōu)先都期望獲得匹配 167
匹配優(yōu)先、忽略優(yōu)先和回溯的要旨 168
占有優(yōu)先量詞和固化分組 169
占有優(yōu)先量詞,?+、*+、++和{m,n}+ 172
環(huán)視的回溯 173
多選結構也是匹配優(yōu)先的嗎 174
發(fā)掘有序多選結構的價值 175
nfa、dfa和posix 177
最左最長規(guī)則 177
posix和最左最長規(guī)則 178
速度和效率 179
小結:nfa與dfa的比較 180
總結 183
第5章:正則表達式實用技巧 185
正則表達式的平衡法則 186
若干簡單的例子 186
匹配連續(xù)行(續(xù)前) 186
匹配ip地址 187
處理文件名 190
匹配對稱的括號 193
防備不期望的匹配 194
匹配分隔符之內(nèi)的文本 196
了解數(shù)據(jù),做出假設 198
去除文本首尾的空白字符 199
html相關范例 200
匹配html tag 200
匹配html link 201
檢查http url 203
驗證主機名 203
在真實世界中提取url 206
擴展的例子 208
保持數(shù)據(jù)的協(xié)調(diào)性 209
解析csv文件 213
第6章:打造高效正則表達式 221
典型示例 222
稍加修改——先邁最好使的腿 223
效率vs準確性 223
繼續(xù)前進——限制匹配優(yōu)先的作用范圍 225
實測 226
全面考查回溯 228
posix nfa需要更多處理 229
無法匹配時必須進行的工作 230
看清楚一點 231
多選結構的代價可能很高 231
性能測試.. 232
理解測量對象 234
php測試 234
java測試 235
vb.net測試 237
ruby測試 238
python測試 238
tcl測試 239
常見優(yōu)化措施 240
有得必有失 240
優(yōu)化各有不同 241
正則表達式的應用原理 241
應用之前的優(yōu)化措施 242
通過傳動裝置進行優(yōu)化 246
優(yōu)化正則表達式本身 247
提高表達式速度的訣竅 252
常識性優(yōu)化 254
將文字文本獨立出來 255
將錨點獨立出來 256
忽略優(yōu)先還是匹配優(yōu)先?具體情況具體分析 256
拆分正則表達式 257
模擬開頭字符識別 258
使用固化分組和占有優(yōu)先量詞 259
主導引擎的匹配 260
消除循環(huán) 261
方法1:依據(jù)經(jīng)驗構建正則表達式 262
真正的“消除循環(huán)”解法 264
方法2:自頂向下的視角 266
方法3:匹配主機名 267
觀察 268
使用固化分組和占有優(yōu)先量詞 268
簡單的消除循環(huán)的例子 270
消除c語言注釋匹配的循環(huán) 272
流暢運轉的表達式 277
引導匹配的工具 277
引導良好的正則表達式速度很快 279
完工 281
總結:開動你的大腦 281
第7章:perl 283
作為語言組件的正則表達式 285
perl的長處 286
perl的短處 286
perl的正則流派 286
正則運算符和正則文字 288
正則文字的解析方式 292
正則修飾符 292
正則表達式相關的perl教義 293
表達式應用場合 294
動態(tài)作用域及正則匹配效應 295
匹配修改的特殊變量 299
qr/…/運算符與regex對象 303
構建和使用regex對象 303
探究regex對象 305
用regex對象提高效率 306
match運算符 306
match的正則運算元 307
指定目標運算元 308
match運算符的不同用途 309
迭代匹配:scalar context,不使用/g 312
match運算符與環(huán)境的關系 316
substitution運算符 318
運算元replacement 319
/e修飾符 319
應用場合與返回值 321
split運算符 321
split基礎知識 322
返回空元素 324
split中的特殊regex運算元 325
split中帶捕獲型括號的match運算元 326
巧用perl的專有特性 326
用動態(tài)正則表達式結構匹配嵌套結構 328
使用內(nèi)嵌代碼結構 331
在內(nèi)嵌代碼結構中使用local函數(shù) 335
關于內(nèi)嵌代碼和my變量的忠告 338
使用內(nèi)嵌代碼匹配嵌套結構 340
正則文字重載 341
正則文字重載的問題 344
模擬命名捕獲 344
效率 347
辦法不只一種 348
表達式編譯、/o修飾符、qr/···/和效率 348
理解“原文”副本 355
study函數(shù) 359
性能測試 360
正則表達式調(diào)試信息 361
結語 363
第8章:java 365
java的正則流派 366
java對\p{…}和\p{…}的支持 369
unicode行終結符 370
使用java.util.regex 371
the pattern.compile() factory 372
pattern的matcher方法 373
matcher對象 373
應用正則表達式 375
查詢匹配結果 376
簡單查找-替換 378
高級查找-替換 380
原地查找-替換 382
matcher的檢索范圍 384
方法鏈 389
構建掃描程序 389
matcher的其他方法 392
pattern的其他方法 394
pattern的split方法,單個參數(shù) 395
pattern的split方法,兩個參數(shù) 396
拓展示例 397
為image tag添加寬度和高度屬性 397
對于每個matcher,使用多個pattern校驗html 399
解析csv文檔 401
java版本差異 401
1.4.2和1.5.0之間的差異 402
1.5.0和1.6之間的差異 403
第9章:.net 405
.net的正則流派 406
對于流派的補充 409
使用.net正則表達式 413
正則表達式快速入門 413
包概覽 415
核心對象概覽 416
核心對象詳解 418
創(chuàng)建regex對象 419
使用regex對象 421
使用match對象 427
使用group對象 430
靜態(tài)“便捷”函數(shù) 431
正則表達式緩存 432
支持函數(shù) 432
.net高級話題 434
正則表達式裝配件 434
匹配嵌套結構 436
capture對象 437
第10章:php 439
php的正則流派 441
preg函數(shù)接口 443
“pattern”參數(shù) 444
preg函數(shù)羅列 449
preg_match 449
preg_match_all 453
preg_replace 458
preg_replace_callback 463
preg_split 465
preg_grep 469
preg_quote 470
“缺失”的preg函數(shù) 471
對未知的pattern參數(shù)進行語法檢查 474
對未知正則表達式進行語法檢查 475
遞歸的正則表達式 475
匹配嵌套括號內(nèi)的文本 475
不能回溯到遞歸調(diào)用之內(nèi) 477
匹配一組嵌套的括號 478
php效率 478
模式修飾符s:“研究” 478
擴展示例 480
用php解析csv 480
檢查tagged data的嵌套正確性 481
索引... 485