2016年6月16日星期四

Perl : 正则匹配,字符边界,词语边界,长度拆分

见:
http://www.effectiveperlprogramming.com/2016/06/perl-v5-24-adds-a-line-break-word-boundary/

http://www.effectiveperlprogramming.com/2016/06/perl-v5-22-adds-fancy-unicode-word-boundaries/


s/(\x{50,70}\b{lb})/$1\n/g;  # 按 文本长度 折行

s/\b{sb}/#SB#/g;  #按 句子 拆分

s/\b{wb}/#WB#/g;  #按 词 拆分,比 \b 更智能些

m/(\X)/g;  # 与 . 不同的是,\X 支持unicode多字节的字符

split /\b{gcb}/, $string; # 与 \X 类似,但是相比上面 (\X) 捕捉模式,写起来更漂亮一点


没有评论:

发表评论