PCRE正则表达式匹配中文字符的问题

前一个汉字的后半个字节跟后一个汉字的前半个字节恰好是另一个汉字的GBK编码,造成正则表达式误匹配,请问有什么好的解决办法?

尖叫书生

赞同来自: fish

找到解决办法了 对识别结果的index判断一下是否是在汉字的边界即可

fish - Hadooper

赞同来自:

用什么语言写的代码做正则匹配?

尖叫书生

赞同来自:

C语言

fish - Hadooper

赞同来自:

用的regcomp跟regexec?

要回复问题请先登录注册