收集和分享一些常用的正则表达式
正则表达式怎么匹配非汉字非字母非数字之外的字符?
怎么匹配非汉字非字母非数字之外的字符
例如:ぴ●ОⅤ┏┓の等等这些乱七八的符号汉字的表示和正则表达式引擎相关,不同引擎的写法不同,下面的写法适用于java引擎,或者一切以unicode来表示字符的引擎。
1、基本规格——针对汉字的一般集合(cp936,约等于GBK,共计20000多汉字)
[^\dA-Za-z\u3007\u4E00-\u9FCB\uE815-\uE864]
2、扩充规格——针对多一些的汉字(支持CJK ExtA,共计接近30000汉字)
[^\dA-Za-z\u3007\u3400-\u4DB5\u4E00-\u9FCB\uE815-\uE864]
3、豪华规格——针对更多的汉字(支持CJK ExtB、C、......,共计75000多汉字)
(?![\dA-Za-z\u3007\u3400-\u4DB5\u4E00-\u9FCB\uE815-\uE864]|[\uD840-\uD87F][\uDC00-\uDFFF])----------------------------------------
正则表达式[\u4e00-\u9fa5]表示匹配中文,则正则表达式[^\u4e00-\u9fa5]匹配非中文。用Replace方法将匹配的非中文替换为空字符串,也就是去除了文本中的非中文字符。正则表达式:2-7个汉字,或4-14个字符(数字、字母和“_”)
2010-06-25 16:44提问者采纳
([\u4e00-\u9fa5]{2,7})|([A-Za-z0-9 ]{4,14})
其中([\u4e00-\u9fa5]{2,7})匹配2-7个汉字
([A-Za-z0-9 ]{4,14})匹配4-14个字符---------------------------------------------------
求正则表达式:要求匹配:字母,数字,下划线,汉字和双字节字符如题。要求匹配:字母,数字,下划线,汉字和双字节字符,并且下划线不能在第一位和最后一位
不对。双字节有问题
让我好找啊,特别是汉字匹配,给你了:^[^_][a-zA-Z0-9_\u4e00-\u9fa5][^_]$
如果是任意多个字符可在外面加限定符,如:
^[^_][a-zA-Z0-9_\u4e00-\u9fa5]*[^_]$
=====================================================求验证字母、数字、汉字、邮箱字符的正则表达式
我知道下面这个是验证字母、数字、邮箱的
pattern = /^[A-Za-z0-9_@.-]{4,20}$/;
查出验证汉字是 \u4e00-\u9fa5 ,怎样加加进去呢?我自己找到答案了
我这样写/^[A-Za-z0-9_@.\u4e00-\u9fa5]{4,20}$/<script type="text/javascript">
var pattern = /^[A-Za-z0-9_@.-]{4,20}$/;
alert(pattern .test('test@zhaoxi.net'));
//汉字同理
</script>