哪一天 哪一天 我有吃有穿有住有钱 不再流浪 流浪
« »
July 15, 2009程序设计

773 views

php正则判断中文字符

$str = “中国”;

//if (preg_match(“/^[".chr(0xa1)."-".chr(0xff)."]+$/”, $str)) { //只能在GB2312情况下使用
if (preg_match(“/^[\x7f-\xff]+$/”, $str)) { //兼容gb2312,utf-8
echo “正确输入”;
} else {
echo “错误输入”;
}

编码表

双字节字符编码范围

1. GBK (GB2312/GB18030)
\x00-\xff GBK双字节编码范围
\x20-\x7f ASCII
\xa1-\xff 中文 gb2312
\x80-\xff 中文 gbk

2. UTF-8 (Unicode)

\u4e00-\u9fa5 (中文)
\x3130-\x318F (韩文
\xAC00-\xD7A3 (韩文)
\u0800-\u4e00 (日文)

原文链接 http://www.web1357.cn/post/php_regex_chinese.html

相关日志

日志信息 »

该日志于2009-07-15 13:55由 admin 发表在程序设计分类下, 通告目前不可用,你可以至底部留下评论。

主机推荐 »

赞助商链接 »

2条评论

  1. gooss says:

    最好用mb_*系统函数处理多字节字符串。

    [回复]

  2. admin says:

    @gooss
    那个MB在这里不适用啦.

    [回复]

发表评论 »

返回顶部