汉字转换成Unicode编码PHP程序
汉字转换成unicode方法
代码如下 |
复制代码 |
<?php
//将utf8编码的汉字转换为unicode
function htou($c){
$n = (ord($c[0]) & 0x1f) << 12;
$n = (ord($c[1]) & 0x3f) << 6;
$n = ord($c[2]) & 0x3f;
return $n;
}
//在代码中隐藏utf8格式的字符串
function my_utf8_unicode($str) {
$encode='';
for($i=0;$i<strlen($str);$i ){
if(ord(substr($str,$i,1))> 0xa0){
$encode.=''.htou(substr($str,$i,3)).';';
$i =2;
}else{
$encode.=''.ord($str[$i]).';';
}
}
return $encode;
}
echo my_utf8_unicode("哈哈ABC");
?>
|
汉字转换成unicode方法二
代码如下 |
复制代码 |
function getUnicode($word)
{
// 转UTF8
$word0 = iconv('gbk', 'utf-8', $word);
$word1 = iconv('utf-8', 'gbk', $word0);
$word = ($word1 == $word) ? $word0 : $word;
// 拆分汉字
preg_match_all('#(?:[x00-x7F]|[xC0-xFF][x80-xBF]+)#s', $word, $array, PREG_PATTERN_ORDER);
$return = array();
// 转换
foreach ($array[0] as $cc)
{
$arr = str_split($cc);
$bin_str = '';
foreach ($arr as $value)
{
$bin_str .= decbin(ord($value));
}
$bin_str = preg_replace('/^.{4}(.{4}).{2}(.{6}).{2}(.{6})$/','$1$2$3', $bin_str);
$return[] = '' . bindec($bin_str) . ';';
}
return implode('', $return);
}
|
函数用法:
代码如下 |
复制代码 |
$word = '一个汉字转换成Unicode四字节编码的PHP函数。';
echo getUnicode($word);
|
上述将输出如下结果:
一个汉字转换成Un
icode四字节编
码的PHP函数。
这一组函数可以将汉字转成unicode编码,也可以将unicode解码成汉字。
将汉字转成Unicode的函数:
代码如下 |
复制代码 |
function uni_encode ($word)
{
$word0 = iconv('gbk', 'utf-8', $word);
$word1 = iconv('utf-8', 'gbk', $word0);
$word = ($word1 == $word) ? $word0 : $word;
$word = json_encode($word);
$word = preg_replace_callback('/\\u(w{4})/', create_function('$hex', 'return ''.hexdec($hex[1]).';';'), substr($word, 1, strlen($word)-2));
return $word;
}
|
对Unicode编码进行解码的函数:
代码如下 |
复制代码 |
function uni_decode ($uncode)
{
$word = json_decode(preg_replace_callback('/(d{5});/', create_function('$dec', 'return '\u'.dechex($dec[1]);'), '"'.$uncode.'"'));
return $word;
}
|
补充:Php教程,Php常用代码