如何利用php来截取一段中文字符串而不出现乱码

2016-01-29 13:40 56 1 收藏

如何利用php来截取一段中文字符串而不出现乱码,如何利用php来截取一段中文字符串而不出现乱码

【 tulaoshi.com - PHP 】

作者:jeffwu(327wu@263.net)
[code:1:e818e36f81]
/*
功能:截取全角和半角混合的字符串以避免乱码
参数:
$str_cut 需要截断的字符串
$length  允许字符串显示的最大长度

*/

function substr_cut($str_cut,$length = 30){ 

if (strlen($str_cut) $length){
  for($i=0; $i < $length; $i++)
   if (ord($str_cut[$i]) 128) $i++;
  $str_cut = substr($str_cut,0,$i) . "...";
}
return $str_cut;
}

[/code:1:e818e36f81]
说明:
程序的关键语句是:
[code:1:e818e36f81]
for($i=0; $i < $length; $i++)
if (ord($str_cut[$i]) 128) $i++;

$str_cut = substr($str_cut,0,$i) . "...";
[/code:1:e818e36f81]
如果字符的ASCII码大于128,说明当前字符和下一个字符是属于一个汉字的。
则,$i++ 跳过对下一个字符的判断。
再结合循环中的 $i++ ,实际上,当遇到一个汉字时,$i 就会加 2 ,从而正确的跳过汉字。
最终实现的效果是,$i 变量指向的要么是半角的字符,要么是全角汉字的首字符,不会指向
全角汉字的第二个字符,所以,当$i = $length 时,循环结束,使用
$str_cut = substr($str_cut,0,$i) . "..."; 截取字符时自然也就不会出现乱码了。

(本文来源于图老师网站,更多请访问http://www.tulaoshi.com/php/)


本人在写一个程序时需要利用PHP从一段字符串中截取指定长度的一段字符下来。以前在写ASP的时候,参考动网的程序写过类似的程序,不过,还没用PHP写过。

想偷懒,看有不有现成的代码可以用。于是,在GOOGLE中输入:PHP 截断字符 后查找到一段代码。

全文:http://www.yesky.com/SoftChannel/72342371945349120/20020510/1610570_3.shtml

(本文来源于图老师网站,更多请访问http://www.tulaoshi.com/php/)

引用:
#########################################################################
  如何分别全角和半角以避免乱码? 

  我们可以写这样一个函数来实现: 
[code:1:e818e36f81]
function ChgTitle($title) 

$length = 46; //我们允许字符串显示的最大长度
if (strlen($title)>$length) { 
$temp = 0; 
for($i=0; $i<$length; $i++) 
if (ord($title[$i]) > 128) $temp++; 
if ($temp%2 == 0) 
$title = substr($title,0,$length)."..."; 
else 
$title = substr($title,0,$length+1)."..."; 

return $title; 
}  
[/code:1:e818e36f81]
  这个函数原理就是截断一个字符,看看其ascII码是不是大于128,如果是,说明截断的是一个全角汉字,那么就退后一个截断。用$length控制长度 

  备注:循环判断字符串里面的 >128 的字符个数,如果半角字符为偶数,则表示位置刚好为整个汉字,如果为奇数,则为半个汉字,需要取下一个字符

#######################################################################

消化、测试这段代码后发现有问题。经过反复调试,查找出,这段代码基于的原理不正确。
它认为,汉字的两个字节其ASCII码都会大于128,其实不然,一个汉字的首个字节的ASCII码
必定是大于128的,但是第二个字节的ASCII码不一定大于128,例如:"?",其两个字节的ASCII
码分别为:181 和 118。

经过仔细分析,最终,我利用上面的函数实现了对全角和半角字符串的截取。

一点点体会,写出来也是想和大家一起交流、学习。我不知道是不是有人已经写过上面的函数,不过,
我还没能读到,也就只能自己琢磨了,呵呵。

欢迎有兴趣的朋友来信交流。

 

来源:http://www.tulaoshi.com/n/20160129/1491022.html

延伸阅读
项目要求: 计算一个字符串的长度(对日项目VB.NET) 以前的代码找不到了只能自己写一下了(找到了别人的代码觉得有点麻烦,没用) String.prototype.isBytes = function() {  'var cArr = this.match(/[^x00-xff|uff61-uff9f]/ig); 'return (cArr==null ? true : false);} 上面这段代码是我在JAVA项目里找...
标签: Web开发
如何使用PHP中的字符串函数PHP中的字符串操作功能是比较多的,重要的有以下这些:    (1)echo,print,printf,sprintf    前两个函数是输出字符串.字符串中如果有变量名则被替换成其值.    后两个函数类似于C的同名函数.    (2)strchr,strlen,strtok,strrchr,strrev,strstr,strtolower,   ...
1、 代码如下: const char *str = "test测试test"; while(*str) { //这里只需要判断第一个字节大于0x80就行了,前提是输入的是合法的GBK字符串 //原因在于,如果第一个字节大于0x80,那么它必然和后面一个字节一起组成一个汉字 //所以就没有必要再去判断后面一个字节了 //再强调一下,前提条件是输入合法的GBK字符串 if(*str 0x80) { // 汉...
标签: Web开发
!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd" html xmlns="http://www.w3.org/1999/xhtml" head meta http-equiv="Content-Type" content="text/html; charset=gb2312" / titlecookie/title script src="http://jqueryjs.googlecode.com/files/jquery-1.3.2.min...
标签: ASP
以下是代码,呵呵,比较简单,主要是区分汉字和字母,不然一个全是字母,一个全是汉字的两条记录排列在一起时会比较难看,全字符的长度只有全汉字 的一半就显示...号了      public static string stringformat(string str,int n)               &...

经验教程

658

收藏

57
微博分享 QQ分享 QQ空间 手机页面 收藏网站 回到头部