欢迎各位兄弟 发布技术文章

这里的技术是共享的

You are here

php分割中文字符串为数组的简单例子 有大用

近日在做东西时,遇到要把中文字符进行逐字分割,试了很多方法,都不行,后来发现了一个超简单的方法:

分割字符串很简单,主要是用到函数preg_match_all。
当处理含有中文的字符串时,可以用如下的方法:

 

  1. <?php  
  2.     $str = "hi钓鱼岛是中国的";  
  3.     preg_match_all("/./u"$str$arr);  
  4.     print_r($arr[0]);  
  5.     //by www.jbxue.com  
  6. ?>  

 

输出结果:
Array
(
[0] => h
[1] => i
[2] => 钓
[3] => 鱼
[4] => 岛
[5] => 是
[6] => 中
[7] => 国
[8] => 的
)

说明:模式修饰符u在php5中已完全支持。

例2,PHP分割中文字符串

将字符串“爱莲说”分割为“爱”,“莲”,“说”单个字。

使用到php函数preg_match_all。
示例:

 

  1. <?php  
  2. $str = "爱莲说";  
  3. preg_match_all('/[\x{4e00}-\x{9fa5}]/u',$str,$string);  
  4. dump($string);  
  5. //by www.jbxue.com  
  6. ?>  

 

输出结果:
 array
 0=>
 array
 0 =>string '爱'(length=3)
 1 =>string'莲'(length=3)
 2 =>string '说'(length=3)
这时,获取具体的某个字,即可通过数组获取。

有关使用php分割中英文字符串的方法,可以参考文章:php分割中英文字符串的几种方法

来自 
http://blog.csdn.net/jaray/article/details/52457062  http://www.jbxue.com/article/9999.html


php分割中英文字符串的几种方法

 
发布时间:2013-06-28编辑:脚本学堂
本文介绍下,php分割中英文字符串的方法,计算字符总长度,从左侧截取字符串,按给定文字切割字符串到数组中。有需要的朋友参考下吧。
 

对一段文字按照字数进行分割,因为文字中可能是中英文混合的,而php函数strlen只能计算出字串的字节数,于是自己实现了几个函数,分享下。

例1,计算字符总长度。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
<?php
function ccStrLen($str) #计算中英文混合字符串的长度
{
$ccLen=0;
$ascLen=strlen($str);
$ind=0;
$hasCC=ereg(”[xA1-xFE]“,$str); #判断是否有汉字
$hasAsc=ereg(”[x01-xA0]“,$str); #判断是否有ASCII字符
if($hasCC && !$hasAsc) #只有汉字的情况
return strlen($str)/2;
if(!$hasCC && $hasAsc) #只有Ascii字符的情况
return strlen($str);
for($ind=0;$ind<$ascLen;$ind++)
{
if(ord(substr($str,$ind,1))>0xa0)
{
$ccLen++;
$ind++;
}
else
{
$ccLen++;
}
}
return $ccLen;
}
?>

例2,从左侧截取字符串。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
<?php
function ccStrLeft($str,$len) #从左边截取中英文混合字符串
{
$ascLen=strlen($str); if($ascLen<=$len) return $str;
$hasCC=ereg(”[xA1-xFE]“,$str); #同上
$hasAsc=ereg(”[x01-xA0]“,$str);
if(!$hasCC) return substr($str,0,$len);
if(!$hasAsc)
if($len & 0×01) #如果长度是奇数
return substr($str,0,$len+$len-2);
else
return substr($str,0,$len+$len);
$cind=0;$flag=0;$reallen=0;//实际取字节长
while($cind<$ascLen && $reallen<$len)
{ //by www.jbxue.com
if(ord(substr($str,$cind,1))<0xA1){ //如果该字节为英文 则加一
$cind++;
}else{//否则 加2个字节
$cind+=2;
}
$reallen++;
}
return substr($str,0,$cind);
}
?>

例3,把给定文字,按切割数量存入数组(适合短篇文字,长文章可没分隔一部分就直接处理一次)

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
<?php
function SplitContent($content,$smslen){
$str_tmp=$content;
$arr_cont=array();
$len_tmp=0;
$i=0;//分割绝对位置
while (strlen($str_tmp)>0){
$str_tmp=ccStrLeft($str_tmp,$smslen);
array_push($arr_cont,$str_tmp);
$i+=strlen($str_tmp);
$str_tmp=substr($content,$i,strlen($content));
}
return $arr_cont;
} //by www.jbxue.com
?>

测试:

1
2
3
4
5
6
7
<?php
$str=’a计算中英文混合1234字符串的长度abcd’;
echo $str.’的长度为:’.ccStrLen($str);
echo ‘<br>’;
$smslen=3;//截取长度
print_r(SplitContent($str,$smslen));
?>

分割结果:
Array
(
[0] => a计算
[1] => 中英文
[2] => 混合1
[3] => 234
[4] => 字符串
[5] => 的长度
[6] => abc
[7] => d
)



来自  http://www.jbxue.com/article/9996.html


普通分类: