欢迎各位兄弟 发布技术文章

这里的技术是共享的

You are here

php 移除 utf-8 有签名 有大用 有大大用

本文主要为大家带来一篇用PHP去掉文件头的Unicode签名(BOM)方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧,希望能你帮助到大家。


废话不多说,直接上代码

<?php
//此文件用于快速测试UTF8编码的文件是不是加了BOM,并可自动移除
//By Bob Shen
$basedir="."; //修改此行为需要检测的目录,点表示当前目录
$auto=1; //是否自动移除发现的BOM信息。1为是,0为否。
//以下不用改动
if ($dh = opendir($basedir)) {
   
while (($file = readdir($dh)) !== false) {
       
if ($file!='.' && $file!='..' && !is_dir($basedir."/".$file)) echo "filename: $file ".checkBOM("$basedir/$file")." <br>";
   }
   
closedir($dh);
}
function checkBOM ($filename) {
   
$contents=file_get_contents($filename);
   
$charset[1]=substr($contents, 0, 1);
   
$charset[2]=substr($contents, 1, 1);
   
$charset[3]=substr($contents, 2, 1);
   
if (ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191) {
       
$rest=substr($contents, 3);
       rewrite (
$filename, $rest);
       
return true;
   }
   
else return ("BOM Not Found.");
}
function rewrite ($filename, $data) {
   
$filenum=fopen($filename,"w");
   
flock($filenum,LOCK_EX);
   
fwrite($filenum,$data);
   
fclose($filenum);
}
?>

来自 https://www.php.cn/php-weizijiaocheng-386764.html



php批量移除UTF-8代码中的BOM

在保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM)。它是一串隐藏的字符,用于让记事本等编辑器识别这个文件是否以UTF-8编码。对于一般的文件,这样并不会产生什么麻烦。但对于PHP文件来说,BOM的签名是个大麻烦。受COOKIE送出机制的限制,在这些文件开头已经有BOM的文件中,COOKIE无法送出(因为在COOKIE送出前PHP已经送出了文件头),所以登入和登出功能失效。一切依赖COOKIE、SESSION实现的功能全部无效。会造成使用PHP网页脚本,不能登入或者不能登出,页顶出现一条空白,页顶出现错误警告,其它不正常的情况。


一不小心让 ultraedit 写入了bom(因为我在别的机器上编辑过文件,他的ultraedit.ini没设置过),所以搞得authimage显示不出来,忙了好几天。当然最根本就是在ultraedit.ini中修改一下设置为:

程式碼:
Write UTF-8 BOM=0
Write UTF-8 BOM NF=0

同时写了一个小程序,用来自动移除文件头中的boms,放到根目录中执行一次就行了。 

程式碼:
<?php
if
(isset($_GET['dir'])){ //config the basedir
   
$basedir=$_GET['dir'];
}
else{
   
$basedir = '.';
}
$auto = 1;
checkdir(
$basedir);
function checkdir($basedir){
   
if ($dh = opendir($basedir)) {
       
while (($file = readdir($dh)) !== false) {
           
if ($file != '.' && $file != '..'){
               
if (!is_dir($basedir."/".$file)) {
                   
echo "filename: $basedir/$file ".checkBOM("$basedir/$file")." <br>";
               }
else{
                   
$dirname = $basedir."/".$file;
                   checkdir(
$dirname);
               }
           }
       }
       
closedir($dh);
   }
}
function checkBOM ($filename) {
   
global $auto;
   
$contents = file_get_contents($filename);
   
$charset[1] = substr($contents, 0, 1);
   
$charset[2] = substr($contents, 1, 1);
   
$charset[3] = substr($contents, 2, 1);
   
if (ord($charset[1]) == 239 && ord($charset[2]) == 187 && ord($charset[3]) == 191) {
       
if ($auto == 1) {
           
$rest = substr($contents, 3);
           rewrite (
$filename, $rest);
           
return ("<font color=red>BOM found, automatically removed.</font>");
       }
else {
           
return ("<font color=red>BOM found.</font>");
       }
   }
   
else return ("BOM Not Found.");
}
function rewrite ($filename, $data) {
   
$filenum = fopen($filename, "w");
   
flock($filenum, LOCK_EX);
   
fwrite($filenum, $data);
   
fclose($filenum);
}
?>


来自  https://blog.csdn.net/fly10spring/article/details/6996120

普通分类: