《怎樣使用PHP自動(dòng)檢測(cè)并移除UTF-8文件的BOM》要點(diǎn):
本文介紹了怎樣使用PHP自動(dòng)檢測(cè)并移除UTF-8文件的BOM,希望對(duì)您有用。如果有疑問,可以聯(lián)系我們。
相關(guān)主題:PHP開發(fā)
大家有沒有這樣的體驗(yàn):有時(shí)你看著文件是亂碼,但是已聲明或修改了頁面的編碼,但仍然是亂碼。
這時(shí),這個(gè)頁面存在BOM的可能性是很大。
什么是BOM?對(duì)于一些CMS或程序,需要在線自動(dòng)檢測(cè)BOM并清理,那要怎么做?
BOM信息是文件開頭的一串隱藏的字符,用于讓某些編輯器識(shí)別這是個(gè)UTF-8編碼的文件。
但PHP在讀取文件時(shí)會(huì)把這些字符讀出,從而形成了文件開頭含有一些無法識(shí)別的字符的問題。
比如用UTF-8格式保存的生成圖片的PHP文件,因?yàn)槲募^隱藏的BOM信息也被下發(fā),導(dǎo)致生成的圖片數(shù)據(jù)不對(duì),瀏覽器無法識(shí)別。
要檢測(cè)一個(gè)UTF-8文件是否含有BOM信息,就是檢測(cè)文件開頭的字三個(gè)符,是否為0xEF, 0xBB, 0xBF。下面這個(gè)小程序,用戶遍歷某個(gè)目錄下所有文件,并檢測(cè)是否加了BOM。
//此文件用于快速測(cè)試UTF8編碼的文件是不是加了BOM,并可自動(dòng)移除 $basedir="."; //修改此行為需要檢測(cè)的目錄,點(diǎn)表示當(dāng)前目錄 $auto=1; //是否自動(dòng)移除發(fā)現(xiàn)的BOM信息。1為是,0為否。 //以下不用改動(dòng) if ($dh = opendir($basedir)) { while (($file = readdir($dh)) !== false) { if ($file!='.' && $file!='..' && !is_dir($basedir."/".$file)) echo "filename: $file ".checkBOM("$basedir/$file").""; } closedir($dh); } function checkBOM ($filename) { global $auto; $contents=file_get_contents($filename); $charset[1]=substr($contents, 0, 1); $charset[2]=substr($contents, 1, 1); $charset[3]=substr($contents, 2, 1); if (ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191) { if ($auto==1) { $rest=substr($contents, 3); rewrite ($filename, $rest); return ("<span style="FONT-FAMILY: ; COLOR: red">BOM found, automatically removed.</span>"); } else { return ("<span style="FONT-FAMILY: ; COLOR: red">BOM found.</span>"); } } else return ("BOM Not Found."); } function rewrite ($filename, $data) { $filenum=fopen($filename,"w"); flock($filenum,LOCK_EX); fwrite($filenum,$data); fclose($filenum); } #以下這個(gè)函數(shù)常用: //清理UTF-8的BOM頭:檢測(cè)文件開頭的字三個(gè)符,是否為0xEF, 0xBB, 0xBF //$reCon = true 返回值是內(nèi)容,false是bool是否包含BOM function cleanBom($content,$reCon=true) { if(empty($content)) return $content; $charset[1]=substr($content, 0, 1); $charset[2]=substr($content, 1, 1); $charset[3]=substr($content, 2, 1); $cleanContent = false; if (ord($charset[1])==239 && ord($charset[2])==187 && ord($charset[3])==191) { $cleanContent = $reCon ? substr($content, 3) : true; } return $cleanContent; }
將以上代碼另存為 checkBOM.php,修改需要檢測(cè)的目錄后運(yùn)行。這樣可能有助于檢測(cè)是哪個(gè)文件帶有了BOM信息導(dǎo)致所有頁面開頭都有那么一段空白。
轉(zhuǎn)載請(qǐng)注明本頁網(wǎng)址:
http://www.snjht.com/jiaocheng/57.html