PHP快速去除网页BOM属性 完美解决网页乱码等问题

这一段时间一直在对博客的主题进行优化和修改,力图把主题做到最好。这不昨天就遇到个问题,今天有时间就把这个问题给记录下来。

由于自己做的主题是基本uft-8编码方式来编写的,平时修改模版文件的时候懒的使用专门的网页编辑器,都是用windows自带的文本编辑器,所以导致一些乱码,或是网页带有BOM属性等问题。

BOM签名解释:

BOM 是 Byte Order Mark 的缩写。是UTF编码方案里用于标识编码的标准标记,在UTF-16里本来是FF FE,变成UTF-8就成了EF BB BF。这个标记是可选的,因为UTF8字节没有顺序,所以它可以被用来检测一个字节流是否是UTF-8编码的。

网页中的BOM签名:

在网页上使用BOM是个错误。BOM设计出来不是用来支持HTML和XML的。要识别文本编码,HTML有charset属性,XML有encoding属性,没必要拉BOM撑场面。虽然理论上BOM可以用来识别UTF-16编码的HTML页面,但实际工程上很少有人这么干。毕竟UTF-16这种编码连ASCII都双字节,实在不适用于做网页。

几个常出现的问题

1.网站打开空白

2.页面头部出现多余的空白,或网站源代码里头部出现多余的空白

3.网站出现乱码,如“锘�”等

解决方法:

1.选用专业的编辑器,例如notepad++,sublime,editplus这样不会自动签名。

2.sublime通过如下操作File -> Save with Encoding -> UTF-8保存后即可去除bom

3.notepad++选中格式 -> 以UTF-8格式编码 选项即可去除

批量解决方法:

如果网站中所有的或大部份文件需要去掉BOM签名的,一个文件一个文件的去操作就显得要麻烦很多。这不针对这种情况,有大神提供了以下代码。

把以上代码保存成一个PHP文件,并上传到网站服务器的根目录中,然后访问此文件。

运行结果如下图所示

以上代码可以检查网站的所有网页文件,是否含有BOM签名,如果有就会去掉此属性。

转载请注明出处:看飞碟 » PHP快速去除网页BOM属性 完美解决网页乱码等问题

赞 (0) 送糖

评论 0

评论前必须登录!

登陆 注册

可爱的来客!请作者吃颗糖吧

支付宝扫一扫打赏

微信扫一扫打赏

你好,我是Jeson