在之前的《nginx反代加替换傻瓜教程》,我提到了要用subs_filter模块替换中文,需要转换成utf-8编码。

当时演示的时候随便拿了一张notepad的图,其实那样保存是会出错的o(╯□╰)o

(当时教程所用的演示图)

后来有很多MJJ反映说提示错误信息,我试了一下,提示

nginx not runningnginx: [emerg] unknown directive "锘?erver" in /usr/local/nginx/conf/vhost/.conf:1
nginx already running.

这是因为Windows自带的记事本保存的utf-8编码带有BOM头。

在百科上看到

  类似WINDOWS自带的记事本等软件,在保存一个以UTF-8编码的文件时,会在文件开始的地方插入三个不可见的字符(0xEF 0xBB 0xBF,即BOM)。它是一串隐藏的字符,用于让记事本等编辑器识别这个文件是否以UTF-8编码。对于一般的文件,这样并不会产生什么麻烦。但对于 PHP来说,BOM是个大麻烦。

   PHP并不会忽略BOM,所以在读取、包含或者引用这些文件时,会把BOM作为该文件开头正文的一部分。根据嵌入式语言的特点,这串字符将被直接执行(显示)出来。由此造成即使页面的 top padding 设置为0,也无法让整个网页紧贴浏览器顶部,因为在html一开头有这3个字符呢!

干掉BOM头仅需一行代码:

(成功效果图)

类似Notepad++、editplus这样的编辑器,选择编码的时候会有一个UTF-8 Without BOM,以后修改编码就别用windows自带的记事本了!

   

已有 6 條評論

  1. test 12 年前 (2012-12-08)
    @

    test

  2. 花七七 12 年前 (2012-12-02)
    @

    sed不是只能替换字符的么= =还能转码啊? = =

    • 飛天鼠 12 年前 (2012-12-02)
      @

      – -没转码。。把BOM头替换了而已

  3. Zeraba 12 年前 (2012-10-14)
    @

    MJJ 好流弊 用sed

    • 飛天鼠 12 年前 (2012-10-15)
      @

      不行咩。。。。球帶