如果使用 StreamWriter 创建的文本,都是默认带 BOM ,如果需要创建一个不带BOM的文件,请看本文。

因为有很多个编码,打开一个文件,很难判断这个文件是什么编码。所以微软就在文件的开始写入4个byte,来告诉程序这个文件是什么格式。需要知道,这个 BOM 是微软定义的,所以在很多的系统是没有 BOM 的,所以保存了一个 xml 文件,可以在其他系统读取就出错了,他们不知道 BOM 。

下面就来提供一个简单的方法创建不带 BOM 的文件。因为和编码有关系,所以只需要替换 StreamWriter 的编码就会好了,下面提供两个方法创建编码。

  Encoding utf8WithoutBom = new UTF8Encoding(false);
  Encoding isoLatin1Encoding = Encoding.GetEncoding("ISO-8859-1");

建议使用第一个方法,创建编码就可以开始写文件

下面是把 GBK 编码的文件读取然后转换为 UTF8 的代码,代码可以直接运行,当然需要修改文件为自己的文件。

       static void Main(string[] args)
        {
            var file = new FileInfo("E:\\博客\\创建不带BOM 的UTF8.txt");
            string str = "";
            using (StreamReader stream = new StreamReader(file.FullName, Encoding.GetEncoding("GBK")))
            {
                str = stream.ReadToEnd();
            }

           Encoding utf8WithoutBom = new UTF8Encoding(false);
            using (StreamWriter stream = new StreamWriter(file.FullName, false, utf8WithoutBom))
            {
                stream.Write(str);
            }
        }

参见:http://stackoverflow.com/questions/2502990/create-text-file-without-bom


本文会经常更新,请阅读原文: https://lindexi.gitee.io/lindexi/post/%E5%88%9B%E5%BB%BA%E4%B8%8D%E5%B8%A6BOM-%E7%9A%84UTF8.html ,以避免陈旧错误知识的误导,同时有更好的阅读体验。

知识共享许可协议 本作品采用 知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议 进行许可。欢迎转载、使用、重新发布,但务必保留文章署名林德熙(包含链接: https://lindexi.gitee.io ),不得用于商业目的,基于本文修改后的作品务必以相同的许可发布。如有任何疑问,请 与我联系