c# 如何读写 csv 文件

用 TextFieldParser 读 CSV 更安全,它能正确处理含逗号、换行、引号的字段;写 CSV 需手动 RFC 4180 转义并加 BOM 才能被 Excel 正确识别。

TextFieldParser 读 CSV 更安全,别手写字符串分割

手动 Split(',') 会崩在带逗号、换行、引号的字段上(比如地址字段 "Beijing, China" 或多行备注)。.NET 自带的 Microsoft.VisualBasic.FileIO.TextFieldParser 能正确处理转义和引号包裹,即使项目是 C# 也能用——只需引用 Microsoft.VisualBasic 程序集(.NET Core/.NET 5+ 已内置,无需额外 NuGet)。

常见错误:漏掉 SetDelimiters(",") 或没设 HasFieldsEnclosedInQuotes = true,导致解析失败或字段错位。

  • 必须调用 parser.SetDelimiters(","),否则默认按制表符分隔
  • 含引号字段(如 "John ""The Boss"" Doe")需开启 HasFieldsEnclosedInQuotes = true
  • 遇到空行或注释行,检查 parser.CommentTokensparser.TextFieldType
using Microsoft.VisualBasic.FileIO;
// ...
using (var parser = new TextFieldParser("data.csv"))
{
    parser.SetDelimiters(",");
    parser.HasFieldsEnclosedInQuotes = true;
    while (!parser.EndOfData)
    {
        string[] fields = parser.ReadFields();
        Console.WriteLine(string.Join("|", fields));
    }
}

写 CSV 用 StreamWriter + 手动转义,别直接 WriteLine

没有内置“一键写 CSV”的 API。直接 sw.WriteLine(string.Join(",", values)) 在值含逗号、引号或换行时会破坏格式。必须对每个字段做 RFC 4180 兼容转义:字段含 ,"\n 时,用双引号包裹,并将内部引号替换成两个引号(""")。

性能提示:不要为每行都新建 StreamWriter;打开一次,循环写入。

  • 空字段或含特殊字符的字段必须加双引号
  • 字段内引号必须变成两个引号(不是反斜杠转义)
  • 避免用 Encoding.Default,显式指定 Encoding.UTF8 防止中文乱码
using (var sw = new StreamWriter("output.csv", false, Encoding.UTF8))
{
    foreach (var row in data)
    {
        var escaped = row.Select(field =>
        {
            if (string.IsNullOrEmpty(field) || field.IndexOfAny(new char[] { ',', '"', '\n', '\r' }) == -1)
                return field;
            return $"\"{field.Replace("\"", "\"\"")}\"";
        });
        sw.WriteLine(string.Join(",", escaped));
    }
}

第三方库选 CsvHelper,但注意配置陷阱

CsvHelper 是最常用的 C# CSV 库,支持类型映射、自动转义、自定义分隔符。但它默认不处理 BOM,且对 null 值、空字符串、日期格式敏感,容易导出后 Excel 打不开或数据错列。

典型问题:用 GetRecords() 读取时字段名大小写不匹配、类型转换失败抛异常;写入时没设 ShouldQuote 导致引号丢失。

  • 读取前务必调用 csv.Configuration.Delimiter = ","csv.Configuration.HasHeaderRecord = true
  • 写入时启用 BOM:new StreamWriter("out.csv", false, Encoding.UTF8)CsvWriter 不自动加)
  • 字段含换行符?确保 csv.Configuration.ShouldQuote = args => true 强制所有字段加引号

Excel 打不开 CSV?大概率是编码或 BOM 问题

Windows 上 Excel 默认用系统本地编码(如 GB2312)打开 CSV,UTF-8 无 BOM 的文件常显示乱码。这不是 CSV 格式错,而是编码声明缺失。

解决方法只有两个:要么保存为 UTF-8 with BOM,要么改用 ANSI 编码(不推荐,中文易损)。

  • 写文件时用 new UTF8Encoding(true)true 表示写 BOM)
  • 别依赖 Encoding.UTF8 默认构造函数——它不写 BOM
  • 用记事本另存为“UTF-8”时,实际写的是带 BOM 的 UTF-8;VS 或代码里不用这个构造,Excel 就认不出
var bomUtf8 = new UTF8Encoding(true); // 注意这个 true
using (var sw = new StreamWriter("excel-friendly.csv", false, bomUtf8))
{
    // ... 写内容
}

BOM 和字段转义是绝大多数人卡住的地方,不是语法不会,是不知道 Excel 和 RFC 对“合法 CSV”的要求比直觉严格得多。