c# 如何操作excel文件

推荐 EPPlus(.NET 5+,纯托管、无 Office 依赖);次选 NPOI(兼容 .xls/.xlsx,但 API 底层);避免 Interop(需本地 Office,不稳定)和 OleDb(限制多、易失败)。

Microsoft.Office.Interop.Excel 读写 Excel(需本地装 Office)

这是最直觉的方式,但依赖 Windows + 已安装的 Excel 应用程序,不适合服务器环境或 CI/CD。调用的是 Excel 的 COM 接口,容易因 Excel 进程残留、权限、弹窗提示(如启用宏警告)导致脚本卡死或报错。

常见错误现象:COMException: 拒绝访问HRESULT: 0x800A03EC、后台残留 EXCEL.EXE 进程。

  • 必须用 try/finally 确保 Quit()Marshal.ReleaseComObject() 调用,否则 Excel 进程不退出
  • 禁用交互:设置 app.DisplayAlerts = falseapp.Visible = false
  • 避免使用 Range["A1"] 这类索引器(性能差且易触发 COM 封送),改用 Cells[row, col] 或明确的 Range 对象
  • 不推荐在 ASP.NET 或 Windows Service 中使用 —— COM 交互在无桌面会话时极不稳定
var app = new Application();
app.Visible = false;
app.DisplayAlerts = false;
Workbook wb = app.Workbooks.Open(@"C:\data.xlsx");
Worksheet ws = wb.Sheets[1];
ws.Cells[1, 1].Value = "Hello";
wb.Save();
wb.Close();
app.Quit(); // 必须调用
// 然后逐个 Marshal.ReleaseComObject(ws), wb, app

EPPlus(.NET 5+ 推荐,纯托管,无需 Office)

目前最主流的免费方案(v6+ 需要商业许可;v5 及以前 MIT 开源)。它直接操作 Excel 文件的 OOXML 结构(即 .xlsx),速度快、无依赖、线程安全,适合 Web 后端和批量处理。

注意点:EPPlus 不支持 .xls(旧版二进制格式),也不支持 VBA、图表、某些高级样式(如条件格式部分特性)。

  • 安装包:Install-Package EPPlus -Version 5.9.2(选 v5.x 免费)
  • 必须调用 ExcelPackage.LicenseContext = LicenseContext.NonCommercial(开发/个人用途)或 Commercial(生产)
  • 读取时建议用 Load() + Worksheet.Cells["A1"].Value;写入优先用 worksheet.Cells[row, col].Value = ...
  • 大数据量写入时,避免逐单元格赋值;可用 worksheet.Cells["A1:D10000"].LoadFromDataTable(...) 批量导入
ExcelPackage.LicenseContext = LicenseContext.NonCommercial;
using var pck = new ExcelPackage(new FileInfo(@"C:\data.xlsx"));
var ws = pck.Workbook.Worksheets[0];
ws.Cells["A1"].Value = "ID";
ws.Cells["B1"].Value = "Name";
pck.Save();

NPOI 处理 .xls 和 .xlsx(Java POI 的 .NET 移植)

如果你必须兼容老系统导出的 .xls(Excel 97-2003),NPOI 是少数能稳定读写的免费库。它不依赖 Office,也无需商业授权,但 API 较底层,学习成本略高。

典型问题:HSSFWorkbook(.xls)和 XSSFWorkbook(.xlsx)不能混用;日期单元格读出来是 double,需手动转 DateTime;样式需显式创建,不能直接复制 Excel 原有样式。

  • 区分格式:读 .xls 用 new HSSFWorkbook(stream),读 .xlsx 用 new XSSFWorkbook(stream)
  • 写入日期前务必调用 workbook.CreateCellStyle().DataFormat = workbook.CreateDataFormat().GetFormat("yyyy-mm-dd")
  • 内存占用比 EPPlus 高,超 10 万行建议用流式写入(SXSSFWorkbook 对应的 XSSFSheet 流模式)
using var fs = new FileStream(@"C:\data.xls", FileMode.Open);
var wb = new HSSFWorkbook(fs); // 注意:不是 XSSFWorkbook
var sheet = wb.GetSheetAt(0);
var cell = sheet.GetRow(0)?.GetCell(0);
string value = cell?.ToString() ?? ""; // 注意空行/空单元格

为什么别用 OleDbConnection("Provider=Microsoft.ACE.OLEDB.12.0")

它看起来像数据库一样查 Excel(SELECT * FROM [Sheet1$]),但实际限制极多:只支持 Windows、需额外安装 Access Database Engine、32/64 位运行时必须严格匹配、无法写入受保护工作表、对合并单元格/空列解析不可靠,且连接字符串稍有拼错就抛 InvalidOperationException 或静默失败。

更麻烦的是:ACE 驱动不支持 .xlsx 中的公式结果缓存,常读到 #N/A 或空值;也没有办法控制精度(比如把 1.2345 读成 1.2344999999999999)。

  • 仅适用于一次性、小规模、格式极其规范的只读场景(例如导入配置表)
  • 连接字符串必须带 Extended Properties="Excel 12.0 Xml;HDR=YES;",少一个引号或空格就失败
  • 表名必须写成 [Sheet1$](含中括号和美元符),且 Sheet 名含空格时需双引号包裹:['My Data$']

真要读结构化数据,不如让前端导出为 CSV,后端用 StreamReader + TextFieldParser 更稳。