前提
在Windows下进行数据处理的时候最常见的情况莫过于读取Microsoft的Excel文件了,Excel的普及率惊人,是事实上的标准。以前的开发中我采用调用第三方类库NPOI的方式来处理Excel。这个方式有两个缺点:
- 需要依赖第三方类库NPOI
- NPOI支持几乎全功能的Office条件,缺点就是复杂度也高。
如果只是简单的导入数据,完全可以有更加简单的方案,方案的限制条件为;
- 只支持Windows平台
- 只读取Excel文件
- 支持xls和xlsx文件格式
依赖
还是有依赖的2007 Office System Driver: Data Connectivity Components
如果没有安装Driver,你会得到以下的报错:
Microsoft.ACE.OLEDB.12.0' provider is not registered on the local machine
代码
public static DataTable ReadAsTable(string xlsxFile, string sheetName = "Sheet1")
{
var connectionString = string.Format("Provider=Microsoft.ACE.OLEDB.12.0;Data Source={0};Extended Properties=\"Excel 12.0;HDR=Yes;IMEX=1\"", xlsxFile);
var adapter = new OleDbDataAdapter($"SELECT * FROM [{sheetName}$]", connectionString);
var ds = new DataSet();
adapter.Fill(ds, sheetName);
return ds.Tables[sheetName];
}
在connectionString
中有两个Extended Properties可以根据需要进行修改:
- HDR,这个属性表示Excel的第一行是不是转换成DataTable的列名(Column Name)还是普通数据处理。
- IMEX,这个数据表明是不是读取类型,还是全部当做文本来读取,为了安全读取最好设置为1,即当做文本来处理:Treat data as text。
技巧
有时候我们需要将读取的数据绑定到特定类型上,我们可以这样做:
var query = dt
.AsEnumerable()
.Where(x => x.Field<string>("phoneNumber") != string.Empty)
.Select(x => new Contact
{
FirstName= x.Field<string>("First Name"),
LastName = x.Field<string>("Last Name"),
PhoneNumber =x.Field<string>("Phone Number"),
});
Comments: