Python 办公自动化:Excel 文件处理(上)
Python 读写 Excel 文件(基础篇)
1. Excel 简介与技术选型
Excel 作为全球最流行的电子表格软件,是商业数据处理的通用语言。在 Daoman Python AI 的工程实践中,自动化处理 Excel(如批量生成报表、提取财务数据)能极大地提升生产力。
Python 生态针对不同版本的 Excel 提供了不同的工具链:
- 传统格式 (.xls):使用
xlrd(读)和xlwt(写)。这是早期 Excel 97-2003 的标准。 - 现代格式 (.xlsx):使用
openpyxl。这是基于 Office Open XML 标准的现代格式。 - 增强工具:
xlutils配合上述库实现文件的复制与修改。
环境安装
在终端执行以下命令安装本次所需的库:
注意:
xlrd最近的版本取消了对.xlsx的支持,若需处理旧版.xls,建议指定安装1.2.0版本。
2. 读取 Excel 文件
读取 Excel 的核心逻辑是:打开工作簿 (Workbook) ➔ 定位工作表 (Sheet) ➔ 访问单元格 (Cell)。
实战:读取股票数据
3. 写入 Excel 文件
写入流程通过 xlwt.Workbook 对象开启。
4. 调整单元格样式
为了让导出的报表更具专业感,我们需要设置字体、对齐方式及背景色。
样式设置核心步骤:
- 创建
XFStyle对象。 - 配置子对象:
Font(字体),Alignment(对齐),Pattern(图案/背景),Borders(边框)。 - 在
write时传入样式对象。
5. 公式计算与文件修改
xlwt 本身不支持修改现有文件。如果需要打开一个 Excel,计算后再保存,必须借助 xlutils.copy。
总结
- 读操作:重点在于处理 Excel 特有的日期类型转换。
- 写操作:通过样式类(Font, Alignment 等)提升报表美观度。
- 修改操作:必须经历
xlrd读取 ➔copy复制 ➔xlwt写入的过程。
在处理大规模、高维度的表格数据时,建议关注后续章节关于 Pandas 的内容,它能以更高效的方式处理 Excel 数据流。

