Python-docx模块下载安装与使用完整指南 | Python办公自动化教程
- Python
- 2025-08-18
- 1746
Python-docx模块下载与使用指南
创建、编辑和操作Word文档的完整教程
为什么使用python-docx?
python-docx是一个强大的Python库,用于创建和修改Microsoft Word (.docx) 文件。使用它,您可以:
- 自动化生成报告和文档
- 批量处理Word文件
- 提取文档内容和格式信息
- 创建专业格式的文档
安装python-docx模块
前提条件
- 已安装Python(推荐3.6+版本)
- 已安装pip(Python包管理工具)
安装步骤
-
打开命令提示符或终端
Windows用户使用CMD或PowerShell,Mac/Linux用户使用Terminal
-
执行安装命令
pip install python-docx
-
验证安装
在Python环境中运行以下命令:
import docx print(docx.__version__)
如果输出版本号(如0.8.11),说明安装成功
常见安装问题解决
问题: 安装时出现权限错误
解决: 使用管理员权限运行命令提示符或添加--user参数:
pip install --user python-docx
使用python-docx创建Word文档
基本示例:创建简单文档
from docx import Document
from docx.shared import Pt
# 创建新文档
doc = Document()
# 添加标题
doc.add_heading('Python自动化报告', 0)
# 添加段落
p = doc.add_paragraph('这是一个使用python-docx创建的Word文档。')
p.add_run(' 这段文本是加粗的。').bold = True
p.add_run(' 这段文本是斜体的。').italic = True
# 添加列表
doc.add_heading('功能列表', level=2)
doc.add_paragraph('创建新文档', style='ListBullet')
doc.add_paragraph('添加段落和文本', style='ListBullet')
doc.add_paragraph('设置文本样式', style='ListBullet')
doc.add_paragraph('添加表格', style='ListBullet')
# 保存文档
doc.save('我的第一个Python文档.docx')
添加表格示例
# 添加表格
table = doc.add_table(rows=4, cols=3)
table.style = 'Table Grid'
# 设置表头
header_cells = table.rows[0].cells
header_cells[0].text = '编号'
header_cells[1].text = '名称'
header_cells[2].text = '价格'
# 添加数据
data = [
[1, 'Python基础教程', '¥45'],
[2, 'Python数据分析', '¥68'],
[3, 'Python自动化', '¥52']
]
for row_idx, item in enumerate(data, start=1):
row_cells = table.rows[row_idx].cells
row_cells[0].text = str(item[0])
row_cells[1].text = item[1]
row_cells[2].text = item[2]
doc.save('带表格的文档.docx')
高级功能与技巧
设置字体样式
from docx.shared import RGBColor
paragraph = doc.add_paragraph()
run = paragraph.add_run('自定义文本样式')
run.font.name = '微软雅黑'
run.font.size = Pt(14)
run.font.color.rgb = RGBColor(0x42, 0x24, 0xE9)
run.font.bold = True
添加图片
from docx.shared import Inches
doc.add_picture('python-logo.png',
width=Inches(3.0),
height=Inches(1.0))
读取现有文档
doc = Document('现有文档.docx')
for paragraph in doc.paragraphs:
print(paragraph.text)
# 读取表格数据
for table in doc.tables:
for row in table.rows:
for cell in row.cells:
print(cell.text)
最佳实践与建议
1. 使用样式
使用预定义样式(如'Heading 1', 'ListBullet')而不是手动设置格式,可使文档更一致且易于维护。
2. 异常处理
文件操作时添加异常处理:
try:
doc.save('报告.docx')
except PermissionError:
print("错误:文件被其他程序打开")
3. 文档结构
使用标题层级结构(Heading 1-9)创建文档大纲,便于生成目录和导航。
4. 性能优化
处理大型文档时:
- 避免频繁保存操作
- 批量处理段落
- 考虑使用模板文档
常见问题解答
Q: python-docx可以处理.doc文件吗?
A: 不可以,python-docx仅支持.docx格式(Office 2007及更高版本)。处理旧版.doc文件需要使用其他库如pywin32。
Q: 如何设置页面边距?
A: 在创建文档后设置:
from docx.shared import Inches
sections = doc.sections
for section in sections:
section.top_margin = Inches(1)
section.bottom_margin = Inches(1)
section.left_margin = Inches(1.5)
section.right_margin = Inches(1.5)
Q: 如何添加页眉页脚?
A: 使用sections对象:
section = doc.sections[0] header = section.header header_para = header.paragraphs[0] header_para.text = "公司机密文档"
开始使用python-docx自动化您的Word文档
通过本教程,您已经掌握了python-docx的安装方法和基本使用技巧。现在您可以开始创建Python脚本来自动化生成报告、处理文档和简化工作流程。
访问官方文档获取更多高级功能和使用示例。
本文由LuYang于2025-08-18发表在吾爱品聚,如有疑问,请联系我们。
本文链接:http://pjw.521pj.cn/20258428.html
发表评论