Python读写docx文件的办法,python怎么样编程word文档

作者: 金沙澳门官网  发布:2019-08-28

问题:python如何编程word文档?有哪些库可以直接使用?

Python读写word文档有现成的库可以处理。我这里采用 python-docx。可以用pip install python-docx安装一下。

回答:

这里说一句,ppt和excel也有类似的库哦,而且是直接读取文件里面的xml数据。所以doc格式得另找其他库处理,doc格式不是基于xml的。

这里介绍一个库—python-docx,专门用于python读写word文档,使用方便、快捷,下面我简单介绍一下这个库的安装和使用,实验环境win10 python3.6 pycharm5.0,主要内容如下:

帮助文档:http://python-docx.readthedocs.org/en/latest/

1.安装python-docx,这个直接在cmd窗口输入命令“pip install python-docx”就行,如下:

1、新建或打开文件。这个比较简单用docx的Document类,若指定路径则是打开文档;若没有指定路径则是新建文档

金沙澳门官网 1

#coding:utf-8
import docx

#新建文档
doc_new = docx.Document()

#读取文档
doc = docx.Document(ur'C:1.docx')

2.安装完成后,我们就可以进行简单的测试了,这里我分别就读取word文档和写入word文档做了简单介绍,主要代码及截图如下:

2、保存文件。有打开,就有保存。用Document类的save方法,其中参数是保存的文件路径,或者要保存的文件流。一般指定路径即可。

  • 读取word文档,这里以读取文档中的段落文本和表格数据为例,示例文档如下:
doc.save(path_or_stream)

金沙澳门官网 2

3、对象集合。python-docx包含了word文档的相关对象集合。

对应读取代码如下,很简单,分别获取所有段落文本和表格数据,然后循环打印就行,readWord函数输入参数为需要读取的word文档:

doc.paragraphs #段落集合
doc.tables #表格集合
doc.sections #节 集合
doc.styles #样式集合
doc.inline_shapes #内置图形 等等...

金沙澳门官网 3

4、插入段落。段落是word最基本的对象之一。

程序运行截图如下,已经成功获取到word文档的内容:

doc.add_paragraph(u'第一段',style=None) #插入一个段落,文本为“第一段”
#默认是不应用样式,这里也可以不写style参数,或者指定一个段落样式
doc.add_paragraph(u'第二段',style='Heading 2')

#这些样式都是word默认带有的样式,可以直接罗列出来有哪些段落样式
print [s.name for s in doc.styles if s.type==1]

金沙澳门官网 4

5、新增样式。这个帮助文档里面说得不仔细,而且还是英文的。我手头上的项目用到这个,就自己琢磨出怎么使用,如下。

  • 写入word文档,这个也很简单,构造相应数据结构,然后直接写入word文档就行,这里以添加标题、段落、图片、引用、表格,设置字体、有序列表和无序列表为例,主要测试代码如下:
#coding:utf-8
from docx import Document
from docx.shared import RGBColor #这个是docx的颜色类

#新建文档
doc = Document()

#新增样式(第一个参数是样式名称,第二个参数是样式类型:1代表段落;2代表字符;3代表表格)
style = doc.styles.add_style('style name 1', 2)

#设置具体样式(修改样式字体为蓝色,当然还可以修改其他的,大家自己尝试)
style.font.color.rgb = RGBColor(0x0, 0x0, 0xff)

金沙澳门官网 5

6、应用字符样式。字符自然是在段落里面的,可以采用下面方法给段落追加文字和设置字符样式。

金沙澳门官网 6

#插入一个空白段落
p = doc.add_paragraph('')
p.add_run('123', style="Heading 1 Char")
p.add_run('456')
p.add_run('789', style="Heading 2 Char")

#这样一个段落就应用了两个字符样式,中间“456”就没应用样式
print p.text #输出结果是u'123456789' 也还是连续的

金沙澳门官网 7

7、设置字体。当然可以不用通过设置样式对某些字进行设置,也可以直接设置。

程序运行截图如下,已经成功创建并生成word文档:

p = doc.add_paragraph('')
r = p.add_run('123')
r.font.bold = True #加粗
r.font.italic = True #倾斜 等等...

金沙澳门官网 8

8、表格操作。表格也是经常用到的一种对象类型。

至此,我们就完成了利用python来编程word文档。总的来说,整个过程不难,思路不难,代码也不多,很好理解,只要你有一定的python基础,熟悉一下相关示例和代码,多练习一下,很快就能掌握的,python-docx官网也提供了非常详细的使用文档,非常适合初学者学习,介绍的很全面,可以参考一下

#新建一个2x3的表格,style可以不写
table=doc.add_table(rows=2,cols=3,style=None)

#可以用table 的rows和columns得到这个表格的行数和列数
print len(table.rows)
print len(table.columns)

#遍历表格
for row in table.rows:
 row.cells[0].text = '1'
 #print row.cells[0].text

#新增行或列
table.add_row()
table.add_column()

回答:

Word常见操作差不多就是这些。大家可以查看帮助文档,也可以用dir和help查看对象的方法属性和帮助。

python调用word接口主要用到python-docx模块,基本操作官方文档有说明。

以上这篇Python读写docx文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

金沙澳门官网 9

您可能感兴趣的文章:

  • Python使用win32com模块实现数据库表结构自动生成word表格的方法
  • 使用Python通过win32 COM实现Word文档的写入与保存方法
  • Python读取指定目录下指定后缀文件并保存为docx
  • python docx 中文字体设置的操作方法
  • Python读取Word(.docx)正文信息的方法
  • python3如何将docx转换成pdf文件
  • Ubuntu下使用python读取doc和docx文档的内容方法
  • python-docx修改已存在的Word文档的表格的字体格式方法
  • Python操作word常见方法示例【win32com与docx模块】

官方文档的链接在这儿没法发,需要的话可以私信笔者。

接下来我们一步一步的开始使用Python对wold文档进行操作:

  1. 安装python-docx模块
    打开命令提示符,输入“pip install python-docx”导入python-docx模块:
    金沙澳门官网 10下方显示Successfully installed python-docx-x.x.x说明你安装成功了。

  2. 打开编译器,导入Document和Inches包:
    金沙澳门官网 11

  3. 新建docx文件:
    金沙澳门官网 12

  4. 插入文档标题:
    金沙澳门官网 13

  5. 插入文档内容:
    金沙澳门官网 14

  6. 保存文件:
    金沙澳门官网 15

此时我们运行一下这个程序,在右侧文件列表中会出现“demo.docx”文件。

金沙澳门官网 16

金沙澳门官网 ,我们去文件目录打开它看一下:

金沙澳门官网 17

是我们写的文件没错,这就是Python对word文档的基本操作。当然,不仅仅局限于插入标题和段落,还有图片表格等,笔者在这里就不一一介绍,若感兴趣请查阅官方文档~

金沙澳门官网 18

我是刘坏坏,盘点干货资源。如果我的回答有什么疏漏之处,请在下方评论或私信指出。如果对您有帮助,请点赞收藏。笔者稽首~

回答:

一、安装Python-docx

Python-docx是专门针对于word文档的一个模块,只能读取docx 不能读取doc文件。说白了,python就相当于windows操作系统,QQ就是跑在windows操作系统上的软件,QQ最大的作用是可以去聊天,说话。 在这里python-docx就相当于这里的qq 它主要的功能是对docx文件进行操作,管理等.(个人理解,非专业!)

本文由金沙澳门官网发布于金沙澳门官网,转载请注明出处:Python读写docx文件的办法,python怎么样编程word文档

关键词: 金沙澳门官网