建站优化

当前位置:

用python提取word里面的内容的教程,python提取doc文件内容

浏览量:113次

用python提取word里面的内容的教程,python提取doc文件内容

一个公司有若干个部门,一个部门有若干个员工,每一个员工填写一份自己的信息(Word 版),然后录入系统,Word 表格模板如下:

填入内容如:

首先我们需要做的就是把数据提取出来,之后我们就可以对数据 为所欲为 进行相关操作了。 提取表格数据代码如下:

importdocxdocName="C:/Users/Administrator/Desktop/信息.docx"#打开文档docStr=docx.Document(docName)#获取Word文档中所有表格numTables=docStr.tables#把数据放到列表中my_list=[]fortableinnumTables:#行列个数row_count=len(table.rows)col_count=len(table.columns)foriinrange(row_count):row=table.rows[i].cellsforjinrange(col_count):content=row[j].textmy_list.append(content)#将列表改为字典格式,方便进行相关操作my_dict={}foriinrange(len(my_list)):ifi%2:try:#去除单元格为空的内容ifk:my_dict[k]=my_list[i]except:passelse:k=my_list[i]print(my_dict)

结果如下:

{'姓名':'Apollo','证件类型':'身份证','证件号码':'123456789012345678','性别':'男','出生日期'

[声明]本网转载网络媒体稿件是为了传播更多的信息,此类稿件不代表本网观点,本网不承担此类稿件侵权行为的连带责任。故此,如果您发现本网站的内容侵犯了您的版权,请您的相关内容发至此邮箱【779898168@qq.com】,我们在确认后,会立即删除,保证您的版权。