
这是一个根据从pdf文件中读取表格并写入Excel文件的小工具,这里表格不可以是那种图片的,否则识别不了,还要提供一个存放生成Excel文件的目录,因为这个工具会将每页读取的表格单独写入一个Excel文件。
先看一下pdf文件中的表格格式,我这里是拿了一份山东省的制造业分析报告,表格比较多:

这是读取出来的Excel,是以“Page+页码.xlsx”的格式存放的:

读取出来大概就是这样的:

执行文件下载,该文件下载后可以直接运行使用:
python源码
环境需求:python3.10
扩展包:pdfplumber,wxpython,pandas