使用tabula-py库提取PDF中的表格
使用tabula-py库,可以从PDF文件中提取表格,并将其导出为CSV或DataFrame格式。代码如下:
import tabula
pdf_file = 'example.pdf'
output_file = 'output.csv'
tabula.convert_into(pdf_file, output_file, output_format='csv', pages='all')
网站声明:如果转载,请联系本站管理员。否则一切后果自行承担。
添加我为好友,拉您入交流群!
请使用微信扫一扫!