西西軟件園多重安全檢測下載網(wǎng)站、值得信賴的軟件下載站!
西西首頁 電腦軟件 安卓軟件 電腦游戲 安卓游戲 排行榜 專題合集

pdf提取表格內(nèi)容源碼

Python版
  • pdf提取表格內(nèi)容源碼Python版
  • 軟件大小:1KB
  • 更新時間:2021-06-10 09:37
  • 軟件語言:中文
  • 軟件廠商:
  • 軟件類別:國產(chǎn)軟件 / 免費軟件 / 源碼相關(guān)
  • 軟件等級:3級
  • 應(yīng)用平臺:WinXP, Win7, win8
  • 官方網(wǎng)站:暫無
  • 應(yīng)用備案:
好評:50%
壞評:50%

本類精品

軟件介紹

pdf提取表格內(nèi)容源碼,一個pdf提取表格內(nèi)容的源碼,由Python語言編寫,參考文檔為教育部閱讀指導(dǎo)目錄,用戶可以通過源碼原理來制作能提取任意表格內(nèi)容的源碼,下面給出這款pdf提取表格內(nèi)容的源碼資源,有需要的朋友們可以參考學(xué)習(xí)。

源碼程序由論壇用戶制作分享。

pdf提取表格內(nèi)容源碼

pdf提取表格內(nèi)容源碼功能

一個從pdf文檔中提取出表格數(shù)據(jù),并另存為excel文件的python程序

pdf提取表格內(nèi)容源碼說明

教育部基礎(chǔ)教育課程教材發(fā)展中心首次向全國中小學(xué)生發(fā)布閱讀指導(dǎo)目錄

http://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/s5987/202004/t20200422_445605.html

最下面的附件

pdf中按小學(xué)、初中、高中推薦了三套生閱讀指導(dǎo)目錄。

我們根據(jù)頁碼,來分別存為3個EXCEL文件。

源碼一覽

# -*- coding: utf-8 -*-

import pdfplumber

import pandas as pd

pdf = pdfplumber.open("2020.pdf")

full_df = pd.DataFrame()

for i in range(1, 6):

    second_page = pdf.pages[i]

    table = second_page.extract_table()

    print(table)

    table_df = pd.DataFrame(table[1:], columns=table[0])

    print(table_df)

    full_df = pd.concat([full_df, table_df])

full_df.to_excel('小學(xué)段.xlsx')

full_df = pd.DataFrame()

for i in range(6, 11):

    second_page = pdf.pages[i]

    table = second_page.extract_table()

    print(table)

    table_df = pd.DataFrame(table[1:], columns=table[0])

    print(table_df)

    full_df = pd.concat([full_df, table_df])

full_df.to_excel('初中段.xlsx')

full_df = pd.DataFrame()

for i in range(11, 15):

    second_page = pdf.pages[i]

    table = second_page.extract_table()

    print(table)

    table_df = pd.DataFrame(table[1:], columns=table[0])

    print(table_df)

    full_df = pd.concat([full_df, table_df])

full_df.to_excel('高中段.xlsx')

軟件標(biāo)簽: pdf 表格 源碼

軟件截圖

pdf提取表格內(nèi)容源碼 Python版

其他版本下載

發(fā)表評論

昵稱:
表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
查看所有(0)條評論 > 字數(shù): 0/500

TOP
軟件下載