西西軟件園多重安全檢測(cè)下載網(wǎng)站、值得信賴的軟件下載站!
西西首頁 電腦軟件 安卓軟件 電腦游戲 安卓游戲 排行榜 專題合集

pdf提取表格內(nèi)容源碼

Python版
  • pdf提取表格內(nèi)容源碼Python版
  • 軟件大小:1KB
  • 更新時(shí)間:2021-06-10 09:37
  • 軟件語言:中文
  • 軟件廠商:
  • 軟件類別:國(guó)產(chǎn)軟件 / 免費(fèi)軟件 / 源碼相關(guān)
  • 軟件等級(jí):3級(jí)
  • 應(yīng)用平臺(tái):WinXP, Win7, win8
  • 官方網(wǎng)站:暫無
  • 應(yīng)用備案:
好評(píng):50%
壞評(píng):50%

本類精品

軟件介紹

pdf提取表格內(nèi)容源碼,一個(gè)pdf提取表格內(nèi)容的源碼,由Python語言編寫,參考文檔為教育部閱讀指導(dǎo)目錄,用戶可以通過源碼原理來制作能提取任意表格內(nèi)容的源碼,下面給出這款pdf提取表格內(nèi)容的源碼資源,有需要的朋友們可以參考學(xué)習(xí)。

源碼程序由論壇用戶制作分享。

pdf提取表格內(nèi)容源碼

pdf提取表格內(nèi)容源碼功能

一個(gè)從pdf文檔中提取出表格數(shù)據(jù),并另存為excel文件的python程序

pdf提取表格內(nèi)容源碼說明

教育部基礎(chǔ)教育課程教材發(fā)展中心首次向全國(guó)中小學(xué)生發(fā)布閱讀指導(dǎo)目錄

http://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/s5987/202004/t20200422_445605.html

最下面的附件

pdf中按小學(xué)、初中、高中推薦了三套生閱讀指導(dǎo)目錄。

我們根據(jù)頁碼,來分別存為3個(gè)EXCEL文件。

源碼一覽

# -*- coding: utf-8 -*-

import pdfplumber

import pandas as pd

pdf = pdfplumber.open("2020.pdf")

full_df = pd.DataFrame()

for i in range(1, 6):

    second_page = pdf.pages[i]

    table = second_page.extract_table()

    print(table)

    table_df = pd.DataFrame(table[1:], columns=table[0])

    print(table_df)

    full_df = pd.concat([full_df, table_df])

full_df.to_excel('小學(xué)段.xlsx')

full_df = pd.DataFrame()

for i in range(6, 11):

    second_page = pdf.pages[i]

    table = second_page.extract_table()

    print(table)

    table_df = pd.DataFrame(table[1:], columns=table[0])

    print(table_df)

    full_df = pd.concat([full_df, table_df])

full_df.to_excel('初中段.xlsx')

full_df = pd.DataFrame()

for i in range(11, 15):

    second_page = pdf.pages[i]

    table = second_page.extract_table()

    print(table)

    table_df = pd.DataFrame(table[1:], columns=table[0])

    print(table_df)

    full_df = pd.concat([full_df, table_df])

full_df.to_excel('高中段.xlsx')

軟件標(biāo)簽: pdf 表格 源碼

其他版本下載

發(fā)表評(píng)論

昵稱:
表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
查看所有(0)條評(píng)論 > 字?jǐn)?shù): 0/500

TOP
軟件下載