【基于Python的PDF文檔圖片提取系統(tǒng)設(shè)計(jì)9600字(論文)】_第1頁
【基于Python的PDF文檔圖片提取系統(tǒng)設(shè)計(jì)9600字(論文)】_第2頁
【基于Python的PDF文檔圖片提取系統(tǒng)設(shè)計(jì)9600字(論文)】_第3頁
【基于Python的PDF文檔圖片提取系統(tǒng)設(shè)計(jì)9600字(論文)】_第4頁
【基于Python的PDF文檔圖片提取系統(tǒng)設(shè)計(jì)9600字(論文)】_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

-9-附錄1(可根據(jù)需要加該項(xiàng))系統(tǒng)完整代碼:importPySimpleGUIassgimportfitzimporttimeimportreimportosdefpdf2pic(path,pic_path):'''#從pdf中提取圖片:parampath:pdf的路徑:parampic_path:圖片保存的路徑:return:'''t0=time.perf_counter()#使用正則表達(dá)式來查找圖片checkXO=r"/Type(?=*/XObject)"checkIM=r"/Subtype(?=*/Image)"#打開pdfdoc=fitz.open(path)#圖片計(jì)數(shù)imgcount=0#lenXREF=doc._getXrefLength()lenXREF=doc.xref_length()print(lenXREF)#遍歷每一個(gè)對(duì)象foriinrange(1,lenXREF):#定義對(duì)象字符串#text=doc._getXrefString(i)text=doc.xref_object(i)isXObject=re.search(checkXO,text)#使用正則表達(dá)式查看是否是圖片isImage=re.search(checkIM,text)#如果不是對(duì)象也不是圖片,則continueifnotisXObjectornotisImage:continueimgcount+=1#根據(jù)索引生成圖像pix=fitz.Pixmap(doc,i)#根據(jù)pdf的路徑生成圖片的名稱#new_name=path.replace('\\','_')+"_img{}.png".format(imgcount)new_name=os.path.basename(path)+"_"+"img{}.png".format(imgcount)new_name=new_name.replace(':','')#如果pix.n<5,可以直接存為PNGifpix.n<5:pix.writePNG(os.path.join(pic_path,new_name))#否則先轉(zhuǎn)換CMYKelse:pix0=fitz.Pixmap(fitz.csRGB,pix)pix0.writePNG(os.path.join(pic_path,new_name))pix0=None#釋放資源pix=Nonet1=time.perf_counter()print("運(yùn)行時(shí)間:{}s".format(t1-t0))print("提取了{(lán)}張圖片".format(imgcount))defpdf_menu_gui():path=NonePDFfile_num=0whileTrue:event,values=window.read()#選擇了路徑ifevent=="path":path=values['path']ifevent=="Submit":ifpath==None:sg.Popup("請(qǐng)先選擇文件位置!")else:#解析圖片PDFfile_num=0foriinos.listdir(path):#遍歷所有文件ifi[-3:]=="pdf":#找到了pdf文件pdf2pic(path+"\\"+i,path)print(path+"\\"+i+"提取成功!")PDFfile_num+=1ifPDFfile_num==0:sg.Popup("提取失敗,沒有找到pdf文件!")else:sg.Popup("提取成功!共{}份pdf文件".format(PDFfile_num))ifevent=="Cancel"orevent==sg.WIN_CLOSED:breakifevent=="注意":

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論