




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第頁零基礎(chǔ)入門學(xué)python作為一名IT行業(yè)的一員,從零基礎(chǔ)學(xué)習(xí)〔python〕,那么怎么利用網(wǎng)絡(luò)學(xué)習(xí)python語言呢?以下是我為你整理的零基礎(chǔ)入門學(xué)python
選擇你喜愛的感覺對你幫助會很大的視頻,可以通過一些網(wǎng)友的推舉來進(jìn)行選擇以確保視頻的更高價(jià)值。利用網(wǎng)路搜索一些精簡扼要的python文檔(或者書籍)輔助自己先前所看過的視頻,以便于讓自己更好地消化汲取;此類資料最好是跟你所選擇的視頻對應(yīng)或者配套的,這樣主要是為了讓自己兩面一致,反復(fù)學(xué)習(xí)減少些許枯燥感。
注意:文檔最好是一些精益求精之類的,如果實(shí)在找不到,那么也要次之;切不可隨便信手拾起一些沒有多少價(jià)值的文檔,那樣只是浪費(fèi)時(shí)間而已。
利用網(wǎng)路搜索一些高價(jià)值的論壇。論壇上面有很多合適新手或者老手們的資料,而且很多牛人都喜愛在上面表達(dá)一些自己的觀點(diǎn)等。這些內(nèi)容對學(xué)習(xí)python而言很有幫助。(百度python論壇會有很多,選擇合適自己的)
加入一些python交流群,可以讓你更快更方便的分享自己所學(xué)到的知識;當(dāng)然,碰到什么疑問什么的,可以通過交流群讓自己獲得解答(畢竟大家都是很喜愛互相分享交流的)
利用python官網(wǎng)。通過python官網(wǎng)來學(xué)習(xí)python,你可以了解原汁原味的知識(畢竟都是用英文寫的,而且python也是最先從外國傳進(jìn)來的嘛)
python的優(yōu)勢
Python世界最棒的地方之一,就是大量的第三方程序包。同樣,〔管理〕這些包也非常容易。按照慣例,會在requirements.txt文件中列出項(xiàng)目所必須要的包。每個包占一行,通常還包涵版本號。這里有一個例子
Python程序包有一個缺陷是,它們默認(rèn)會進(jìn)行全局安裝。我們將要使用一個工具,使我們每個項(xiàng)目都有一個獨(dú)立的環(huán)境,這個工具叫virtualenv。我們同樣要安裝一個更高級的包管理工具,叫做pip,他可以和virtualenv配合工作。
首先,我們必須要安裝pip。大多數(shù)python安裝程序已經(jīng)內(nèi)置了easy_install(python默認(rèn)的包管理工具),所以我們就使用easy_installpip來安裝pip。這應(yīng)該是你最后一次使用easy_install了。如果你并沒有安裝easy_install,在〔linux〕系統(tǒng)中,貌似從python-setuptools包中可以獲得。
如果你使用的Python版本高于等于3.3,那么Virtualenv已經(jīng)是標(biāo)準(zhǔn)庫的一部分了,所以沒有必要再去安裝它了。
下一步,你希望安裝virtualenv和virtualenvwrapper。Virtualenv使你能夠?yàn)槊總€項(xiàng)目創(chuàng)造一個獨(dú)立的環(huán)境。尤其是當(dāng)你的不同項(xiàng)目使用不同版本的包時(shí),這一點(diǎn)特別有用。Virtualenvwrapper提供了一些不錯的腳本,可以讓一些事情變得容易。
當(dāng)virtualenvwrapper安裝后,它會把virtualenv列為依賴包,所以會自動安裝。
打開一個新的shell,輸入mkvirtualenvtest。如果你打開另外一個shell,則你就不在這個virtualenv中了,你可以通過workontest來啟動。如果你的工作完成了,可以使用deactivate來停用。
如何入門python
學(xué)習(xí)爬蟲首先學(xué)習(xí)Python,建議通過中國大學(xué)mooc和《笨方法學(xué)Python》來實(shí)現(xiàn)入門,那本書的內(nèi)容可以有所取舍。通過這兩個途徑再上網(wǎng)上針對性地查找相關(guān)內(nèi)容完全可以入門,重點(diǎn)在于理解"面向?qū)ο?。
爬蟲入門首先要明白一些網(wǎng)絡(luò)技術(shù),了解TCP/IP參照模型,并且對應(yīng)用層的HTTP協(xié)議的方法和工作原理有一定的熟悉。爬蟲爬取網(wǎng)頁內(nèi)容,大多數(shù)網(wǎng)頁服務(wù)由HTTP協(xié)議實(shí)現(xiàn)。
正式學(xué)習(xí)爬蟲庫urllib和正則表達(dá)式,urllib靈活性很高,并且和你所學(xué)的網(wǎng)絡(luò)原理、HTTP原理非常貼合,利于新手學(xué)習(xí),正則表達(dá)式看看內(nèi)容,再看幾個實(shí)例就應(yīng)該會用了,不推舉看亂七八糟的教程和MOOC(效果非常差,講的跨度太大),推舉書籍《精通Python網(wǎng)絡(luò)爬蟲核心技術(shù)、框架與項(xiàng)目實(shí)戰(zhàn)》(韋瑋)。同樣是選擇性的閱讀。
學(xué)習(xí)完成之后,多加施行,推舉實(shí)戰(zhàn)項(xiàng)目:1、爬取漫畫網(wǎng)上的一部漫畫的所有圖片,并用PowerPoint做成PDF2、爬取電影下載網(wǎng)站上的所有電影下載鏈接并整理到Excel。
開發(fā)環(huán)境搭建
首先安裝python3,可以參照:s://jingyan.baidu/article/afd8f4deb393fa34e386e910.html
安裝好python3后,如圖進(jìn)入python環(huán)境驗(yàn)證python的urllib庫是否能正常使用,如沒有提示錯誤則urllib庫能正常使用了。
其他操作系統(tǒng)的python的安裝同理,具體可以搜索對應(yīng)的安裝方法。
然后安裝爬蟲開發(fā)所必須的第三方庫BeautifulSoup4.,可以參照:s://jingyan.baidu/article/ac6a9a5e31c87c2b643eac11.html
爬蟲開發(fā)其實(shí)還要其他第三方開發(fā)庫,這里選用BeautifulSoup4。
最后安裝python開發(fā)工具IDE。
urllib的用途和用法
urllib是python3自帶的操作URL的庫,用來模擬用戶使用瀏覽器訪問網(wǎng)頁。
使用步驟:
1)程序中導(dǎo)入urllib庫的request模塊
fromurllibimportrequest
2)請求URL,相當(dāng)于瀏覽網(wǎng)頁時(shí)右擊然后選擇"顯示網(wǎng)頁源代碼'
resp=request.urlopen("此處填網(wǎng)址)
3)輸出上一步請求獲得的"網(wǎng)頁源代碼'
print(resp.read().decode("utf-8'))
一個獲取網(wǎng)頁源碼的程序就完成了:
對以上第2點(diǎn)進(jìn)一步優(yōu)化模擬真實(shí)瀏覽器,
可以先查看瀏覽器訪問網(wǎng)頁時(shí)攜帶點(diǎn)header信息,如圖查看'User_Agent'信息,意思是使用什么版本的什么瀏覽器訪
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 商務(wù)部認(rèn)定技術(shù)合同范本
- 離子輻照調(diào)控YBCO薄膜磁通釘扎性能的機(jī)制與應(yīng)用探索
- 楔形樁水平承載特性的多維度探究:模型試驗(yàn)與數(shù)值模擬的協(xié)同分析
- 無機(jī)磷限制下圓海鏈藻的生長與轉(zhuǎn)錄表達(dá)特征研究
- 合同編制買賣合同范本
- 個人借款合同范本簡易
- 商場露營租賃合同范例
- 品質(zhì)小區(qū)綠化種植合同范本
- 與學(xué)徒合同范本
- 2025至2031年中國內(nèi)外花紋膠圈行業(yè)投資前景及策略咨詢研究報(bào)告
- 2024年安徽省公務(wù)員【申論】考試真題及答案-(A卷+B卷+C卷)三套
- 2025年中央一號文件參考試題庫100題(含答案)
- 2025年黑龍江生態(tài)工程職業(yè)學(xué)院單招職業(yè)傾向性測試題庫1套
- DeepSeek的應(yīng)用與部署
- 圖解自然資源部《自然資源領(lǐng)域數(shù)據(jù)安全管理辦法》
- 2023-2024學(xué)年廣東省廣州市天河區(qū)七年級(上)期末英語試卷
- 綠色大氣簡約國潮動態(tài)三星堆文化宣傳介紹
- 簽證護(hù)照代領(lǐng)取委托書中英文
- 假如你愛我的正譜
- 邊防檢查站港口碼頭智能監(jiān)控系統(tǒng)建設(shè)技術(shù)方案
- 神奇的數(shù)字治病法
評論
0/150
提交評論