零基礎(chǔ)入門學(xué)python_第1頁
零基礎(chǔ)入門學(xué)python_第2頁
零基礎(chǔ)入門學(xué)python_第3頁
零基礎(chǔ)入門學(xué)python_第4頁
零基礎(chǔ)入門學(xué)python_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第頁零基礎(chǔ)入門學(xué)python作為一名IT行業(yè)的一員,從零基礎(chǔ)學(xué)習(xí)〔python〕,那么怎么利用網(wǎng)絡(luò)學(xué)習(xí)python語言呢?以下是我為你整理的零基礎(chǔ)入門學(xué)python

選擇你喜愛的感覺對你幫助會很大的視頻,可以通過一些網(wǎng)友的推舉來進(jìn)行選擇以確保視頻的更高價(jià)值。利用網(wǎng)路搜索一些精簡扼要的python文檔(或者書籍)輔助自己先前所看過的視頻,以便于讓自己更好地消化汲取;此類資料最好是跟你所選擇的視頻對應(yīng)或者配套的,這樣主要是為了讓自己兩面一致,反復(fù)學(xué)習(xí)減少些許枯燥感。

注意:文檔最好是一些精益求精之類的,如果實(shí)在找不到,那么也要次之;切不可隨便信手拾起一些沒有多少價(jià)值的文檔,那樣只是浪費(fèi)時(shí)間而已。

利用網(wǎng)路搜索一些高價(jià)值的論壇。論壇上面有很多合適新手或者老手們的資料,而且很多牛人都喜愛在上面表達(dá)一些自己的觀點(diǎn)等。這些內(nèi)容對學(xué)習(xí)python而言很有幫助。(百度python論壇會有很多,選擇合適自己的)

加入一些python交流群,可以讓你更快更方便的分享自己所學(xué)到的知識;當(dāng)然,碰到什么疑問什么的,可以通過交流群讓自己獲得解答(畢竟大家都是很喜愛互相分享交流的)

利用python官網(wǎng)。通過python官網(wǎng)來學(xué)習(xí)python,你可以了解原汁原味的知識(畢竟都是用英文寫的,而且python也是最先從外國傳進(jìn)來的嘛)

python的優(yōu)勢

Python世界最棒的地方之一,就是大量的第三方程序包。同樣,〔管理〕這些包也非常容易。按照慣例,會在requirements.txt文件中列出項(xiàng)目所必須要的包。每個包占一行,通常還包涵版本號。這里有一個例子

Python程序包有一個缺陷是,它們默認(rèn)會進(jìn)行全局安裝。我們將要使用一個工具,使我們每個項(xiàng)目都有一個獨(dú)立的環(huán)境,這個工具叫virtualenv。我們同樣要安裝一個更高級的包管理工具,叫做pip,他可以和virtualenv配合工作。

首先,我們必須要安裝pip。大多數(shù)python安裝程序已經(jīng)內(nèi)置了easy_install(python默認(rèn)的包管理工具),所以我們就使用easy_installpip來安裝pip。這應(yīng)該是你最后一次使用easy_install了。如果你并沒有安裝easy_install,在〔linux〕系統(tǒng)中,貌似從python-setuptools包中可以獲得。

如果你使用的Python版本高于等于3.3,那么Virtualenv已經(jīng)是標(biāo)準(zhǔn)庫的一部分了,所以沒有必要再去安裝它了。

下一步,你希望安裝virtualenv和virtualenvwrapper。Virtualenv使你能夠?yàn)槊總€項(xiàng)目創(chuàng)造一個獨(dú)立的環(huán)境。尤其是當(dāng)你的不同項(xiàng)目使用不同版本的包時(shí),這一點(diǎn)特別有用。Virtualenvwrapper提供了一些不錯的腳本,可以讓一些事情變得容易。

當(dāng)virtualenvwrapper安裝后,它會把virtualenv列為依賴包,所以會自動安裝。

打開一個新的shell,輸入mkvirtualenvtest。如果你打開另外一個shell,則你就不在這個virtualenv中了,你可以通過workontest來啟動。如果你的工作完成了,可以使用deactivate來停用。

如何入門python

學(xué)習(xí)爬蟲首先學(xué)習(xí)Python,建議通過中國大學(xué)mooc和《笨方法學(xué)Python》來實(shí)現(xiàn)入門,那本書的內(nèi)容可以有所取舍。通過這兩個途徑再上網(wǎng)上針對性地查找相關(guān)內(nèi)容完全可以入門,重點(diǎn)在于理解"面向?qū)ο?。

爬蟲入門首先要明白一些網(wǎng)絡(luò)技術(shù),了解TCP/IP參照模型,并且對應(yīng)用層的HTTP協(xié)議的方法和工作原理有一定的熟悉。爬蟲爬取網(wǎng)頁內(nèi)容,大多數(shù)網(wǎng)頁服務(wù)由HTTP協(xié)議實(shí)現(xiàn)。

正式學(xué)習(xí)爬蟲庫urllib和正則表達(dá)式,urllib靈活性很高,并且和你所學(xué)的網(wǎng)絡(luò)原理、HTTP原理非常貼合,利于新手學(xué)習(xí),正則表達(dá)式看看內(nèi)容,再看幾個實(shí)例就應(yīng)該會用了,不推舉看亂七八糟的教程和MOOC(效果非常差,講的跨度太大),推舉書籍《精通Python網(wǎng)絡(luò)爬蟲核心技術(shù)、框架與項(xiàng)目實(shí)戰(zhàn)》(韋瑋)。同樣是選擇性的閱讀。

學(xué)習(xí)完成之后,多加施行,推舉實(shí)戰(zhàn)項(xiàng)目:1、爬取漫畫網(wǎng)上的一部漫畫的所有圖片,并用PowerPoint做成PDF2、爬取電影下載網(wǎng)站上的所有電影下載鏈接并整理到Excel。

開發(fā)環(huán)境搭建

首先安裝python3,可以參照:s://jingyan.baidu/article/afd8f4deb393fa34e386e910.html

安裝好python3后,如圖進(jìn)入python環(huán)境驗(yàn)證python的urllib庫是否能正常使用,如沒有提示錯誤則urllib庫能正常使用了。

其他操作系統(tǒng)的python的安裝同理,具體可以搜索對應(yīng)的安裝方法。

然后安裝爬蟲開發(fā)所必須的第三方庫BeautifulSoup4.,可以參照:s://jingyan.baidu/article/ac6a9a5e31c87c2b643eac11.html

爬蟲開發(fā)其實(shí)還要其他第三方開發(fā)庫,這里選用BeautifulSoup4。

最后安裝python開發(fā)工具IDE。

urllib的用途和用法

urllib是python3自帶的操作URL的庫,用來模擬用戶使用瀏覽器訪問網(wǎng)頁。

使用步驟:

1)程序中導(dǎo)入urllib庫的request模塊

fromurllibimportrequest

2)請求URL,相當(dāng)于瀏覽網(wǎng)頁時(shí)右擊然后選擇"顯示網(wǎng)頁源代碼'

resp=request.urlopen("此處填網(wǎng)址)

3)輸出上一步請求獲得的"網(wǎng)頁源代碼'

print(resp.read().decode("utf-8'))

一個獲取網(wǎng)頁源碼的程序就完成了:

對以上第2點(diǎn)進(jìn)一步優(yōu)化模擬真實(shí)瀏覽器,

可以先查看瀏覽器訪問網(wǎng)頁時(shí)攜帶點(diǎn)header信息,如圖查看'User_Agent'信息,意思是使用什么版本的什么瀏覽器訪

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論