




下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第用python寫(xiě)個(gè)顏值評(píng)分器篩選最美主播目錄前言一、核心功能設(shè)計(jì)獲取主播直播封面圖主播顏值評(píng)分二、實(shí)現(xiàn)步驟1.獲取主播名稱和照片2.主播顏值評(píng)分
前言
晚上回家閑來(lái)無(wú)事,想打開(kāi)某直播平臺(tái),看看小姐姐直播。看著一個(gè)個(gè)多才多藝的小姐姐,眼花繚亂,好難抉擇。究竟看哪個(gè)小姐姐直播好呢?
今天我們就一起來(lái)做個(gè)顏值評(píng)分器,爬取小姐姐們的直播照片,對(duì)每位小姐姐的顏值進(jìn)行打分排序,選出最靚的star。
一、核心功能設(shè)計(jì)
總體來(lái)說(shuō),我們需要做的是獲取直播顏值區(qū)的主播小姐姐的正在直播的全部主播名稱和封面圖并保存下來(lái),用百度AI提供的人臉識(shí)別接口,進(jìn)行顏值評(píng)分排序,選出顏值最高的。
拆解需求,大致可以整理出核心功能如下:
獲取主播直播封面圖
打開(kāi)直播顏值區(qū)模塊對(duì)頁(yè)面進(jìn)行分析
發(fā)送網(wǎng)絡(luò)請(qǐng)求,解析數(shù)據(jù)
保存數(shù)據(jù)
主播顏值評(píng)分
百度人臉識(shí)別接口
遍歷主播照片,調(diào)用顏值檢測(cè)接口對(duì)主播顏值進(jìn)行打分
對(duì)評(píng)分進(jìn)行排序
二、實(shí)現(xiàn)步驟
1.獲取主播名稱和照片
首先我們選擇的是某牙直播,進(jìn)入首頁(yè)打開(kāi)顏值區(qū),按F12可以進(jìn)入開(kāi)發(fā)者模式。
importrequests
#1.找到數(shù)據(jù)所在url地址(系統(tǒng)分析網(wǎng)頁(yè)性質(zhì))
url="/g/2168"
headers={
'User-Agent':'User-Agent:Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36'
'(KHTML,likeGecko)Chrome/87.0.4280.88Safari/537.36'
#2.發(fā)送網(wǎng)絡(luò)請(qǐng)求
response=requests.get(url=url,headers=headers)
html_data=response.text
print(html_data)
不難發(fā)現(xiàn)所有的小姐姐直播封面對(duì)應(yīng)的都是在li標(biāo)簽里面。我們只要解析獲取這些li標(biāo)簽數(shù)據(jù)就可以了。
接著我們需要拿到直播小姐姐的封面圖片,通過(guò)分析上面li標(biāo)簽里面的內(nèi)容,可以發(fā)現(xiàn)下面有個(gè)a標(biāo)簽,里面的img標(biāo)簽中的data-original不就是我們要的小姐姐圖片嘛!
接下來(lái)我們想要獲取主播小姐姐的名字怎么辦呢?點(diǎn)開(kāi)li標(biāo)簽繼續(xù)分析,可以看到下面有個(gè)span標(biāo)簽,其中的i標(biāo)簽內(nèi)容就是小姐姐直播的名字。
網(wǎng)頁(yè)結(jié)構(gòu)我們上面已經(jīng)分析好了,那么我們就可以來(lái)動(dòng)手爬取我們所需要的數(shù)據(jù)了。獲取到所有的數(shù)據(jù)資源之后,把圖片保存下來(lái)即可。文件的下載保存的方式比較多,我用的是通過(guò)withopen打開(kāi)文件的方式,比較簡(jiǎn)單。
#3.數(shù)據(jù)解析
selector=parsel.Selector(html_data)
lis=selector.xpath('//li[@]')#所有l(wèi)i標(biāo)簽
forliinlis:
img_name=li.xpath('.//span[@]/i/text()').get()#主播名字
img_url=li.xpath('.//a/img/@data-original').get()#主播圖片地址
#print(img_name,img_url)
#請(qǐng)求圖片數(shù)據(jù)
img_data=requests.get(url=img_url).content#圖片數(shù)據(jù)
#4.數(shù)據(jù)保存
#準(zhǔn)備文件名
file_name=img_name+'.jpg'
withopen('img\\'+file_name,mode='wb')asf:
f.write(img_data)
print('正在保存:',file_name)
這樣小姐姐的直播名稱和照片都可以保存下來(lái)了,效果如下:
2.主播顏值評(píng)分
我們調(diào)用的是百度開(kāi)放的人臉識(shí)別接口–百度AI開(kāi)放平臺(tái)鏈接。
這里面我們可以創(chuàng)建一個(gè)人臉識(shí)別應(yīng)用,其中的APIKey及SecretKey后面我們調(diào)用人臉識(shí)別檢測(cè)接口時(shí)會(huì)用到。
接下來(lái)我們可以看看官方提供的API幫助文檔,里面介紹的很詳細(xì)。包括如何調(diào)用請(qǐng)求URL數(shù)據(jù)格式,向API服務(wù)地址使用POST發(fā)送請(qǐng)求,必須在URL中帶上參數(shù)access_token,可通過(guò)后臺(tái)的APIKey和SecretKey生成。這里面的APIKey和SecretKey就是我們上面提到的。
那我們要的打分顏值分?jǐn)?shù)是哪個(gè)呢?提供返回結(jié)果參數(shù),可以看到里面有個(gè)beauty就是我們要的顏值分?jǐn)?shù)。
這樣顏值檢測(cè)的接口流程基本就已經(jīng)清楚了,可以進(jìn)行代碼實(shí)現(xiàn)了。
其中獲
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 影像本科頭頸部影像診斷學(xué)復(fù)習(xí)題
- 優(yōu)化項(xiàng)目的計(jì)劃方案
- 財(cái)務(wù)審計(jì)人員保密協(xié)議及離職競(jìng)業(yè)禁止合同
- 創(chuàng)新離婚協(xié)議書(shū)范本注重離婚后子女教育問(wèn)題
- 社區(qū)小院花園改造方案
- 精密儀器使用廠房租賃安全協(xié)議范本
- 主題婚禮策劃與執(zhí)行合同
- 電子產(chǎn)品回收處理與售后服務(wù)協(xié)議
- 勞務(wù)分包實(shí)施方案
- 標(biāo)桿管理控制方案模板
- 2025江蘇省惠隆資產(chǎn)管理限公司招聘30人易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 《農(nóng)村基層干部廉潔履行職責(zé)規(guī)定》解讀與培訓(xùn)
- 2023年上海高考生物真題試卷(答案解析版)
- 安全評(píng)價(jià) 課件
- 臨床各科急救流程規(guī)范規(guī)范圖
- 交安工程勞務(wù)分包參考價(jià)格(范本)
- 2022年專業(yè)技術(shù)人員繼續(xù)教育公需課題庫(kù)(含答案)
- GB∕T 13554-2020 高效空氣過(guò)濾器
- (新版)孤殘兒童試題庫(kù)(含答案)
- 普通生物學(xué)說(shuō)課(張艷麗)
- 歐亨利介紹及其作品
評(píng)論
0/150
提交評(píng)論