高德地圖數(shù)據(jù)采集方法_第1頁(yè)
高德地圖數(shù)據(jù)采集方法_第2頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、八爪魚云采集網(wǎng)絡(luò)爬蟲軟件 高德地圖數(shù)據(jù)采集方法本文介紹使用八爪魚采集高德地圖數(shù)據(jù)(以美食地址為例)的方法。采集網(wǎng)站:/采集的內(nèi)容包括:店鋪名,分類,地址,聯(lián)系號(hào)碼使用功能點(diǎn):l 創(chuàng)建循環(huán)翻頁(yè)l 分頁(yè)列表信息采集l Ajax設(shè)置步驟1:創(chuàng)建高德地圖數(shù)據(jù)采集任務(wù)1)進(jìn)入主界面,選擇“自定義采集2) 將要采集的網(wǎng)站URL復(fù)制粘貼到輸入框中,點(diǎn)擊“保存網(wǎng)址”步驟2:文本輸入1)鼠標(biāo)移動(dòng)到地址選擇框,在右面的提示框中選擇“點(diǎn)擊該元素”然后鼠標(biāo)選中輸入框,在提示框中選擇“輸入文字”3) 在彈出的輸入框中輸入要采集的城市,這里以新鄉(xiāng)為例

2、,然后點(diǎn)擊確定。鼠標(biāo)點(diǎn)擊新鄉(xiāng),并在輸入框中選擇“點(diǎn)擊該元素”步驟3:創(chuàng)建翻頁(yè)循環(huán)1) 移動(dòng)鼠標(biāo),在右面拖入一個(gè)循環(huán)框,如下圖所示鼠標(biāo)點(diǎn)擊輸入框,在右面提示框中選擇“輸入文字”,然后選擇確定把輸入文字的步驟拖入規(guī)則流程,在高級(jí)選項(xiàng)中選擇執(zhí)行前等待“2秒”,選擇文本列表,并在列表中輸入需要采集的品類,這里以菜系為例,如下圖可輸入“火鍋”等。鼠標(biāo)選中輸入文本步驟,高級(jí)選項(xiàng)中勾選使用當(dāng)前循環(huán)里的文本來(lái)填充輸入框2) 鼠標(biāo)點(diǎn)中搜索框,接著選擇“循環(huán)點(diǎn)擊每個(gè)元素”。3) 進(jìn)入火鍋店列表頁(yè)后,鼠標(biāo)移動(dòng)到最后并選中翻頁(yè)按鈕,在右面的提示框中選擇”循環(huán)點(diǎn)擊的單個(gè)元素“3)之后選中火鍋店的第一條鏈接,系統(tǒng)自動(dòng)識(shí)別

3、出其他的元素后,在右面的提示框中選擇“選中全部”,以創(chuàng)建循環(huán)翻頁(yè)。再選擇“循環(huán)點(diǎn)擊單個(gè)元素”步驟4:高德地圖數(shù)據(jù)提取詳細(xì)信息1)進(jìn)入列表詳情頁(yè)以后,選中店名, 然后在右面的提示框中選擇“采集該元素文本”,同樣操作,可以把地址、分類等信息采集下來(lái)。2)然后鼠標(biāo)點(diǎn)中字段旁邊的編輯標(biāo)識(shí),可以對(duì)提取字段的自定義命名,點(diǎn)中旁邊的刪除標(biāo)識(shí)可以刪除不需要的字段。鼠標(biāo)選中返回,然后選擇“點(diǎn)擊該元素”步驟5:Ajax設(shè)置由于此網(wǎng)頁(yè)涉及Ajax技術(shù),我們需要進(jìn)行一些高級(jí)選項(xiàng)的設(shè)置。選中“點(diǎn)擊元素”步驟,打開(kāi)“高級(jí)選項(xiàng)”,勾選“Ajax加載數(shù)據(jù)”,設(shè)置時(shí)間為“2秒”。每一個(gè)點(diǎn)擊元素的高級(jí)選項(xiàng)都需要設(shè)置。Ajax設(shè)置

4、完成之后,再重新啟動(dòng)本地采集,采集完成后,會(huì)跳出提示,選擇“導(dǎo)出數(shù)據(jù)”選擇“合適的導(dǎo)出方式”,將采集好的數(shù)據(jù)導(dǎo)出這里我們選擇excel作為導(dǎo)出為格式,數(shù)據(jù)導(dǎo)出后如下圖相關(guān)采集教程:百度地圖數(shù)據(jù)采集:/tutorialdetail-1/cjbddtsj-7.html騰訊地圖數(shù)據(jù)采集:/tutorialdetail-1/txdtdatacj.html淘寶買家秀圖片采集詳細(xì)教程:/tutorialdetail-1/tbmjxpic.html百度貼吧帖子信息采集詳細(xì)教程:

5、/tutorialdetail-1/tiebashendu.html知乎信息采集詳細(xì)教程,以知乎發(fā)現(xiàn)話題為例:/tutorialdetail-1/zh-ht.html八爪魚7.0版本云采集使用方法(含定時(shí)云采集):/tutorialdetail-1/ycjsyff_7.html八爪魚90萬(wàn)用戶選擇的網(wǎng)頁(yè)數(shù)據(jù)采集器。1、操作簡(jiǎn)單,任何人都可以用:無(wú)需技術(shù)背景,會(huì)上網(wǎng)就能采集。完全可視化流程,點(diǎn)擊鼠標(biāo)完成操作,2分鐘即可快速入門。2、功能強(qiáng)大,任何網(wǎng)站都可以采:對(duì)于點(diǎn)擊、登陸、翻頁(yè)、識(shí)別驗(yàn)證碼、瀑布流、Ajax腳本異步加載數(shù)據(jù)的網(wǎng)頁(yè),均可經(jīng)過(guò)簡(jiǎn)單設(shè)置進(jìn)行采集。3、云采集,關(guān)機(jī)也可以。配置好采集任務(wù)后可關(guān)機(jī),任務(wù)可在云端執(zhí)行。龐大云采集集群24*7不間斷運(yùn)行,不用擔(dān)心

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論