2018年數(shù)學(xué)建模B“拍照賺錢”的任務(wù)定價(jià)模型_第1頁
2018年數(shù)學(xué)建模B“拍照賺錢”的任務(wù)定價(jià)模型_第2頁
2018年數(shù)學(xué)建模B“拍照賺錢”的任務(wù)定價(jià)模型_第3頁
2018年數(shù)學(xué)建模B“拍照賺錢”的任務(wù)定價(jià)模型_第4頁
2018年數(shù)學(xué)建模B“拍照賺錢”的任務(wù)定價(jià)模型_第5頁
已閱讀5頁,還剩14頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 “拍照賺錢”的任務(wù)定價(jià)模型摘要本題要求分析“拍照賺錢”任務(wù)的服務(wù)模式,研究其定價(jià)規(guī)律,并設(shè)計(jì)新的任務(wù)定價(jià)方案,結(jié)合實(shí)際情況,修改定價(jià)模型,最終對(duì)新項(xiàng)目設(shè)計(jì)任務(wù)定價(jià)方案,并評(píng)價(jià)方案的實(shí)施效果。求解的具體流程如下:針對(duì)問題一:為了研究項(xiàng)目的定價(jià)規(guī)律,分析任務(wù)未完成的原因,利用附件一的信息,在地圖上定位所有坐標(biāo)的位置,發(fā)現(xiàn)任務(wù)集中在廣東、東莞、佛山、深圳四市,分別標(biāo)明每個(gè)城市的成功任務(wù)和失敗任務(wù)。以深圳為例,對(duì)深圳市任務(wù)進(jìn)行聚類分析,結(jié)果分成5類,由相應(yīng)任務(wù)的定價(jià)可以得出,人口密集處定價(jià)較低,人口稀少處定價(jià)較高的定價(jià)規(guī)律。將附件二的位置信息同理在地圖上定位,分別計(jì)算任務(wù)周圍的會(huì)員數(shù),分析其與定價(jià)的

2、聯(lián)系。針對(duì)問題二:由問題一結(jié)果可知,任務(wù)定價(jià)與任務(wù)周圍人數(shù)和任務(wù)周圍人口密度等因素有關(guān)。利用網(wǎng)絡(luò)爬蟲爬取廣州、東莞、佛山、深圳四市醫(yī)院,學(xué)校,小區(qū),超市四種人口密度較大場所的經(jīng)緯度,統(tǒng)計(jì)成功任務(wù)周圍十公里人口密集場所。用RBF神經(jīng)網(wǎng)絡(luò)模型,從而確定新的定價(jià)方案。將此方案與原方案進(jìn)行比較,得出兩種定價(jià)方案的差異。針對(duì)問題三:為了解決用戶爭相選擇位置集中任務(wù)等問題,可將多個(gè)任務(wù)聯(lián)合打包,以便用戶更好得執(zhí)行任務(wù)。利用問題二中RBF神經(jīng)網(wǎng)絡(luò)模型求出新的定價(jià)方案下的任務(wù)定價(jià);同問題一,求任意兩個(gè)任務(wù)之間的距離。當(dāng)兩個(gè)任務(wù)之間的距離小于一定值時(shí),便可將這兩個(gè)任務(wù)種做打包處理。對(duì)于打包的任務(wù),可將每個(gè)任務(wù)的

3、定價(jià)結(jié)合附近會(huì)員的信息求出最終定價(jià);對(duì)于未打包的任務(wù),任務(wù)定價(jià)不變。 針對(duì)問題四:為了對(duì)新項(xiàng)目設(shè)計(jì)定價(jià)方案,并評(píng)價(jià)方案的實(shí)施效果,將新項(xiàng)目中任務(wù)的位置定位于地圖上,可以發(fā)現(xiàn)任務(wù)集中分布于兩個(gè)區(qū)域,且兩個(gè)區(qū)域距離較遠(yuǎn),可認(rèn)為互不影響。結(jié)合前面問題的分析,可知任務(wù)定價(jià)與區(qū)域的經(jīng)濟(jì)發(fā)展情況和用戶到任務(wù)的距離有關(guān)。對(duì)用戶而言,用戶將優(yōu)先選擇距離較近且定價(jià)較高的任務(wù),因此,可以使用灰度關(guān)聯(lián)分析的方法,建立不同任務(wù)對(duì)會(huì)員的吸引力,從而對(duì)定價(jià)方案做出評(píng)價(jià)。關(guān)鍵詞:聚類分析、RBF神經(jīng)、灰色關(guān)聯(lián)分析法、網(wǎng)絡(luò)爬蟲一、問題重述“拍照賺錢”是移動(dòng)互聯(lián)網(wǎng)下的一種自助式服務(wù)模式。用戶下載APP,注冊(cè)成為APP的會(huì)員,然

4、后從APP上領(lǐng)取需要拍照的任務(wù)(比如上超市去檢查某種商品的上架情況),賺取APP對(duì)任務(wù)所標(biāo)定的酬金。APP是該平臺(tái)運(yùn)行的核心,而APP中的任務(wù)定價(jià)又是其核心要素。如果定價(jià)不合理,有的任務(wù)就會(huì)無人問津,而導(dǎo)致商品檢查的失敗。1.研究附件一中項(xiàng)目的任務(wù)定價(jià)規(guī)律,分析任務(wù)未完成的原因。2.為附件一中的項(xiàng)目設(shè)計(jì)新的任務(wù)定價(jià)方案,并和原方案進(jìn)行比較。3.實(shí)際情況下,多個(gè)任務(wù)可能因?yàn)槲恢帽容^集中,導(dǎo)致用戶會(huì)爭相選擇,一種考慮是將這些任務(wù)聯(lián)合在一起打包發(fā)布。在這種考慮下,如何修改前面的定價(jià)模型,對(duì)最終的任務(wù)完成情況又有什么影響?4.對(duì)附件三中的新項(xiàng)目給出你的任務(wù)定價(jià)方案,并評(píng)價(jià)該方案的實(shí)施效果。二、模型假設(shè)

5、1.會(huì)員對(duì)任務(wù)沒有主觀偏好,不會(huì)因?yàn)樽陨碓虿煌瓿扇蝿?wù);2.各個(gè)任務(wù)難度相等,不影響會(huì)員的選擇;3.假設(shè)會(huì)員與任務(wù)間的距離都是直線距離,不受道路、河流等的影響;4.問題中所有數(shù)據(jù)都真實(shí)有效。三、符號(hào)說明符號(hào)含義r地球半徑l兩地之間的球面距離,兩地的緯度兩地的經(jīng)度差P打包后總價(jià)四、問題分析4.1 問題一分析問題一要求研究附件一中項(xiàng)目的定價(jià)規(guī)律,并分析任務(wù)未完成的原因。首先應(yīng)在地圖中找出附件一中所有任務(wù)的位置,確定任務(wù)的分布規(guī)律,同時(shí)將附件二中會(huì)員的位置定位于地圖。觀察出這些數(shù)據(jù)集中分布在廣東、東莞、佛山、深圳四個(gè)城市。以深圳市為例,對(duì)深圳的任務(wù)進(jìn)行聚類分析,分析聚類結(jié)果,從而得出項(xiàng)目的定價(jià)規(guī)律。

6、分別計(jì)算每個(gè)任務(wù)與所有會(huì)員之間的距離,結(jié)合每個(gè)任務(wù)周圍十公里的會(huì)員數(shù)與任務(wù)的定價(jià),確定任務(wù)未完成的原因。4.2 問題二分析問題一可明顯看出任務(wù)價(jià)格與任務(wù)周圍人數(shù)和任務(wù)所在地區(qū)人口密度等有關(guān)。利用網(wǎng)絡(luò)爬蟲爬取廣州等四市醫(yī)院、學(xué)校、小區(qū)、超市等人口密度大的場所,統(tǒng)計(jì)成功任務(wù)方圓十公里內(nèi)的人口密度大的場所個(gè)數(shù)。使用RBF神經(jīng)網(wǎng)絡(luò)分析,用所獲得的數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),從而確定新的任務(wù)定價(jià)方案。將新的任務(wù)定價(jià)方案與附件一中的任務(wù)定價(jià)做出比較,說明兩種定價(jià)方案的不同情況。4.3 問題三分析問題三要求將任務(wù)打包發(fā)布并設(shè)計(jì)新的定價(jià)方案,以解決用戶爭相選擇等問題。利用問題二中RBF神經(jīng)網(wǎng)絡(luò)模型求出新的定價(jià)方案下的任

7、務(wù)的定價(jià);利用問題一中兩點(diǎn)經(jīng)緯度坐標(biāo)求出兩點(diǎn)距離的計(jì)算方法求出每個(gè)任務(wù)與其他任務(wù)之間的距離,當(dāng)兩個(gè)任務(wù)之間的距離小于一定值時(shí),便可將這兩個(gè)任務(wù)種做打包處理。對(duì)于打包的任務(wù),可將每個(gè)任務(wù)的定價(jià)結(jié)合附近會(huì)員的信息求出最終定價(jià);對(duì)于未打包的任務(wù),任務(wù)定價(jià)不變。 4.4 問題四分析問題四要求對(duì)一個(gè)新項(xiàng)目設(shè)計(jì)定價(jià)方案,并評(píng)價(jià)該方案的實(shí)施效果,將附件三中的任務(wù)的地理位置定位于地圖上,可以發(fā)現(xiàn)任務(wù)集中分布于兩個(gè)區(qū)域。通過前面的問題分析可知,任務(wù)定價(jià)與地區(qū)經(jīng)濟(jì)發(fā)展水平和會(huì)員距離有關(guān)。對(duì)會(huì)員而言,可以從任務(wù)的難易程度和會(huì)員到任務(wù)的距離兩個(gè)方面判斷會(huì)員對(duì)任務(wù)的偏好,從而使用灰度關(guān)聯(lián)分析對(duì)的方法,建立不同任務(wù)對(duì)會(huì)員

8、吸引力的模型,便可以對(duì)這種方案的實(shí)施效果做出分析。五、模型建立與求解5.1 問題一模型利用地圖定位將附件一中經(jīng)度緯度定位到地圖中,發(fā)現(xiàn)這些數(shù)據(jù)集中分布在廣東,東莞,佛山和深圳四個(gè)城市中。分別分析四個(gè)城市的價(jià)格規(guī)律,以深圳市為例??紤]到城市內(nèi)部存在區(qū)的劃分,因此對(duì)數(shù)據(jù)進(jìn)行聚類分析,猜測聚類結(jié)果呈區(qū)域塊狀分布,結(jié)果同樣驗(yàn)證猜測。這是價(jià)格的分布規(guī)律,其內(nèi)部原因是受每個(gè)任務(wù)周圍會(huì)員數(shù)量的影響。分別求出任務(wù)方圓每十公里會(huì)員人數(shù),分析任務(wù)周圍的會(huì)員數(shù)與任務(wù)定價(jià)的關(guān)系,從而確定任務(wù)未完成的原因。5.1.1模型建立此題采用Q型聚類法建立模型并求解。Step1. 距離表5.1.1 數(shù)據(jù)觀測值樣本變量x1x2xp

9、1x11x12x1p2x21x22x2p nxn1xn2xnp設(shè) xik 為第i個(gè)樣本的第k個(gè)指標(biāo),數(shù)據(jù)觀測值如上表所示。在表中,每個(gè)樣本有p個(gè)變量,故每個(gè)樣本可以看作 Rp 中的一個(gè)點(diǎn),n個(gè)樣本就是 Rp 中的n個(gè)點(diǎn)。在 Rp 中需要定義某種距離,第i個(gè)樣本與第j個(gè)樣本之間的距離記為 dij ,在聚類過程中距離較近的點(diǎn)傾向于歸為一類,距離較遠(yuǎn)的點(diǎn)應(yīng)屬于不同類。所定義的距離滿足如下4個(gè)條件:(1) dij0 ,對(duì)一切i,j;(2) dij=0 ,當(dāng)且僅當(dāng)?shù)趇個(gè)樣本與第j個(gè)樣本的各個(gè)變量值相等;(3) dij=dji ,對(duì)一切i,j;(4) dijdik+dkj ,對(duì)一切的i,j,k。最常用的幾

10、種距離:(1) Minkowski(閔可夫斯基)距離dijq=k=1pxik-xjkq1q , q0 對(duì)于q=1時(shí),對(duì)應(yīng)的是絕對(duì)值距離(2) 絕對(duì)值距離dij1=k=1pxik-xjk 對(duì)于q=2時(shí),對(duì)應(yīng)的是Euclid距離(3) Euclid(歐幾里得)距離dij2=k=1pxik-xjk2 Step2. 數(shù)據(jù)標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化變換:xij*=xij-xjsj,i=1,2,n;j=1,2,p 其中,均值:xj=1nk=1nxkj方差:sj=1n-1k=1nxkj-xj2變換后的數(shù)據(jù)均值為0,標(biāo)準(zhǔn)差為1,而且標(biāo)準(zhǔn)化后的數(shù)據(jù)與變量的量綱無關(guān)。Step3. 系統(tǒng)聚類系統(tǒng)聚類法(hierarchical

11、clustering method)是聚類分析諸多方法中用的最多的一種,其基本思想是:開始將n個(gè)樣本各自為一類,并規(guī)定樣本之間的距離和類與類之間的距離,然后將距離最近的兩類合并成一個(gè)新類,計(jì)算新類與其它類的距離;重復(fù)進(jìn)行兩個(gè)最近類的合并,每次減少一類,直到所有樣本合并為一類。以下用 dij 表示第i個(gè)樣本與第j個(gè)樣本的距離,G1 , G2 ,表示類,DKL 表示GK 與 GL 的距離。下面所介紹的系統(tǒng)聚類法中,所有的方法開始時(shí)每個(gè)樣本自成一類,類與類之間的距離與樣本之間的距離相同,即 DKL=dKL ,所以最初的距離矩陣全部相同,記為 D0=dij 。常用的系統(tǒng)聚類法:(1)重心法類與類之間的

12、距離定義為它們重心(均值)之間的Euclid距離。設(shè) GK 與 GL 的重心分別為xK 和 xL ,則 GK 和 GL 之間的平方距離為:DKL2=dxKxL2=xK-xLTxK-xL這種系統(tǒng)聚類方法稱為重心法(centroid hierarchical method)。它的遞推公式為:DMJ2=nKnMDKJ2+nLnMDLJ2-nKnLnM2DKL2 重心法在處理異常值方面比其它系統(tǒng)聚類法更穩(wěn)健,但是其他方面卻不如離差平方和法的效果好。(2)離差平方和法(Ward方法)離差平方和法基于方差分析的思想,如果分類分得正確,則同類樣本之間的離差平方和應(yīng)當(dāng)較小,不同類樣本之間的離差平方和應(yīng)當(dāng)較大。

13、設(shè)類GK與GL 合并成新的類GM,則GK,GL,GM 的離差平方和分別為:WK=iGKxi-xKTxi-xKWL=iGLxi-xLTxi-xLWM=iGMxi-xMTxi-xM其中xK,xL和xM分別是GK,GL和GM的重心。所以WK,WL和WM反應(yīng)各自類內(nèi)樣本的分散程度。如果GK和GL這兩類相距較近,則合并后所增加的離差平方和WM-WK-WL應(yīng)較??;否則,應(yīng)較大。于是定義GK和GL之間的平方距離為:DKL2=WM-WK-WL這種系統(tǒng)聚類法稱為離差平方和法或Ward方法(Wards minimum variance method)。它的遞推公式為:DMJ2=nJ+nKnJ+nMDKJ2+nJ+

14、nLnJ+nMDLJ2-nJnJ+nMDKL2GK和GL之間的平方距離也可以寫成DKL2=nKnLnMxK-xLTxK-xL由上述分析可見,這個(gè)距離與重心法給出的距離只差一個(gè)常數(shù)倍。重心法的類間距與兩樣本的樣本數(shù)無關(guān),而離差平方和法的類間距與兩類的樣本數(shù)有關(guān)。兩個(gè)大類傾向于有較大的距離,因而不易合并,這更符合對(duì)聚類的實(shí)際要求。離差平方和法在很多場合下優(yōu)于重心法,是一種較好的系統(tǒng)聚類法,但它對(duì)異常值很敏感。Step4. 已知兩地經(jīng)緯度求兩地距離 和分別是兩地的緯度,北緯記為正;是兩地的經(jīng)度差,r是地球半徑。忽略各地海拔高度差異,認(rèn)為地球是理想的球面。設(shè)L是兩地的距離(地球的一條弦長),l是兩地的

15、球面距離(沿地球表面的弧長)。則:k=sin-sin2+cos-coscos2+cossin2L=rk可求得:l=2rsin-1k2分別計(jì)算出以每個(gè)任務(wù)位置為中心,半徑為十公里的區(qū)域(即為方圓每十公里)內(nèi)會(huì)員的人數(shù)與相應(yīng)的任務(wù)定價(jià),通過成功任務(wù)和失敗任務(wù)每十公里內(nèi)的會(huì)員人數(shù)比較即可得出任務(wù)失敗的原因。5.1.2模型求解Step1. 基本數(shù)據(jù)處理清洗數(shù)據(jù),對(duì)于有明顯錯(cuò)誤的數(shù)據(jù)給予改正,例如將附件二中的“113.13148 23.031824”改為“23.031824 113.13148”。對(duì)于附件一和附件二中的任務(wù)與會(huì)員坐標(biāo),使用XGeocoding解析出每個(gè)坐標(biāo)所對(duì)應(yīng)的地理位置,得出任務(wù)與會(huì)員

16、集中分布于廣東,東莞,佛山和深圳,則可刪除極少的處于其他市的任務(wù)與會(huì)員,得到模型中使用的有效數(shù)據(jù)。表5.1.2 城市中的任務(wù)數(shù)與會(huì)員數(shù)城市任務(wù)數(shù)量會(huì)員數(shù)廣州市322665深圳市161629佛山市173216東莞市179351Step2. 確定定價(jià)規(guī)律(以深圳市為例)利用BDP在線數(shù)據(jù)分析軟件將任務(wù)信息在地圖上標(biāo)出,將深圳市中的任務(wù)聚類分析,聚類后分成了五類1,2,3,4和5。其中每一類任務(wù)在地圖上的分布如下圖:圖5.1.1 深圳市任務(wù)分類圖表5.1.3 每一類中個(gè)數(shù)和定價(jià)的均值聚類的類別個(gè)數(shù)定價(jià)均值13567.6857124566.4777831268.546266.088715776.857

17、14顯然,這很符合實(shí)際,人口密集區(qū)任務(wù)定價(jià)偏低,如類別4所在區(qū)域?yàn)槿丝诿芗瘏^(qū),人口密度較小,相應(yīng)任務(wù)定價(jià)較低;偏遠(yuǎn)地區(qū)定價(jià)高,而且明顯高過其他類別,如類別5所在區(qū)域,任務(wù)分布很廣,但任務(wù)定價(jià)為所有類別中最高。同理可得出東莞,佛山,深圳三市的任務(wù)與價(jià)格分布。這就是項(xiàng)目的任務(wù)定價(jià)規(guī)律。Step3. 分析任務(wù)未完成原因通過Matlab編寫程序分別求出每個(gè)任務(wù)方圓十公里內(nèi)的會(huì)員人數(shù),分析方圓十公里內(nèi)的會(huì)員人數(shù)與任務(wù)是否完成的關(guān)系。從附件一中統(tǒng)計(jì)可得,共有522個(gè)成功任務(wù),313個(gè)失敗的任務(wù)。首先求出每個(gè)成功任務(wù)與每個(gè)會(huì)員的距離,然后篩選出任務(wù)方圓十公里內(nèi)的會(huì)員人數(shù)。同理可以求得失敗任務(wù)方圓十公里內(nèi)的會(huì)

18、員人數(shù)。畫出其統(tǒng)計(jì)直方圖,如下圖所示:圖5.1.2 成功任務(wù)頻數(shù)分布直方圖圖5.1.3 失敗任務(wù)頻數(shù)分布直方圖從圖中可以看出,大部分成功任務(wù)方圓十公里內(nèi)的會(huì)員人數(shù)在150人以下,在方圓每十公里少于100人之前,隨著方圓十公里內(nèi)人數(shù)的增加,成功任務(wù)總數(shù)增加;在方圓每十公里大于100人之后,隨著方圓十公里內(nèi)人數(shù)的增加,成功任務(wù)總數(shù)減少。失敗任務(wù)方圓十公里內(nèi)人數(shù)分布比較均勻,但總體也呈先增加后遞減的規(guī)律。失敗任務(wù)頻數(shù)分布直方圖顯示雖然有一部分任務(wù)方圓每十公里會(huì)員很多,但任務(wù)仍然失敗。這可能和會(huì)員的活躍度有關(guān),導(dǎo)致會(huì)員總數(shù)雖多,但活躍會(huì)員很少。實(shí)際情況中,如果有任務(wù)未完成,可分為有人執(zhí)行任務(wù)但失敗,無

19、人執(zhí)行任務(wù)兩種情況。在第一種情況下,即有人執(zhí)行任務(wù)但執(zhí)行失敗時(shí),可能的原因有,任務(wù)本身過于困難,超出會(huì)員的能力,或任務(wù)時(shí)間過短,在規(guī)定時(shí)間內(nèi)無法完成;第二種情況時(shí),任務(wù)已在軟件發(fā)布,但無人愿意執(zhí)行該任務(wù),可能的原因有任務(wù)地點(diǎn)與會(huì)員所在地距離過遠(yuǎn),會(huì)員不愿意花費(fèi)過多的時(shí)間;任務(wù)定價(jià)過低或過于困難,會(huì)員認(rèn)為本身的勞動(dòng)價(jià)值高于任務(wù)價(jià)值;任務(wù)發(fā)布的時(shí)間過短,導(dǎo)致無人可執(zhí)行。附件二中給出了會(huì)員的信譽(yù)度,信譽(yù)度較高的會(huì)員越優(yōu)先開始挑選任務(wù),配額也就越大。由失敗任務(wù)的直方圖可以得到,任務(wù)方圓十公里的會(huì)員數(shù)很多,任務(wù)失敗仍有一定的比例,推測可得,會(huì)員信譽(yù)度與任務(wù)完成情況有關(guān),會(huì)員信譽(yù)度越高,任務(wù)完成的概率越大

20、;反之,會(huì)員的信譽(yù)度越低,接收任務(wù)后無法完成的可能性越大。5.2 問題二模型從問題一中發(fā)現(xiàn),任務(wù)價(jià)格除了與任務(wù)周圍的會(huì)員人數(shù)有關(guān),也與其所在地區(qū)的人口密度和地理位置等有關(guān)。運(yùn)用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練學(xué)習(xí)確定新的任務(wù)定價(jià)方案。將設(shè)計(jì)出的定價(jià)方案與附件一中的定價(jià)方案進(jìn)行比較,即可得到雙方各自的優(yōu)缺點(diǎn)。5.2.1模型建立Step1. RBF神經(jīng)網(wǎng)絡(luò)(徑向基神經(jīng)網(wǎng)絡(luò))(1)網(wǎng)絡(luò)參數(shù)確定RBF神經(jīng)網(wǎng)絡(luò)由輸入層,隱含層和輸出層組成,其隱含層基函數(shù)常為高斯函數(shù)。最常用的函數(shù)為:RiX=exp-X-Ci22i2,i=1,10其中,i為徑向基函數(shù)的擴(kuò)展常數(shù),反應(yīng)函數(shù)圖像的寬度。X為輸入向量,Ci為基函數(shù)的中心向

21、量,與X有相同維數(shù)的向量;X-Ci為向量X-Ci的范式,通常表示X與Ci之間的距離;RiX在Ci處有唯一的最大值,隨著X-Ci的增大,RiX迅速衰減到0。在本題中,任務(wù)的輸入樣本共有10個(gè),即輸入層的輸入為X=x1,x2,x10;輸出為任務(wù)定價(jià),即實(shí)際輸出為Y=y,建立多輸入、單輸出的三層網(wǎng)絡(luò)結(jié)構(gòu)。RBF網(wǎng)絡(luò)輸入層與隱含層直接連接,相當(dāng)于直接將輸入變量輸入到隱含層。對(duì)于給定的輸入,只有小部分靠近X的中心被激活。當(dāng)確定了RBF網(wǎng)絡(luò)的聚類中心Ci、擴(kuò)展常數(shù)i與隱含層到輸出層的權(quán)值以后,就可求出給定某一輸入時(shí),網(wǎng)絡(luò)對(duì)應(yīng)的輸出值。 圖5.2.1 RBF神經(jīng)網(wǎng)絡(luò)建模結(jié)構(gòu)(2)樣本數(shù)據(jù)訓(xùn)練學(xué)習(xí)在RBF神經(jīng)

22、網(wǎng)絡(luò)中,需要通過學(xué)習(xí)和訓(xùn)練確定基函數(shù)的擴(kuò)展常數(shù),基函數(shù)中心向量與隱含層到輸出層的權(quán)值。一般分為步進(jìn)行:確定基函數(shù)的中心向量通過“K均值聚類法”在訓(xùn)練樣本集中隨機(jī)選擇樣本作為徑向基函數(shù)的中心,將這個(gè)聚類中心作為基函數(shù)的中心向量。確定基函數(shù)的擴(kuò)展常數(shù)確定基函數(shù)中心向量后,可求得歸一化參數(shù),令其等于基函數(shù)中心與子樣本集中樣本模式之間的平均距離,求得基函數(shù)擴(kuò)展常量。確定隱含層到輸出層的權(quán)值RBF連接權(quán)值的確定可以采用最小的均方差誤差得到。Step2. 原始數(shù)據(jù)處理采用公式對(duì)樣本的輸入、輸出數(shù)據(jù)進(jìn)行規(guī)格化處理:t=2(t-tmin)tmax-tmin-1其中,t為規(guī)格化前的變量,tmax和tmin分別為

23、t的最大值和最小值;t為規(guī)格化后的變量。利用Matlab的歸一化處理函數(shù)對(duì)數(shù)據(jù)進(jìn)行歸一化處理,將具有不同尺度屬于不同區(qū)間的樣本的分量轉(zhuǎn)換到相同區(qū)間,從而使樣本的各個(gè)分量具有相同的尺度。便于RBF網(wǎng)絡(luò)的訓(xùn)練。Step3. 網(wǎng)絡(luò)訓(xùn)練 利用Matlab提供的神經(jīng)網(wǎng)絡(luò)工具箱可實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)功能,主要使用RBF網(wǎng)絡(luò)設(shè)計(jì)函數(shù)newrbe和newrb設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)。可用的樣本的個(gè)數(shù)為522,輸入變量的個(gè)數(shù)為512,作為訓(xùn)練集;將10組樣本作為檢驗(yàn)集,輸出變量的個(gè)數(shù)為1,中間隱含層神經(jīng)元的個(gè)數(shù),RBF網(wǎng)絡(luò)會(huì)在訓(xùn)練過程中自適應(yīng)地取定。編寫Matlab程序進(jìn)行訓(xùn)練,可得到各因素影響下對(duì)任務(wù)價(jià)格的預(yù)測結(jié)果。5.2.2

24、模型求解Step1. 確定訓(xùn)練樣本通過對(duì)完成任務(wù)分布與任務(wù)位置可得出,任務(wù)價(jià)格與任務(wù)周圍的會(huì)員人數(shù)和任務(wù)所在地區(qū)的人口密度有關(guān)。搜索廣州市人口密集地區(qū)的具體場所,將其分類為醫(yī)院,學(xué)校,小區(qū),超市,爬取網(wǎng)頁中場所的具體經(jīng)緯度坐標(biāo)。設(shè)每個(gè)成功任務(wù)方圓十公里的醫(yī)院數(shù)量為x1,學(xué)校數(shù)量為x2,小區(qū)數(shù)量為x3,超市數(shù)量為x4,相應(yīng)區(qū)域內(nèi)的會(huì)員人數(shù)為x5。數(shù)據(jù)經(jīng)過處理可得到下表,詳細(xì)數(shù)據(jù)見支撐材料:表5.2.1 成功任務(wù)方圓十公里的人口密集場所數(shù)量序號(hào)x1x2x3x4x5y1000012265.52000011765.55110000738551201025885Step2. 神經(jīng)網(wǎng)絡(luò)訓(xùn)練使用Matlab

25、的神經(jīng)網(wǎng)絡(luò)工具箱進(jìn)行數(shù)據(jù)訓(xùn)練與檢驗(yàn)。Matlab核心代碼如下: net1 = newrb(PN,TN) x = a(1:4,end);xn = mapminmax(apply,x,PS1); yn1 = sim(net1,xn);y1 = mapminmax(reverse,yn1,PS2); delta1 = abs(a(5,20)-y1)/a(5,20)其中,用于訓(xùn)練RBF網(wǎng)絡(luò),得到規(guī)律,以便后期預(yù)測結(jié)果;用于預(yù)測規(guī)格化的樣本自變量;用于求出預(yù)測值,并還原規(guī)格化的數(shù)據(jù);用于計(jì)算RBF網(wǎng)絡(luò)預(yù)測的相對(duì)誤差。將檢驗(yàn)基中的數(shù)據(jù)代入程序中進(jìn)行檢驗(yàn),可以得出預(yù)測定價(jià)和相對(duì)誤差,如下表:表5.2.2 R

26、BF測試檢驗(yàn)表測試組真實(shí)定價(jià)預(yù)測定價(jià)相對(duì)誤差17284.905.20%28072.0222.16%365.569.5206.17%46668.764.18%58067.837.74%68573.802.78%77269.892.93%88567.5513.09%965.566.160.02%108568.910.10%Step3. 與原方案比較結(jié)果 原方案中沒有考慮到學(xué)校,小區(qū)等密集地區(qū)對(duì)任務(wù)定價(jià)的影響,這和現(xiàn)實(shí)會(huì)產(chǎn)生很大的出入。本方案結(jié)合任務(wù)地點(diǎn)附近人口密集區(qū)對(duì)任務(wù)定價(jià)的影響。運(yùn)用具有很強(qiáng)的逼近能力,分類能力和學(xué)習(xí)速度的RBF神經(jīng)網(wǎng)絡(luò)模型得到了一個(gè)任務(wù)定價(jià)方案,經(jīng)過檢驗(yàn),結(jié)果誤差完全在可接受

27、的范圍之內(nèi)。而且,此模型具有易用性,任意已知數(shù)據(jù)帶入RBF模型即可得到定價(jià)結(jié)果。5.3 問題三模型在實(shí)際問題中,任務(wù)位置可能比較接近,打包發(fā)布因?yàn)閮r(jià)格較高不僅有利于調(diào)動(dòng)會(huì)員的積極性,還可以提高任務(wù)完成比率。首先,使用問題二的神經(jīng)網(wǎng)絡(luò)模型求出全部任務(wù)定價(jià)。然后確定打包條件,當(dāng)兩任務(wù)距離小于一定值時(shí),將兩任務(wù)打包。對(duì)于打包的任務(wù),由上面求得的任務(wù)定價(jià),再結(jié)合打包任務(wù)附近會(huì)員的個(gè)人信息給出最終定價(jià)。對(duì)于沒有打包的任務(wù),價(jià)格不變。5.3.1 模型建立Step1. 應(yīng)用問題二的神經(jīng)網(wǎng)絡(luò)模型求出所有任務(wù)的定價(jià),稱為初始定價(jià);Step2. 確定打包條件假設(shè)共有n個(gè)任務(wù),已知每個(gè)任務(wù)的經(jīng)緯度,可以求出每兩個(gè)任

28、務(wù)之間的距離,求解方式如問題一。由此可以得到一個(gè)n*n的矩陣:r11r12r1nr21r22r2nrn1rn2rnn其中rij表示第i個(gè)任務(wù)與第j個(gè)任務(wù)之間的距離,由此可知此矩陣是一個(gè)對(duì)稱矩陣。當(dāng)rij2時(shí),即兩任務(wù)距離小于2公里時(shí),把第i個(gè)任務(wù)與第j個(gè)任務(wù)進(jìn)行打包處理。如果有rij,rik,ril2,則把第i,j,k,l個(gè)任務(wù)進(jìn)行打包處理。由此可以完成所有的打包分類。Step3. 確定打包任務(wù)的定價(jià)表5.3.1 打包任務(wù)的相關(guān)信息任務(wù)ijk初始定價(jià)PiPjPk會(huì)員數(shù)/方圓十公里ninjnk信譽(yù)值總和RiRjRk假設(shè)將第i,j,k個(gè)任務(wù)進(jìn)行打包,其初始定價(jià),方圓十公里內(nèi)的會(huì)員數(shù),以及會(huì)員預(yù)訂任

29、務(wù)限額總值,信譽(yù)值總和見上表。Pi,Pj,Pk分別為相應(yīng)任務(wù)的初始定價(jià);ni,nj,nk分別為相應(yīng)任務(wù)方圓十公里內(nèi)的會(huì)員數(shù);Ri,Rj,Rk分別為相應(yīng)會(huì)員所對(duì)應(yīng)的信譽(yù)值總和。設(shè)打包后總價(jià)為P,則可求得最后打包總價(jià)為:P=iPi+jPj+kPk其中:i=Rj+RkRi+Rj+Rkj=Ri+RkRi+Rj+Rkk=Ri+RjRi+Rj+Rk5.3.2 模型求解Step1. 由問題二的神經(jīng)網(wǎng)絡(luò)模型可求出所有任務(wù)的初始定價(jià),如下表:表5.3.2 所有任務(wù)的初始定價(jià)表任務(wù)號(hào)碼A001A002A0833A0834A0835初始定價(jià)70.8969.5580.8860.5483.25Step2. 由附件一可知

30、,任務(wù)共有835個(gè),由此可以得到一個(gè)835*835的矩陣:013.98108.6013.98097.94108.6097.940根據(jù)每個(gè)任務(wù)對(duì)應(yīng)的經(jīng)緯度坐標(biāo)及兩坐標(biāo)之間的距離公式,分別求出每個(gè)任務(wù)與其他所有任務(wù)之間的距離,找出其中距離小于2公里的元素所對(duì)應(yīng)的任務(wù),列舉三例:1,29,362,11,12,16,17,22,23,356,7,13,19,29。 Step3. 選取一例進(jìn)行求解例如第1個(gè)任務(wù)與第29,362個(gè)任務(wù)打包在一起。分別求出每個(gè)任務(wù)和每一個(gè)會(huì)員之間的距離,選擇在任務(wù)方圓十公里內(nèi)的會(huì)員,確定每個(gè)會(huì)員的預(yù)訂任務(wù)限額及信譽(yù)值,求和可得預(yù)訂任務(wù)限額總值及信譽(yù)值總和。表5.3.3 任務(wù)

31、的初始定價(jià)及信譽(yù)值總和任務(wù)129362初始定價(jià)70.8965.5571.22信譽(yù)值總和123413221240根據(jù)模型可求得1=0.6733,29=0.6517,362=0.6733,則總價(jià)為P=2543。Step4. 對(duì)最終任務(wù)完成情況的影響修改后的模型可根據(jù)距離將多個(gè)任務(wù)同時(shí)發(fā)布給一個(gè)用戶,這種做法可以將少有用戶選擇的任務(wù)通過與另一個(gè)用戶愿意選擇的任務(wù)同時(shí)發(fā)布,促進(jìn)任務(wù)的完成;模型加入了會(huì)員自身情況的影響,打包的任務(wù)可以吸引更多的信譽(yù)度高的用戶執(zhí)行任務(wù),獲得更多的利益,因而可以促進(jìn)新用戶的注冊(cè),使更多的人前去完成任務(wù),最終任務(wù)會(huì)完成得更多。5.4 問題四模型將用戶位置數(shù)據(jù)導(dǎo)入地圖,可以發(fā)現(xiàn)

32、,新項(xiàng)目分布在兩個(gè)塊狀地區(qū),其中大部分分布在廣州市,少量分布在深圳市周圍。兩地相距大約130公里,因此,可以認(rèn)為兩地任務(wù)之間沒有影響,可以單獨(dú)分析。圖5.4.1 新項(xiàng)目用戶分布圖由前三問可知,任務(wù)定價(jià)水平與地區(qū)經(jīng)濟(jì)發(fā)展水平有很大關(guān)系,與會(huì)員距離任務(wù)點(diǎn)的遠(yuǎn)近也有很大關(guān)系。對(duì)于會(huì)員而言,會(huì)員的優(yōu)先選擇是選擇距離較小,定價(jià)較高,難度較小的任務(wù),不同會(huì)員對(duì)每個(gè)任務(wù)的距離,難易判別并不相同,我們選擇用灰度關(guān)聯(lián)分析的方法,建立不同任務(wù)對(duì)會(huì)員吸引力的模型。實(shí)現(xiàn)任務(wù)隊(duì)會(huì)員的實(shí)時(shí)更新。5.4.2 模型建立本文中灰度關(guān)聯(lián)分析具體步驟為:(1)確定評(píng)價(jià)對(duì)象和評(píng)價(jià)標(biāo)準(zhǔn)。本題中的評(píng)價(jià)對(duì)象是m個(gè)任務(wù),評(píng)價(jià)指標(biāo)有用戶與任務(wù)

33、的距離,任務(wù)附近的交通狀況,任務(wù)本身的難易程度。參考數(shù)列為x0=x0k|k=1,2,3,比較數(shù)列為xi=xik|k=1,2,3,i=1,2,3.(2)確定各指標(biāo)值對(duì)應(yīng)的權(quán)重。權(quán)重w=w1,w2,w3,其中wi表示第i個(gè)指標(biāo)對(duì)應(yīng)的權(quán)重。(3)計(jì)算灰度聯(lián)系關(guān)系:ik=minsmint|x0t-xst|+maxsmaxt|x0t-xst|x0k-xik|+maxsmaxt|x0t-xst|為比較數(shù)列xi對(duì)參考數(shù)列x0在第k個(gè)指標(biāo)上的關(guān)聯(lián)系數(shù),其中0,1為分辨系數(shù)。其中,minsmint|x0t-xst|、maxsmaxt|x0t-xst|分別為兩級(jí)最小差及兩級(jí)最大差。一般來講,分辨系數(shù)越大,分辨率越

34、大;越小,分辨率越小。(4)計(jì)算灰色加權(quán)關(guān)聯(lián)度?;疑訖?quán)關(guān)聯(lián)度的計(jì)算公式為ri=k=1nii(k)其中,ri為第i個(gè)評(píng)價(jià)對(duì)象對(duì)理想對(duì)象的灰色加權(quán)關(guān)聯(lián)度。(5)評(píng)價(jià)分析。根據(jù)灰色加權(quán)關(guān)聯(lián)度的大小,對(duì)各任務(wù)進(jìn)行排序,可建立任務(wù)的關(guān)聯(lián)序,關(guān)聯(lián)度越大,其對(duì)會(huì)員來說越有吸引力。5.4.3 實(shí)施效果 通過灰度關(guān)聯(lián)分析的方法,可以實(shí)現(xiàn)會(huì)員對(duì)任務(wù)的執(zhí)行意愿的排序。根據(jù)以往定價(jià)數(shù)據(jù),進(jìn)行精準(zhǔn)定價(jià)分析,每一個(gè)會(huì)員都可以得到一個(gè)任務(wù)價(jià)目表,促進(jìn)任務(wù)的能順利完成,極大提高了用戶體驗(yàn),使用戶與公司雙方都獲得收益。同時(shí)可以減少未完成任務(wù)的數(shù)量,使發(fā)布的任務(wù)更加可靠的完成。六、模型優(yōu)點(diǎn)與缺點(diǎn)優(yōu)點(diǎn)1. 模型易懂,實(shí)際應(yīng)用價(jià)值

35、高;2. 問題二中考慮因素較多,使結(jié)論更為準(zhǔn)確;3. 運(yùn)用網(wǎng)絡(luò)爬蟲,結(jié)合實(shí)際情況,從多種角度進(jìn)行分析。缺點(diǎn)1.問題一研究定價(jià)規(guī)律和分析任務(wù)未完成原因時(shí)考慮因素不全面,沒有把會(huì)員的因素考慮到模型中;2.問題四模型沒有數(shù)據(jù)進(jìn)行驗(yàn)證。七、參考文獻(xiàn)1 司守奎 孫璽菁,數(shù)學(xué)建模算法與應(yīng)用,北京,國防工業(yè)出版社,20152 劉載文,水環(huán)境系統(tǒng)智能化軟測量與控制方法,北京,中國輕工業(yè)出版社,20133 姜啟源 謝金星 葉俊,數(shù)學(xué)模型,北京,高等教育出版社, 20034 Robert I.Kabacoff 著,王小寧劉擷芯黃俊文等譯,R語言實(shí)戰(zhàn)(第2版),北京,人民郵電出版社,2016年5劉曉鋼,眾包中任務(wù)發(fā)

36、布者出價(jià)行為的影響因素研究,重慶大學(xué),2012附錄1.成功任務(wù)與會(huì)員之間的距離和成功任務(wù)方圓十里內(nèi)的會(huì)員數(shù)for j=1:522 for i=1:1878 D=distance(huiyuan(i,1),huiyuan(i,2),succase(j,1),succase(j,2); dx=D*6371*2*pi/360; dis1(j,i)=dx; endendx1=dis110;x1=sum(x1);2.成功任務(wù)與學(xué)校之間的距離和成功任務(wù)方圓十里內(nèi)的學(xué)校數(shù)for j=1:522 for i=1:395 D=distance(school(i,1),school(i,2),succase(j,1),succas

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論