2017數(shù)學(xué)建模B“拍照賺錢”的任務(wù)定價模型_第1頁
2017數(shù)學(xué)建模B“拍照賺錢”的任務(wù)定價模型_第2頁
2017數(shù)學(xué)建模B“拍照賺錢”的任務(wù)定價模型_第3頁
2017數(shù)學(xué)建模B“拍照賺錢”的任務(wù)定價模型_第4頁
2017數(shù)學(xué)建模B“拍照賺錢”的任務(wù)定價模型_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、精選優(yōu)質(zhì)文檔-傾情為你奉上 “拍照賺錢”的任務(wù)定價模型摘要本題要求分析“拍照賺錢”任務(wù)的服務(wù)模式,研究其定價規(guī)律,并設(shè)計新的任務(wù)定價方案,結(jié)合實際情況,修改定價模型,最終對新項目設(shè)計任務(wù)定價方案,并評價方案的實施效果。求解的具體流程如下:針對問題一:為了研究項目的定價規(guī)律,分析任務(wù)未完成的原因,利用附件一的信息,在地圖上定位所有坐標(biāo)的位置,發(fā)現(xiàn)任務(wù)集中在廣東、東莞、佛山、深圳四市,分別標(biāo)明每個城市的成功任務(wù)和失敗任務(wù)。以深圳為例,對深圳市任務(wù)進(jìn)行聚類分析,結(jié)果分成5類,由相應(yīng)任務(wù)的定價可以得出,人口密集處定價較低,人口稀少處定價較高的定價規(guī)律。將附件二的位置信息同理在地圖上定位,分別計算任務(wù)周

2、圍的會員數(shù),分析其與定價的聯(lián)系。針對問題二:由問題一結(jié)果可知,任務(wù)定價與任務(wù)周圍人數(shù)和任務(wù)周圍人口密度等因素有關(guān)。利用網(wǎng)絡(luò)爬蟲爬取廣州、東莞、佛山、深圳四市醫(yī)院,學(xué)校,小區(qū),超市四種人口密度較大場所的經(jīng)緯度,統(tǒng)計成功任務(wù)周圍十公里人口密集場所。用RBF神經(jīng)網(wǎng)絡(luò)模型,從而確定新的定價方案。將此方案與原方案進(jìn)行比較,得出兩種定價方案的差異。針對問題三:為了解決用戶爭相選擇位置集中任務(wù)等問題,可將多個任務(wù)聯(lián)合打包,以便用戶更好得執(zhí)行任務(wù)。利用問題二中RBF神經(jīng)網(wǎng)絡(luò)模型求出新的定價方案下的任務(wù)定價;同問題一,求任意兩個任務(wù)之間的距離。當(dāng)兩個任務(wù)之間的距離小于一定值時,便可將這兩個任務(wù)種做打包處理。對于

3、打包的任務(wù),可將每個任務(wù)的定價結(jié)合附近會員的信息求出最終定價;對于未打包的任務(wù),任務(wù)定價不變。 針對問題四:為了對新項目設(shè)計定價方案,并評價方案的實施效果,將新項目中任務(wù)的位置定位于地圖上,可以發(fā)現(xiàn)任務(wù)集中分布于兩個區(qū)域,且兩個區(qū)域距離較遠(yuǎn),可認(rèn)為互不影響。結(jié)合前面問題的分析,可知任務(wù)定價與區(qū)域的經(jīng)濟發(fā)展情況和用戶到任務(wù)的距離有關(guān)。對用戶而言,用戶將優(yōu)先選擇距離較近且定價較高的任務(wù),因此,可以使用灰度關(guān)聯(lián)分析的方法,建立不同任務(wù)對會員的吸引力,從而對定價方案做出評價。關(guān)鍵詞:聚類分析、RBF神經(jīng)、灰色關(guān)聯(lián)分析法、網(wǎng)絡(luò)爬蟲一、問題重述“拍照賺錢”是移動互聯(lián)網(wǎng)下的一種自助式服務(wù)模式。用戶下載APP

4、,注冊成為APP的會員,然后從APP上領(lǐng)取需要拍照的任務(wù)(比如上超市去檢查某種商品的上架情況),賺取APP對任務(wù)所標(biāo)定的酬金。APP是該平臺運行的核心,而APP中的任務(wù)定價又是其核心要素。如果定價不合理,有的任務(wù)就會無人問津,而導(dǎo)致商品檢查的失敗。1.研究附件一中項目的任務(wù)定價規(guī)律,分析任務(wù)未完成的原因。2.為附件一中的項目設(shè)計新的任務(wù)定價方案,并和原方案進(jìn)行比較。3.實際情況下,多個任務(wù)可能因為位置比較集中,導(dǎo)致用戶會爭相選擇,一種考慮是將這些任務(wù)聯(lián)合在一起打包發(fā)布。在這種考慮下,如何修改前面的定價模型,對最終的任務(wù)完成情況又有什么影響?4.對附件三中的新項目給出你的任務(wù)定價方案,并評價該方

5、案的實施效果。二、模型假設(shè)1.會員對任務(wù)沒有主觀偏好,不會因為自身原因不完成任務(wù);2.各個任務(wù)難度相等,不影響會員的選擇;3.假設(shè)會員與任務(wù)間的距離都是直線距離,不受道路、河流等的影響;4.問題中所有數(shù)據(jù)都真實有效。三、符號說明符號含義r地球半徑l兩地之間的球面距離,兩地的緯度兩地的經(jīng)度差P打包后總價四、問題分析4.1 問題一分析問題一要求研究附件一中項目的定價規(guī)律,并分析任務(wù)未完成的原因。首先應(yīng)在地圖中找出附件一中所有任務(wù)的位置,確定任務(wù)的分布規(guī)律,同時將附件二中會員的位置定位于地圖。觀察出這些數(shù)據(jù)集中分布在廣東、東莞、佛山、深圳四個城市。以深圳市為例,對深圳的任務(wù)進(jìn)行聚類分析,分析聚類結(jié)果

6、,從而得出項目的定價規(guī)律。分別計算每個任務(wù)與所有會員之間的距離,結(jié)合每個任務(wù)周圍十公里的會員數(shù)與任務(wù)的定價,確定任務(wù)未完成的原因。4.2 問題二分析問題一可明顯看出任務(wù)價格與任務(wù)周圍人數(shù)和任務(wù)所在地區(qū)人口密度等有關(guān)。利用網(wǎng)絡(luò)爬蟲爬取廣州等四市醫(yī)院、學(xué)校、小區(qū)、超市等人口密度大的場所,統(tǒng)計成功任務(wù)方圓十公里內(nèi)的人口密度大的場所個數(shù)。使用RBF神經(jīng)網(wǎng)絡(luò)分析,用所獲得的數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),從而確定新的任務(wù)定價方案。將新的任務(wù)定價方案與附件一中的任務(wù)定價做出比較,說明兩種定價方案的不同情況。4.3 問題三分析問題三要求將任務(wù)打包發(fā)布并設(shè)計新的定價方案,以解決用戶爭相選擇等問題。利用問題二中RBF神經(jīng)網(wǎng)絡(luò)

7、模型求出新的定價方案下的任務(wù)的定價;利用問題一中兩點經(jīng)緯度坐標(biāo)求出兩點距離的計算方法求出每個任務(wù)與其他任務(wù)之間的距離,當(dāng)兩個任務(wù)之間的距離小于一定值時,便可將這兩個任務(wù)種做打包處理。對于打包的任務(wù),可將每個任務(wù)的定價結(jié)合附近會員的信息求出最終定價;對于未打包的任務(wù),任務(wù)定價不變。 4.4 問題四分析問題四要求對一個新項目設(shè)計定價方案,并評價該方案的實施效果,將附件三中的任務(wù)的地理位置定位于地圖上,可以發(fā)現(xiàn)任務(wù)集中分布于兩個區(qū)域。通過前面的問題分析可知,任務(wù)定價與地區(qū)經(jīng)濟發(fā)展水平和會員距離有關(guān)。對會員而言,可以從任務(wù)的難易程度和會員到任務(wù)的距離兩個方面判斷會員對任務(wù)的偏好,從而使用灰度關(guān)聯(lián)分析對

8、的方法,建立不同任務(wù)對會員吸引力的模型,便可以對這種方案的實施效果做出分析。五、模型建立與求解5.1 問題一模型利用地圖定位將附件一中經(jīng)度緯度定位到地圖中,發(fā)現(xiàn)這些數(shù)據(jù)集中分布在廣東,東莞,佛山和深圳四個城市中。分別分析四個城市的價格規(guī)律,以深圳市為例。考慮到城市內(nèi)部存在區(qū)的劃分,因此對數(shù)據(jù)進(jìn)行聚類分析,猜測聚類結(jié)果呈區(qū)域塊狀分布,結(jié)果同樣驗證猜測。這是價格的分布規(guī)律,其內(nèi)部原因是受每個任務(wù)周圍會員數(shù)量的影響。分別求出任務(wù)方圓每十公里會員人數(shù),分析任務(wù)周圍的會員數(shù)與任務(wù)定價的關(guān)系,從而確定任務(wù)未完成的原因。5.1.1模型建立此題采用Q型聚類法建立模型并求解。Step1. 距離表5.1.1 數(shù)據(jù)

9、觀測值樣本變量x1x2xp1x11x12x1p2x21x22x2p nxn1xn2xnp設(shè) xik 為第i個樣本的第k個指標(biāo),數(shù)據(jù)觀測值如上表所示。在表中,每個樣本有p個變量,故每個樣本可以看作 Rp 中的一個點,n個樣本就是 Rp 中的n個點。在 Rp 中需要定義某種距離,第i個樣本與第j個樣本之間的距離記為 dij ,在聚類過程中距離較近的點傾向于歸為一類,距離較遠(yuǎn)的點應(yīng)屬于不同類。所定義的距離滿足如下4個條件:(1) dij0 ,對一切i,j;(2) dij=0 ,當(dāng)且僅當(dāng)?shù)趇個樣本與第j個樣本的各個變量值相等;(3) dij=dji ,對一切i,j;(4) dijdik+dkj ,對一

10、切的i,j,k。最常用的幾種距離:(1) Minkowski(閔可夫斯基)距離dijq=k=1pxik-xjkq1q , q>0 對于q=1時,對應(yīng)的是絕對值距離(2) 絕對值距離dij1=k=1pxik-xjk 對于q=2時,對應(yīng)的是Euclid距離(3) Euclid(歐幾里得)距離dij2=k=1pxik-xjk2 Step2. 數(shù)據(jù)標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化變換:xij*=xij-xjsj,i=1,2,n;j=1,2,p 其中,均值:xj=1nk=1nxkj方差:sj=1n-1k=1nxkj-xj2變換后的數(shù)據(jù)均值為0,標(biāo)準(zhǔn)差為1,而且標(biāo)準(zhǔn)化后的數(shù)據(jù)與變量的量綱無關(guān)。Step3. 系統(tǒng)聚類系統(tǒng)

11、聚類法(hierarchical clustering method)是聚類分析諸多方法中用的最多的一種,其基本思想是:開始將n個樣本各自為一類,并規(guī)定樣本之間的距離和類與類之間的距離,然后將距離最近的兩類合并成一個新類,計算新類與其它類的距離;重復(fù)進(jìn)行兩個最近類的合并,每次減少一類,直到所有樣本合并為一類。以下用 dij 表示第i個樣本與第j個樣本的距離,G1 , G2 ,表示類,DKL 表示GK 與 GL 的距離。下面所介紹的系統(tǒng)聚類法中,所有的方法開始時每個樣本自成一類,類與類之間的距離與樣本之間的距離相同,即 DKL=dKL ,所以最初的距離矩陣全部相同,記為 D0=dij 。常用的系

12、統(tǒng)聚類法:(1)重心法類與類之間的距離定義為它們重心(均值)之間的Euclid距離。設(shè) GK 與 GL 的重心分別為xK 和 xL ,則 GK 和 GL 之間的平方距離為:DKL2=dxKxL2=xK-xLTxK-xL這種系統(tǒng)聚類方法稱為重心法(centroid hierarchical method)。它的遞推公式為:DMJ2=nKnMDKJ2+nLnMDLJ2-nKnLnM2DKL2 重心法在處理異常值方面比其它系統(tǒng)聚類法更穩(wěn)健,但是其他方面卻不如離差平方和法的效果好。(2)離差平方和法(Ward方法)離差平方和法基于方差分析的思想,如果分類分得正確,則同類樣本之間的離差平方和應(yīng)當(dāng)較小,不

13、同類樣本之間的離差平方和應(yīng)當(dāng)較大。設(shè)類GK與GL 合并成新的類GM,則GK,GL,GM 的離差平方和分別為:WK=iGKxi-xKTxi-xKWL=iGLxi-xLTxi-xLWM=iGMxi-xMTxi-xM其中xK,xL和xM分別是GK,GL和GM的重心。所以WK,WL和WM反應(yīng)各自類內(nèi)樣本的分散程度。如果GK和GL這兩類相距較近,則合并后所增加的離差平方和WM-WK-WL應(yīng)較?。环駝t,應(yīng)較大。于是定義GK和GL之間的平方距離為:DKL2=WM-WK-WL這種系統(tǒng)聚類法稱為離差平方和法或Ward方法(Wards minimum variance method)。它的遞推公式為:DMJ2=n

14、J+nKnJ+nMDKJ2+nJ+nLnJ+nMDLJ2-nJnJ+nMDKL2GK和GL之間的平方距離也可以寫成DKL2=nKnLnMxK-xLTxK-xL由上述分析可見,這個距離與重心法給出的距離只差一個常數(shù)倍。重心法的類間距與兩樣本的樣本數(shù)無關(guān),而離差平方和法的類間距與兩類的樣本數(shù)有關(guān)。兩個大類傾向于有較大的距離,因而不易合并,這更符合對聚類的實際要求。離差平方和法在很多場合下優(yōu)于重心法,是一種較好的系統(tǒng)聚類法,但它對異常值很敏感。Step4. 已知兩地經(jīng)緯度求兩地距離 和分別是兩地的緯度,北緯記為正;是兩地的經(jīng)度差,r是地球半徑。忽略各地海拔高度差異,認(rèn)為地球是理想的球面。設(shè)L是兩地的

15、距離(地球的一條弦長),l是兩地的球面距離(沿地球表面的弧長)。則:k=sin-sin2+cos-coscos2+cossin2L=rk可求得:l=2rsin-1k2分別計算出以每個任務(wù)位置為中心,半徑為十公里的區(qū)域(即為方圓每十公里)內(nèi)會員的人數(shù)與相應(yīng)的任務(wù)定價,通過成功任務(wù)和失敗任務(wù)每十公里內(nèi)的會員人數(shù)比較即可得出任務(wù)失敗的原因。5.1.2模型求解Step1. 基本數(shù)據(jù)處理清洗數(shù)據(jù),對于有明顯錯誤的數(shù)據(jù)給予改正,例如將附件二中的“113.13148 23.”改為“23. 113.13148”。對于附件一和附件二中的任務(wù)與會員坐標(biāo),使用XGeocoding解析出每個坐標(biāo)所對應(yīng)的地理位置,得出

16、任務(wù)與會員集中分布于廣東,東莞,佛山和深圳,則可刪除極少的處于其他市的任務(wù)與會員,得到模型中使用的有效數(shù)據(jù)。表5.1.2 城市中的任務(wù)數(shù)與會員數(shù)城市任務(wù)數(shù)量會員數(shù)廣州市322665深圳市161629佛山市173216東莞市179351Step2. 確定定價規(guī)律(以深圳市為例)利用BDP在線數(shù)據(jù)分析軟件將任務(wù)信息在地圖上標(biāo)出,將深圳市中的任務(wù)聚類分析,聚類后分成了五類1,2,3,4和5。其中每一類任務(wù)在地圖上的分布如下圖:圖5.1.1 深圳市任務(wù)分類圖表5.1.3 每一類中個數(shù)和定價的均值聚類的類別個數(shù)定價均值13567.6857124566.4777831268.546266.08871577

17、6.85714顯然,這很符合實際,人口密集區(qū)任務(wù)定價偏低,如類別4所在區(qū)域為人口密集區(qū),人口密度較小,相應(yīng)任務(wù)定價較低;偏遠(yuǎn)地區(qū)定價高,而且明顯高過其他類別,如類別5所在區(qū)域,任務(wù)分布很廣,但任務(wù)定價為所有類別中最高。同理可得出東莞,佛山,深圳三市的任務(wù)與價格分布。這就是項目的任務(wù)定價規(guī)律。Step3. 分析任務(wù)未完成原因通過Matlab編寫程序分別求出每個任務(wù)方圓十公里內(nèi)的會員人數(shù),分析方圓十公里內(nèi)的會員人數(shù)與任務(wù)是否完成的關(guān)系。從附件一中統(tǒng)計可得,共有522個成功任務(wù),313個失敗的任務(wù)。首先求出每個成功任務(wù)與每個會員的距離,然后篩選出任務(wù)方圓十公里內(nèi)的會員人數(shù)。同理可以求得失敗任務(wù)方圓十

18、公里內(nèi)的會員人數(shù)。畫出其統(tǒng)計直方圖,如下圖所示:圖5.1.2 成功任務(wù)頻數(shù)分布直方圖圖5.1.3 失敗任務(wù)頻數(shù)分布直方圖從圖中可以看出,大部分成功任務(wù)方圓十公里內(nèi)的會員人數(shù)在150人以下,在方圓每十公里少于100人之前,隨著方圓十公里內(nèi)人數(shù)的增加,成功任務(wù)總數(shù)增加;在方圓每十公里大于100人之后,隨著方圓十公里內(nèi)人數(shù)的增加,成功任務(wù)總數(shù)減少。失敗任務(wù)方圓十公里內(nèi)人數(shù)分布比較均勻,但總體也呈先增加后遞減的規(guī)律。失敗任務(wù)頻數(shù)分布直方圖顯示雖然有一部分任務(wù)方圓每十公里會員很多,但任務(wù)仍然失敗。這可能和會員的活躍度有關(guān),導(dǎo)致會員總數(shù)雖多,但活躍會員很少。實際情況中,如果有任務(wù)未完成,可分為有人執(zhí)行任務(wù)

19、但失敗,無人執(zhí)行任務(wù)兩種情況。在第一種情況下,即有人執(zhí)行任務(wù)但執(zhí)行失敗時,可能的原因有,任務(wù)本身過于困難,超出會員的能力,或任務(wù)時間過短,在規(guī)定時間內(nèi)無法完成;第二種情況時,任務(wù)已在軟件發(fā)布,但無人愿意執(zhí)行該任務(wù),可能的原因有任務(wù)地點與會員所在地距離過遠(yuǎn),會員不愿意花費過多的時間;任務(wù)定價過低或過于困難,會員認(rèn)為本身的勞動價值高于任務(wù)價值;任務(wù)發(fā)布的時間過短,導(dǎo)致無人可執(zhí)行。附件二中給出了會員的信譽度,信譽度較高的會員越優(yōu)先開始挑選任務(wù),配額也就越大。由失敗任務(wù)的直方圖可以得到,任務(wù)方圓十公里的會員數(shù)很多,任務(wù)失敗仍有一定的比例,推測可得,會員信譽度與任務(wù)完成情況有關(guān),會員信譽度越高,任務(wù)完成

20、的概率越大;反之,會員的信譽度越低,接收任務(wù)后無法完成的可能性越大。5.2 問題二模型從問題一中發(fā)現(xiàn),任務(wù)價格除了與任務(wù)周圍的會員人數(shù)有關(guān),也與其所在地區(qū)的人口密度和地理位置等有關(guān)。運用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練學(xué)習(xí)確定新的任務(wù)定價方案。將設(shè)計出的定價方案與附件一中的定價方案進(jìn)行比較,即可得到雙方各自的優(yōu)缺點。5.2.1模型建立Step1. RBF神經(jīng)網(wǎng)絡(luò)(徑向基神經(jīng)網(wǎng)絡(luò))(1)網(wǎng)絡(luò)參數(shù)確定RBF神經(jīng)網(wǎng)絡(luò)由輸入層,隱含層和輸出層組成,其隱含層基函數(shù)常為高斯函數(shù)。最常用的函數(shù)為:RiX=exp-X-Ci22i2,i=1,10其中,i為徑向基函數(shù)的擴展常數(shù),反應(yīng)函數(shù)圖像的寬度。X為輸入向量,Ci為基函

21、數(shù)的中心向量,與X有相同維數(shù)的向量;X-Ci為向量X-Ci的范式,通常表示X與Ci之間的距離;RiX在Ci處有唯一的最大值,隨著X-Ci的增大,RiX迅速衰減到0。在本題中,任務(wù)的輸入樣本共有10個,即輸入層的輸入為X=x1,x2,x10;輸出為任務(wù)定價,即實際輸出為Y=y,建立多輸入、單輸出的三層網(wǎng)絡(luò)結(jié)構(gòu)。RBF網(wǎng)絡(luò)輸入層與隱含層直接連接,相當(dāng)于直接將輸入變量輸入到隱含層。對于給定的輸入,只有小部分靠近X的中心被激活。當(dāng)確定了RBF網(wǎng)絡(luò)的聚類中心Ci、擴展常數(shù)i與隱含層到輸出層的權(quán)值以后,就可求出給定某一輸入時,網(wǎng)絡(luò)對應(yīng)的輸出值。 圖5.2.1 RBF神經(jīng)網(wǎng)絡(luò)建模結(jié)構(gòu)(2)樣本數(shù)據(jù)訓(xùn)練學(xué)習(xí)在

22、RBF神經(jīng)網(wǎng)絡(luò)中,需要通過學(xué)習(xí)和訓(xùn)練確定基函數(shù)的擴展常數(shù),基函數(shù)中心向量與隱含層到輸出層的權(quán)值。一般分為步進(jìn)行:確定基函數(shù)的中心向量通過“K均值聚類法”在訓(xùn)練樣本集中隨機選擇樣本作為徑向基函數(shù)的中心,將這個聚類中心作為基函數(shù)的中心向量。確定基函數(shù)的擴展常數(shù)確定基函數(shù)中心向量后,可求得歸一化參數(shù),令其等于基函數(shù)中心與子樣本集中樣本模式之間的平均距離,求得基函數(shù)擴展常量。確定隱含層到輸出層的權(quán)值RBF連接權(quán)值的確定可以采用最小的均方差誤差得到。Step2. 原始數(shù)據(jù)處理采用公式對樣本的輸入、輸出數(shù)據(jù)進(jìn)行規(guī)格化處理:t=2(t-tmin)tmax-tmin-1其中,t為規(guī)格化前的變量,tmax和tm

23、in分別為t的最大值和最小值;t為規(guī)格化后的變量。利用Matlab的歸一化處理函數(shù)對數(shù)據(jù)進(jìn)行歸一化處理,將具有不同尺度屬于不同區(qū)間的樣本的分量轉(zhuǎn)換到相同區(qū)間,從而使樣本的各個分量具有相同的尺度。便于RBF網(wǎng)絡(luò)的訓(xùn)練。Step3. 網(wǎng)絡(luò)訓(xùn)練 利用Matlab提供的神經(jīng)網(wǎng)絡(luò)工具箱可實現(xiàn)神經(jīng)網(wǎng)絡(luò)功能,主要使用RBF網(wǎng)絡(luò)設(shè)計函數(shù)newrbe和newrb設(shè)計神經(jīng)網(wǎng)絡(luò)。可用的樣本的個數(shù)為522,輸入變量的個數(shù)為512,作為訓(xùn)練集;將10組樣本作為檢驗集,輸出變量的個數(shù)為1,中間隱含層神經(jīng)元的個數(shù),RBF網(wǎng)絡(luò)會在訓(xùn)練過程中自適應(yīng)地取定。編寫Matlab程序進(jìn)行訓(xùn)練,可得到各因素影響下對任務(wù)價格的預(yù)測結(jié)果。5

24、.2.2 模型求解Step1. 確定訓(xùn)練樣本通過對完成任務(wù)分布與任務(wù)位置可得出,任務(wù)價格與任務(wù)周圍的會員人數(shù)和任務(wù)所在地區(qū)的人口密度有關(guān)。搜索廣州市人口密集地區(qū)的具體場所,將其分類為醫(yī)院,學(xué)校,小區(qū),超市,爬取網(wǎng)頁中場所的具體經(jīng)緯度坐標(biāo)。設(shè)每個成功任務(wù)方圓十公里的醫(yī)院數(shù)量為x1,學(xué)校數(shù)量為x2,小區(qū)數(shù)量為x3,超市數(shù)量為x4,相應(yīng)區(qū)域內(nèi)的會員人數(shù)為x5。數(shù)據(jù)經(jīng)過處理可得到下表,詳細(xì)數(shù)據(jù)見支撐材料:表5.2.1 成功任務(wù)方圓十公里的人口密集場所數(shù)量序號x1x2x3x4x5y1000012265.52000011765.55110000738551201025885Step2. 神經(jīng)網(wǎng)絡(luò)訓(xùn)練使用M

25、atlab的神經(jīng)網(wǎng)絡(luò)工具箱進(jìn)行數(shù)據(jù)訓(xùn)練與檢驗。Matlab核心代碼如下: net1 = newrb(PN,TN) x = a(1:4,end);xn = mapminmax(apply,x,PS1); yn1 = sim(net1,xn);y1 = mapminmax(reverse,yn1,PS2); delta1 = abs(a(5,20)-y1)/a(5,20)其中,用于訓(xùn)練RBF網(wǎng)絡(luò),得到規(guī)律,以便后期預(yù)測結(jié)果;用于預(yù)測規(guī)格化的樣本自變量;用于求出預(yù)測值,并還原規(guī)格化的數(shù)據(jù);用于計算RBF網(wǎng)絡(luò)預(yù)測的相對誤差。將檢驗基中的數(shù)據(jù)代入程序中進(jìn)行檢驗,可以得出預(yù)測定價和相對誤差,如下表:表5.

26、2.2 RBF測試檢驗表測試組真實定價預(yù)測定價相對誤差17284.905.20%28072.0222.16%365.569.5206.17%46668.764.18%58067.837.74%68573.802.78%77269.892.93%88567.5513.09%965.566.160.02%108568.910.10%Step3. 與原方案比較結(jié)果 原方案中沒有考慮到學(xué)校,小區(qū)等密集地區(qū)對任務(wù)定價的影響,這和現(xiàn)實會產(chǎn)生很大的出入。本方案結(jié)合任務(wù)地點附近人口密集區(qū)對任務(wù)定價的影響。運用具有很強的逼近能力,分類能力和學(xué)習(xí)速度的RBF神經(jīng)網(wǎng)絡(luò)模型得到了一個任務(wù)定價方案,經(jīng)過檢驗,結(jié)果誤差完

27、全在可接受的范圍之內(nèi)。而且,此模型具有易用性,任意已知數(shù)據(jù)帶入RBF模型即可得到定價結(jié)果。5.3 問題三模型在實際問題中,任務(wù)位置可能比較接近,打包發(fā)布因為價格較高不僅有利于調(diào)動會員的積極性,還可以提高任務(wù)完成比率。首先,使用問題二的神經(jīng)網(wǎng)絡(luò)模型求出全部任務(wù)定價。然后確定打包條件,當(dāng)兩任務(wù)距離小于一定值時,將兩任務(wù)打包。對于打包的任務(wù),由上面求得的任務(wù)定價,再結(jié)合打包任務(wù)附近會員的個人信息給出最終定價。對于沒有打包的任務(wù),價格不變。5.3.1 模型建立Step1. 應(yīng)用問題二的神經(jīng)網(wǎng)絡(luò)模型求出所有任務(wù)的定價,稱為初始定價;Step2. 確定打包條件假設(shè)共有n個任務(wù),已知每個任務(wù)的經(jīng)緯度,可以求

28、出每兩個任務(wù)之間的距離,求解方式如問題一。由此可以得到一個n*n的矩陣:r11r12r1nr21r22r2nrn1rn2rnn其中rij表示第i個任務(wù)與第j個任務(wù)之間的距離,由此可知此矩陣是一個對稱矩陣。當(dāng)rij<2時,即兩任務(wù)距離小于2公里時,把第i個任務(wù)與第j個任務(wù)進(jìn)行打包處理。如果有rij,rik,ril<2,則把第i,j,k,l個任務(wù)進(jìn)行打包處理。由此可以完成所有的打包分類。Step3. 確定打包任務(wù)的定價表5.3.1 打包任務(wù)的相關(guān)信息任務(wù)ijk初始定價PiPjPk會員數(shù)/方圓十公里ninjnk信譽值總和RiRjRk假設(shè)將第i,j,k個任務(wù)進(jìn)行打包,其初始定價,方圓十公里

29、內(nèi)的會員數(shù),以及會員預(yù)訂任務(wù)限額總值,信譽值總和見上表。Pi,Pj,Pk分別為相應(yīng)任務(wù)的初始定價;ni,nj,nk分別為相應(yīng)任務(wù)方圓十公里內(nèi)的會員數(shù);Ri,Rj,Rk分別為相應(yīng)會員所對應(yīng)的信譽值總和。設(shè)打包后總價為P,則可求得最后打包總價為:P=iPi+jPj+kPk其中:i=Rj+RkRi+Rj+Rkj=Ri+RkRi+Rj+Rkk=Ri+RjRi+Rj+Rk5.3.2 模型求解Step1. 由問題二的神經(jīng)網(wǎng)絡(luò)模型可求出所有任務(wù)的初始定價,如下表:表5.3.2 所有任務(wù)的初始定價表任務(wù)號碼A001A002A0833A0834A0835初始定價70.8969.5580.8860.5483.25

30、Step2. 由附件一可知,任務(wù)共有835個,由此可以得到一個835*835的矩陣:013.98108.6013.98097.94108.6097.940根據(jù)每個任務(wù)對應(yīng)的經(jīng)緯度坐標(biāo)及兩坐標(biāo)之間的距離公式,分別求出每個任務(wù)與其他所有任務(wù)之間的距離,找出其中距離小于2公里的元素所對應(yīng)的任務(wù),列舉三例:1,29,362,11,12,16,17,22,23,356,7,13,19,29。 Step3. 選取一例進(jìn)行求解例如第1個任務(wù)與第29,362個任務(wù)打包在一起。分別求出每個任務(wù)和每一個會員之間的距離,選擇在任務(wù)方圓十公里內(nèi)的會員,確定每個會員的預(yù)訂任務(wù)限額及信譽值,求和可得預(yù)訂任務(wù)限額總值及信譽

31、值總和。表5.3.3 任務(wù)的初始定價及信譽值總和任務(wù)129362初始定價70.8965.5571.22信譽值總和123413221240根據(jù)模型可求得1=0.6733,29=0.6517,362=0.6733,則總價為P=2543。Step4. 對最終任務(wù)完成情況的影響修改后的模型可根據(jù)距離將多個任務(wù)同時發(fā)布給一個用戶,這種做法可以將少有用戶選擇的任務(wù)通過與另一個用戶愿意選擇的任務(wù)同時發(fā)布,促進(jìn)任務(wù)的完成;模型加入了會員自身情況的影響,打包的任務(wù)可以吸引更多的信譽度高的用戶執(zhí)行任務(wù),獲得更多的利益,因而可以促進(jìn)新用戶的注冊,使更多的人前去完成任務(wù),最終任務(wù)會完成得更多。5.4 問題四模型將用戶

32、位置數(shù)據(jù)導(dǎo)入地圖,可以發(fā)現(xiàn),新項目分布在兩個塊狀地區(qū),其中大部分分布在廣州市,少量分布在深圳市周圍。兩地相距大約130公里,因此,可以認(rèn)為兩地任務(wù)之間沒有影響,可以單獨分析。圖5.4.1 新項目用戶分布圖由前三問可知,任務(wù)定價水平與地區(qū)經(jīng)濟發(fā)展水平有很大關(guān)系,與會員距離任務(wù)點的遠(yuǎn)近也有很大關(guān)系。對于會員而言,會員的優(yōu)先選擇是選擇距離較小,定價較高,難度較小的任務(wù),不同會員對每個任務(wù)的距離,難易判別并不相同,我們選擇用灰度關(guān)聯(lián)分析的方法,建立不同任務(wù)對會員吸引力的模型。實現(xiàn)任務(wù)隊會員的實時更新。5.4.2 模型建立本文中灰度關(guān)聯(lián)分析具體步驟為:(1)確定評價對象和評價標(biāo)準(zhǔn)。本題中的評價對象是m個

33、任務(wù),評價指標(biāo)有用戶與任務(wù)的距離,任務(wù)附近的交通狀況,任務(wù)本身的難易程度。參考數(shù)列為x0=x0k|k=1,2,3,比較數(shù)列為xi=xik|k=1,2,3,i=1,2,3.(2)確定各指標(biāo)值對應(yīng)的權(quán)重。權(quán)重w=w1,w2,w3,其中wi表示第i個指標(biāo)對應(yīng)的權(quán)重。(3)計算灰度聯(lián)系關(guān)系:ik=minsmint|x0t-xst|+maxsmaxt|x0t-xst|x0k-xik|+maxsmaxt|x0t-xst|為比較數(shù)列xi對參考數(shù)列x0在第k個指標(biāo)上的關(guān)聯(lián)系數(shù),其中0,1為分辨系數(shù)。其中,minsmint|x0t-xst|、maxsmaxt|x0t-xst|分別為兩級最小差及兩級最大差。一般來

34、講,分辨系數(shù)越大,分辨率越大;越小,分辨率越小。(4)計算灰色加權(quán)關(guān)聯(lián)度。灰色加權(quán)關(guān)聯(lián)度的計算公式為ri=k=1nii(k)其中,ri為第i個評價對象對理想對象的灰色加權(quán)關(guān)聯(lián)度。(5)評價分析。根據(jù)灰色加權(quán)關(guān)聯(lián)度的大小,對各任務(wù)進(jìn)行排序,可建立任務(wù)的關(guān)聯(lián)序,關(guān)聯(lián)度越大,其對會員來說越有吸引力。5.4.3 實施效果 通過灰度關(guān)聯(lián)分析的方法,可以實現(xiàn)會員對任務(wù)的執(zhí)行意愿的排序。根據(jù)以往定價數(shù)據(jù),進(jìn)行精準(zhǔn)定價分析,每一個會員都可以得到一個任務(wù)價目表,促進(jìn)任務(wù)的能順利完成,極大提高了用戶體驗,使用戶與公司雙方都獲得收益。同時可以減少未完成任務(wù)的數(shù)量,使發(fā)布的任務(wù)更加可靠的完成。六、模型優(yōu)點與缺點優(yōu)點1

35、. 模型易懂,實際應(yīng)用價值高;2. 問題二中考慮因素較多,使結(jié)論更為準(zhǔn)確;3. 運用網(wǎng)絡(luò)爬蟲,結(jié)合實際情況,從多種角度進(jìn)行分析。缺點1.問題一研究定價規(guī)律和分析任務(wù)未完成原因時考慮因素不全面,沒有把會員的因素考慮到模型中;2.問題四模型沒有數(shù)據(jù)進(jìn)行驗證。七、參考文獻(xiàn)1 司守奎 孫璽菁,數(shù)學(xué)建模算法與應(yīng)用,北京,國防工業(yè)出版社,20152 劉載文,水環(huán)境系統(tǒng)智能化軟測量與控制方法,北京,中國輕工業(yè)出版社,20133 姜啟源 謝金星 葉俊,數(shù)學(xué)模型,北京,高等教育出版社, 20034 Robert I.Kabacoff 著,王小寧劉擷芯黃俊文等譯,R語言實戰(zhàn)(第2版),北京,人民郵電出版社,201

36、6年5劉曉鋼,眾包中任務(wù)發(fā)布者出價行為的影響因素研究,重慶大學(xué),2012附錄1.成功任務(wù)與會員之間的距離和成功任務(wù)方圓十里內(nèi)的會員數(shù)for j=1:522 for i=1:1878 D=distance(huiyuan(i,1),huiyuan(i,2),succase(j,1),succase(j,2); dx=D*6371*2*pi/360; dis1(j,i)=dx; endendx1=dis1<10;x1=sum(x1');2.成功任務(wù)與學(xué)校之間的距離和成功任務(wù)方圓十里內(nèi)的學(xué)校數(shù)for j=1:522 for i=1:395 D=distance(school(i,1),school(i,2),succase(j,1),succase(j,2); dx=D*6371*2*pi/360; dis2(j,i)=dx; endendx2=dis2<10;x2=sum(x2');3.成功任務(wù)與小區(qū)之間的距離和成功任務(wù)方圓十里內(nèi)的小區(qū)數(shù)for j=1:522 for i=1:400 D=distance(community(i,1),community(i,2),succase(j,1),succase(j,2); dx=D*6371*2*pi/360; dis3(j,i)=dx; endendx3=dis

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論