《社會(huì)科學(xué)中的計(jì)算思維方法》《網(wǎng)絡(luò)、群體與市場(chǎng)》教學(xué)課件-010(從眾與流行)_第1頁(yè)
《社會(huì)科學(xué)中的計(jì)算思維方法》《網(wǎng)絡(luò)、群體與市場(chǎng)》教學(xué)課件-010(從眾與流行)_第2頁(yè)
《社會(huì)科學(xué)中的計(jì)算思維方法》《網(wǎng)絡(luò)、群體與市場(chǎng)》教學(xué)課件-010(從眾與流行)_第3頁(yè)
《社會(huì)科學(xué)中的計(jì)算思維方法》《網(wǎng)絡(luò)、群體與市場(chǎng)》教學(xué)課件-010(從眾與流行)_第4頁(yè)
《社會(huì)科學(xué)中的計(jì)算思維方法》《網(wǎng)絡(luò)、群體與市場(chǎng)》教學(xué)課件-010(從眾與流行)_第5頁(yè)
已閱讀5頁(yè),還剩83頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

資料來(lái)源:/watch?v=P0e6zG8IbE8StanleyMilgram的另一個(gè)著名實(shí)驗(yàn)資料來(lái)源:/watch?v=P信息級(jí)聯(lián)實(shí)驗(yàn)?zāi)P团c分析隨機(jī)取一個(gè)壇子依次,人們隨機(jī)從中摸出一個(gè)球

自己看宣布判斷“藍(lán)多”或“紅多”

大家聽(tīng)信號(hào):b,b,r,b,r,r,b,r宣布:?,?,?,?,?,?,?,?信息級(jí)聯(lián)實(shí)驗(yàn)?zāi)P团c分析隨機(jī)取一個(gè)壇子信號(hào):b,b,r,b,r每個(gè)人,依次已知信息:

自己抓到的球的顏色(私有信號(hào))前面的人宣布的判斷結(jié)果(公共知識(shí))基于已知信息,壇子是“藍(lán)多”的概率?第一個(gè)人

假設(shè)他抓到的是藍(lán)(b)球,正確的判斷應(yīng)該是“藍(lán)多”還是“紅多”?每個(gè)人,依次已知信息:基于已知信息,壇子是“藍(lán)多”的概率?信息級(jí)聯(lián)實(shí)驗(yàn)與分析實(shí)驗(yàn)結(jié)果如何?假設(shè)每個(gè)參與實(shí)驗(yàn)的人都足夠會(huì)計(jì)算概率之類(lèi),結(jié)果會(huì)如何?(即,理論結(jié)果)信號(hào):b,b,r,b,r,r,b,r宣布:B,?,?,?,?,?,?,?信息級(jí)聯(lián)實(shí)驗(yàn)與分析實(shí)驗(yàn)結(jié)果如何?信號(hào):b,b,r,b,r,r第一個(gè)人按他抓到的球的顏色宣布第二個(gè)人,聽(tīng)到了第一個(gè)人的判斷(從而能推理出了他看到的顏色),將按照自己抓的球的顏色宣布(假設(shè)在概率相等的情形,采取傾向自己信號(hào)的顏色)第三個(gè)人,聽(tīng)到了第一和第二個(gè)人的判斷(從而能推理他們抓到球的顏色)如果他們不一致,將按照自己抓球的顏色宣布如果他們一致,則將忽略自己的私有信號(hào),跟著他們同樣宣布Informationcascading信息級(jí)聯(lián)第一個(gè)人按他抓到的球的顏色宣布Informationcas結(jié)果會(huì)如何?第4個(gè)人也知道第1和第2個(gè)人看到的球顏色(設(shè)相同),但不知道第3個(gè)人的,因此他也只能放棄自己的信號(hào)(可能是紅球)…信號(hào):b,b,r,b,r,r,b,r宣布:B,B,B,B,B,B,B,B結(jié)果會(huì)如何?第4個(gè)人也知道第1和第2個(gè)人看到的球顏色(設(shè)相同如果是這樣一個(gè)實(shí)驗(yàn)情況呢?信號(hào):b,r,b,r,r,r,b,r宣布:????????

信號(hào):b,r,b,r,r,r,b,r宣布:B,R,B,R,R,R,R,R

結(jié)論:信息級(jí)聯(lián)發(fā)生在兩種顏色小球之差為2的時(shí)候,一旦發(fā)生,就“一邊倒”。如果是這樣一個(gè)實(shí)驗(yàn)情況呢?信號(hào):b,r,b,r,r,r,b,信息級(jí)聯(lián)的特點(diǎn)聽(tīng)起來(lái)“表態(tài)一致”,但實(shí)際上可能都是錯(cuò)的!(例如的確是“紅多”壇子,但前面兩個(gè)人碰巧摸到了藍(lán)色球)信息級(jí)聯(lián)是脆弱的,有一點(diǎn)“擾動(dòng)”就可能終止,甚至改變但這錯(cuò)是理性的錯(cuò),而不是盲目的錯(cuò)信息級(jí)聯(lián)的特點(diǎn)聽(tīng)起來(lái)“表態(tài)一致”,但實(shí)際上可能都是錯(cuò)的!(例“信息擾動(dòng)”的影響參與者123456789101112信號(hào)bbrrbrrbrrbr判斷假設(shè)第9個(gè)人悄悄告訴了第10個(gè)人他看到的球的顏色。第10個(gè)人應(yīng)該宣布什么?第11和12個(gè)人看到第9告訴第10其私有信號(hào),但不知道告訴的到底是什么。他倆應(yīng)該給出什么判斷?BBBBBBBBBRBR“信息擾動(dòng)”的影響參與者123456789101112信號(hào)b對(duì)信息級(jí)聯(lián)認(rèn)識(shí)的一個(gè)應(yīng)用假設(shè)你是老板,要做一個(gè)比較復(fù)雜的二選一(A,B)的決定,讓一個(gè)助手找一些專(zhuān)家征求意見(jiàn)你聽(tīng)說(shuō)助手是把專(zhuān)家們找來(lái)開(kāi)會(huì),會(huì)上請(qǐng)他們一一表達(dá)支持哪一個(gè)選項(xiàng)的意見(jiàn)后來(lái),你助手來(lái)匯報(bào)說(shuō)多數(shù)贊成選項(xiàng)A,你對(duì)選擇A是否有信心?如果他說(shuō)是絕大多數(shù),你的信心會(huì)增加嗎?對(duì)信息級(jí)聯(lián)認(rèn)識(shí)的一個(gè)應(yīng)用假設(shè)你是老板,要做一個(gè)比較復(fù)雜的二選防止錯(cuò)誤的

信息級(jí)聯(lián)防止有人利用信息級(jí)聯(lián)達(dá)到個(gè)人不正當(dāng)目的防止錯(cuò)誤的

信息級(jí)聯(lián)防止有人利用信息級(jí)聯(lián)達(dá)到個(gè)人不正當(dāng)目的《社會(huì)科學(xué)中的計(jì)算思維方法》《網(wǎng)絡(luò)、群體與市場(chǎng)》教學(xué)課件-010(從眾與流行)(第18章)Popularity,PowerLaw,ScaleFree,Richgetsricher

LongTail,Zipf’sLaw,2/8Law流行性冪律齊普夫定律“長(zhǎng)尾”富者愈富2/8律無(wú)標(biāo)度(第18章)Popularity,PowerLaw,S132017年8月人們關(guān)心的事物34個(gè)人提供信息共304詞語(yǔ)涉及153不同詞語(yǔ)詞頻的平均數(shù)=1.98詞頻的中位數(shù)=12017年8月人們關(guān)心的事物34個(gè)人提供信息2017年7月人們關(guān)心的事物

34個(gè)人提供信息共312詞語(yǔ)涉及162不同詞語(yǔ)詞頻的平均數(shù)=1.93詞頻的中位數(shù)=12017年7月人們關(guān)心的事物2017.8月事物流行性(詞頻)概率分布橫軸:詞頻=1,2,…,15該頻率下詞數(shù)縱軸:概率=——————不同詞的個(gè)數(shù)2017.8月事物流行性(詞頻)概率分布橫軸:詞頻=1,2,按流行度(詞頻)高低的排序橫軸:排位=1,2,…,153

縱軸:詞頻=15,0,0,12,…,8,7,7,7,6,…為什么兩個(gè)圖像都近似直線?按流行度(詞頻)高低的排序橫軸:為什么兩個(gè)圖像都近似直線?流行性(popularity)事物被人們關(guān)注、認(rèn)知、或偏愛(ài)的程度人(明星),書(shū)籍,歌曲,某一類(lèi)產(chǎn)品(例如軟飲料),某一類(lèi)服務(wù)(例如提供信息服務(wù)的網(wǎng)站),微博主,…研究:同一類(lèi)事物的不同實(shí)例被人們關(guān)注、認(rèn)知、或偏愛(ài)的程度的差別隨機(jī)性是否有什么規(guī)律?規(guī)律背后的機(jī)制?應(yīng)用?流行性(popularity)事物被人們關(guān)注、認(rèn)知、或偏愛(ài)的例如:設(shè)圖書(shū)城有14種書(shū):B1,B2,B3,…,B14,分別的銷(xiāo)售量如下表所示B1B2B3B4B5B6B7B8B9B10B11B12B13B1410020201002025150180252010020025502025501001501802004/143/142/141/14討論流行性的出發(fā)點(diǎn):數(shù)據(jù)與概率分布數(shù)據(jù)量越大越接近真實(shí)概率例如:設(shè)圖書(shū)城有14種書(shū):B1,B2,B3,…,B1一般地,以網(wǎng)頁(yè)入度為例給定一個(gè)國(guó)家(地區(qū))的網(wǎng)頁(yè)集合(S),發(fā)現(xiàn)其中一個(gè)網(wǎng)頁(yè)的入向鏈接數(shù)為k的概率f(k)是多少?n是網(wǎng)頁(yè)總數(shù)pi表示xi的入向鏈接數(shù)同類(lèi)事物的不同的數(shù)據(jù)集,是否有共性?不同類(lèi)事物的流行性分布是否有共性?一般地,以網(wǎng)頁(yè)入度為例給定一個(gè)國(guó)家(地區(qū))的網(wǎng)頁(yè)集合(S),數(shù)據(jù)實(shí)驗(yàn)表明,事物流行性概率分布大量各種不同類(lèi)型的數(shù)據(jù)集都顯現(xiàn)出這種性態(tài)因此,就說(shuō)這是反映流行性的一種規(guī)律,由于是冪函數(shù),俗稱(chēng)“冪律”c≥2流行度為k的概率數(shù)據(jù)實(shí)驗(yàn)表明,事物流行性概率分布大量各種不同類(lèi)型的數(shù)據(jù)集都顯北京大學(xué)課程的選課人數(shù)北京大學(xué)課程的選課人數(shù)冪律的習(xí)慣(圖形)表示log(f(k))是關(guān)于log(k)的線性函數(shù)以log(k)為橫軸,log(f(k))為縱軸的圖像是一條直線這等價(jià)于說(shuō)在雙對(duì)數(shù)坐標(biāo)(橫和縱)下,冪函數(shù)的圖像是一條直線冪律的習(xí)慣(圖形)表示log(f(k))是關(guān)于log(k因此,給定一組原始數(shù)據(jù)k:1,2,3,…f(k):…許多數(shù)據(jù)處理軟件都支持以對(duì)數(shù)坐標(biāo)作圖。因此,給定一組原始數(shù)據(jù)k:1,2,3,…許多數(shù)冪律的基本特性Scalefree(無(wú)標(biāo)度的,不受尺度影響的)Scalefree函數(shù)隱含著自相似(selfsimilarity)平均行為不反映典型行為“典型行為”-經(jīng)常遇到的;“平均行為”-總和/個(gè)數(shù)正態(tài)分布的“平均行為”反映“典型行為”典型看到“中等個(gè)子”,大個(gè)子很稀少冪律的基本特性Scalefree(無(wú)標(biāo)度的,不受尺度影響的ScaleFree=“無(wú)標(biāo)度”?一個(gè)事物從不同的尺度看,具有相同的形態(tài)F(ax),F(x)F(ax)=bF(x)冪函數(shù)就具有這種性質(zhì)!ScaleFree=“無(wú)標(biāo)度”?一個(gè)事物從不同的尺度看冪律的基本特性Scalefree(不受尺度影響的)Scalefree函數(shù)隱含著自相似(selfsimilarity)平均不反映典型“典型”-經(jīng)常遇到的;“平均”-總和/個(gè)數(shù)正態(tài)分布的“平均”反映“典型”典型看到“中等個(gè)子”,特別矮,特別高的都很稀少例如大家提供的關(guān)注信息,共304詞語(yǔ),153不同詞語(yǔ)詞頻的平均數(shù)=1.98詞頻的中位數(shù)=1冪律的基本特性Scalefree(不受尺度影響的)例如大家中國(guó)人均住房面積:符合冪律分布中國(guó)人均住房面積:符合冪律分布取值范圍

n=1,...,100

均值=4.65

意味著:看到比均值大的對(duì)象的可能性很高

具體算出來(lái),看到較大對(duì)象的概率約為0.2

最后這個(gè)計(jì)算表明看到比均值大一倍對(duì)象的概率約為0.1體會(huì)偏離“平均”的“非典型”也不罕見(jiàn)的算例取值范圍

n=1,...,100

均值=4.65

人們對(duì)事物的關(guān)注,或者說(shuō)事物的流行性(度)為什么呈冪律分布呢?類(lèi)似于“小世界”,人們希望找到這種相當(dāng)普遍的社會(huì)現(xiàn)象背后的機(jī)理(模型)人們對(duì)事物的關(guān)注,或者說(shuō)事物的流行性(度)為什么呈冪律分布呢冪律的成因(“富者更富”模型)網(wǎng)頁(yè)按照順序創(chuàng)建:1,2,3,…,j,…當(dāng)創(chuàng)建網(wǎng)頁(yè)j時(shí),以概率p或1-p選擇如下(a)或(b)執(zhí)行(a)以概率

p,均勻地、隨機(jī)地選擇一個(gè)早先創(chuàng)建的網(wǎng)頁(yè)

i,建立一個(gè)從

j到i的鏈接(b)以1-p的概率,以1-p的概率,按照與已有入度成比例的概率,選擇一個(gè)早先創(chuàng)建的網(wǎng)頁(yè)

i,建立一個(gè)從

j到

i

的鏈接。。。。。。。j此模型產(chǎn)生冪律ak-c,其中的指數(shù)c取決于概率p簡(jiǎn)而言之:如果人們都傾向于關(guān)注較多人關(guān)注的事物(即被他人影響),那么不同事物被關(guān)注度的分布就是冪律馬太效應(yīng)銀行貸款,更愿貸給錢(qián)多的,項(xiàng)目評(píng)審,已有項(xiàng)目多的更容易得到評(píng)優(yōu),人才帽子之類(lèi)問(wèn)題是,都知道這樣不一定對(duì),但人們依然傾向于如此。為什么呢??jī)缏傻某梢颍ā案徽吒弧蹦P停┚W(wǎng)頁(yè)按照順序創(chuàng)建:1,2,3,富者更富效應(yīng)的微觀不可預(yù)測(cè)性“富者更富”也具有級(jí)聯(lián)的意味,現(xiàn)實(shí)生活中有不少體現(xiàn)這種情形的現(xiàn)象最初階段充滿不確定性,“富”到一定程度后就開(kāi)始“起飛”與《哈利波特》同樣質(zhì)量的小說(shuō)在同一時(shí)期其實(shí)很多,但真正流行起來(lái)的很少同樣水平的歌星在同一時(shí)期其實(shí)很多,但真正出名的很少一類(lèi)事物流行史的細(xì)節(jié)不可能重演,但歷史的結(jié)果宏觀上總是如此(流行的分布)富者更富效應(yīng)的微觀不可預(yù)測(cè)性“富者更富”也具有級(jí)聯(lián)的意味,現(xiàn)歷史平行演化的一次模擬實(shí)驗(yàn)建一個(gè)音樂(lè)下載網(wǎng)站,向網(wǎng)民提供48首人們不太熟悉的歌曲的下載該網(wǎng)站也公布每首歌曲的“已下載次數(shù)”,后面上來(lái)的人能夠看到(從而就有一種促進(jìn)富者更富的功效)觀察一段時(shí)間后那些歌曲下載量的分布實(shí)驗(yàn)設(shè)計(jì)的妙處在:人們不知道他們被隨機(jī)分到8個(gè)類(lèi)似的網(wǎng)站之一(歌曲相同,初始狀態(tài)相同)!于是:研究人員看到了8段平行發(fā)展的歷史。歷史平行演化的一次模擬實(shí)驗(yàn)建一個(gè)音樂(lè)下載網(wǎng)站,向網(wǎng)民提供48“冪律”與“長(zhǎng)尾”的關(guān)系在討論同一類(lèi)產(chǎn)品(例如,書(shū)籍、唱片)的不同品種(書(shū))的銷(xiāo)量上,更多地用“長(zhǎng)尾”的概念如果一類(lèi)產(chǎn)品的不同品種的銷(xiāo)量(流行性)分布為冪律,則銷(xiāo)量至少為k的品種數(shù)也是冪律,但階次降1,從而曲線看起來(lái)“尾巴更長(zhǎng)”“冪律”與“長(zhǎng)尾”的關(guān)系在討論同一類(lèi)產(chǎn)品(例如,書(shū)籍、唱片)“長(zhǎng)尾”與“齊普夫定律”的關(guān)系齊普夫定律講的是,一類(lèi)事物(例如,詞匯)的不同品種(詞)的流行性(頻次)排行,從高到低,呈現(xiàn)為冪函數(shù)。這種“排行”函數(shù)相當(dāng)前述長(zhǎng)尾函數(shù)的反函數(shù)。“長(zhǎng)尾”與“齊普夫定律”的關(guān)系齊普夫定律講的是,一類(lèi)事物(例“齊普夫定律”與“2/8律”的關(guān)系“top20%”曲線下的面積約占整個(gè)面積的80%。銷(xiāo)量位次Zipf形式的表達(dá)20%“齊普夫定律”與“2/8律”的關(guān)系“top20%”曲線下的但是,當(dāng)固定一個(gè)數(shù)(而不是百分比),例如“top100”,曲線下后面的面積則會(huì)很大這成為Google搜索詞,Amazon書(shū)籍銷(xiāo)售成功的“原理性基礎(chǔ)”即不止是賣(mài)熱門(mén)產(chǎn)品,利基產(chǎn)品也可以帶來(lái)巨大收入(因?yàn)樗鼈兤贩N數(shù)量巨大)但是,當(dāng)固定一個(gè)數(shù)(而不是百分比),例如“top100”,長(zhǎng)尾效應(yīng)與營(yíng)銷(xiāo)策略銷(xiāo)量位次即:如果一類(lèi)商品的品種流行性分布為冪律,且品種足夠多,經(jīng)營(yíng)利基產(chǎn)品也能獲得很大利益但有兩個(gè)前提降低庫(kù)存成本讓顧客容易發(fā)現(xiàn)那些產(chǎn)品考慮top-100之后總銷(xiāo)量Zipf形式的表達(dá)長(zhǎng)尾效應(yīng)與營(yíng)銷(xiāo)策略銷(xiāo)量位次即:如果一類(lèi)商品的品種流行性分布為銷(xiāo)售排行版、推薦、搜索是促進(jìn)“暢銷(xiāo)產(chǎn)品”還是促進(jìn)“利基產(chǎn)品”的銷(xiāo)售?排行版:推動(dòng)富者更富推薦(相關(guān)推薦)取決于“相關(guān)”的含義,若是“買(mǎi)了這產(chǎn)品的其他人通常也買(mǎi)了…”,則傾向于是富者更富;若是按照某種“內(nèi)容相關(guān)性”,則可起到推動(dòng)利基產(chǎn)品銷(xiāo)售的作用搜索:也是有兩面性社會(huì)上現(xiàn)在的各種排名貽害無(wú)窮銷(xiāo)售排行版、推薦、搜索是促進(jìn)“暢銷(xiāo)產(chǎn)品”還是促進(jìn)“利基產(chǎn)品”流行性冪律齊普夫定律“長(zhǎng)尾”富者愈富2/8律自相似下列概念關(guān)系要點(diǎn)簡(jiǎn)述(學(xué)生談)現(xiàn)象規(guī)律性質(zhì)規(guī)律機(jī)理性質(zhì)規(guī)律流行性冪律齊普夫定律“長(zhǎng)尾”富者愈富2/8律自相似下列概念關(guān)40《社會(huì)科學(xué)中的計(jì)算思維方法》《網(wǎng)絡(luò)、群體與市場(chǎng)》教學(xué)課件-010(從眾與流行)《社會(huì)科學(xué)中的計(jì)算思維方法》《網(wǎng)絡(luò)、群體與市場(chǎng)》教學(xué)課件-010(從眾與流行)“長(zhǎng)尾”-“2/8律”“銷(xiāo)量排前20%的書(shū)的銷(xiāo)量之和占總銷(xiāo)量的80%”,“少數(shù)人的財(cái)富之和占所有人財(cái)富之和的大部分”,…設(shè)共有1000種書(shū),銷(xiāo)量滿足齊普夫律,y=b/x我們來(lái)看看排名前20%的銷(xiāo)量之和占總銷(xiāo)量的百分比,也就是總銷(xiāo)量為b*ln(1000)=6.9b有5.3/6.9=0.77=77%“長(zhǎng)尾”-“2/8律”“銷(xiāo)量排前20%的書(shū)的銷(xiāo)量之和占總銷(xiāo)量齊普夫定律(Zipf’sLaw)

--另一個(gè)視角看“長(zhǎng)尾”橫軸此時(shí)可看成“銷(xiāo)量排名位次”,縱軸則是對(duì)應(yīng)位次的銷(xiāo)量。從函數(shù)關(guān)系看:銷(xiāo)量至少為k的品種數(shù)坐標(biāo)軸交換(反函數(shù))也是冪函數(shù),尾巴更粗齊普夫定律(Zipf’sLaw)

--另一個(gè)視角看“長(zhǎng)尾”《社會(huì)科學(xué)中的計(jì)算思維方法》《網(wǎng)絡(luò)、群體與市場(chǎng)》教學(xué)課件-010(從眾與流行)與“長(zhǎng)尾”(longtail)的關(guān)系一類(lèi)產(chǎn)品(例如書(shū)籍,個(gè)人音樂(lè)專(zhuān)輯)各個(gè)品種的銷(xiāo)售量(流行度)常符合冪律商業(yè)上人們更方便直接談銷(xiāo)量(而不是概率),設(shè)該類(lèi)產(chǎn)品的品種總數(shù)為n,于是即銷(xiāo)量為x的品種的個(gè)數(shù)發(fā)現(xiàn)銷(xiāo)量為x的品種的概率與“長(zhǎng)尾”(longtail)的關(guān)系一類(lèi)產(chǎn)品(例如書(shū)籍,個(gè)“長(zhǎng)尾”(進(jìn)一步)關(guān)心“銷(xiāo)量至少為k的品種數(shù)”也是冪函數(shù)(但冪次變了)長(zhǎng)尾的典型圖示。由于降了一個(gè)冪次,尾巴顯得更加明顯“長(zhǎng)尾”(進(jìn)一步)關(guān)心“銷(xiāo)量至少為k的品種數(shù)”也是冪函數(shù)長(zhǎng)尾《社會(huì)科學(xué)中的計(jì)算思維方法》《網(wǎng)絡(luò)、群體與市場(chǎng)》教學(xué)課件-010(從眾與流行)資料來(lái)源:/watch?v=P0e6zG8IbE8StanleyMilgram的另一個(gè)著名實(shí)驗(yàn)資料來(lái)源:/watch?v=P信息級(jí)聯(lián)實(shí)驗(yàn)?zāi)P团c分析隨機(jī)取一個(gè)壇子依次,人們隨機(jī)從中摸出一個(gè)球

自己看宣布判斷“藍(lán)多”或“紅多”

大家聽(tīng)信號(hào):b,b,r,b,r,r,b,r宣布:?,?,?,?,?,?,?,?信息級(jí)聯(lián)實(shí)驗(yàn)?zāi)P团c分析隨機(jī)取一個(gè)壇子信號(hào):b,b,r,b,r每個(gè)人,依次已知信息:

自己抓到的球的顏色(私有信號(hào))前面的人宣布的判斷結(jié)果(公共知識(shí))基于已知信息,壇子是“藍(lán)多”的概率?第一個(gè)人

假設(shè)他抓到的是藍(lán)(b)球,正確的判斷應(yīng)該是“藍(lán)多”還是“紅多”?每個(gè)人,依次已知信息:基于已知信息,壇子是“藍(lán)多”的概率?信息級(jí)聯(lián)實(shí)驗(yàn)與分析實(shí)驗(yàn)結(jié)果如何?假設(shè)每個(gè)參與實(shí)驗(yàn)的人都足夠會(huì)計(jì)算概率之類(lèi),結(jié)果會(huì)如何?(即,理論結(jié)果)信號(hào):b,b,r,b,r,r,b,r宣布:B,?,?,?,?,?,?,?信息級(jí)聯(lián)實(shí)驗(yàn)與分析實(shí)驗(yàn)結(jié)果如何?信號(hào):b,b,r,b,r,r第一個(gè)人按他抓到的球的顏色宣布第二個(gè)人,聽(tīng)到了第一個(gè)人的判斷(從而能推理出了他看到的顏色),將按照自己抓的球的顏色宣布(假設(shè)在概率相等的情形,采取傾向自己信號(hào)的顏色)第三個(gè)人,聽(tīng)到了第一和第二個(gè)人的判斷(從而能推理他們抓到球的顏色)如果他們不一致,將按照自己抓球的顏色宣布如果他們一致,則將忽略自己的私有信號(hào),跟著他們同樣宣布Informationcascading信息級(jí)聯(lián)第一個(gè)人按他抓到的球的顏色宣布Informationcas結(jié)果會(huì)如何?第4個(gè)人也知道第1和第2個(gè)人看到的球顏色(設(shè)相同),但不知道第3個(gè)人的,因此他也只能放棄自己的信號(hào)(可能是紅球)…信號(hào):b,b,r,b,r,r,b,r宣布:B,B,B,B,B,B,B,B結(jié)果會(huì)如何?第4個(gè)人也知道第1和第2個(gè)人看到的球顏色(設(shè)相同如果是這樣一個(gè)實(shí)驗(yàn)情況呢?信號(hào):b,r,b,r,r,r,b,r宣布:????????

信號(hào):b,r,b,r,r,r,b,r宣布:B,R,B,R,R,R,R,R

結(jié)論:信息級(jí)聯(lián)發(fā)生在兩種顏色小球之差為2的時(shí)候,一旦發(fā)生,就“一邊倒”。如果是這樣一個(gè)實(shí)驗(yàn)情況呢?信號(hào):b,r,b,r,r,r,b,信息級(jí)聯(lián)的特點(diǎn)聽(tīng)起來(lái)“表態(tài)一致”,但實(shí)際上可能都是錯(cuò)的?。ɡ绲拇_是“紅多”壇子,但前面兩個(gè)人碰巧摸到了藍(lán)色球)信息級(jí)聯(lián)是脆弱的,有一點(diǎn)“擾動(dòng)”就可能終止,甚至改變但這錯(cuò)是理性的錯(cuò),而不是盲目的錯(cuò)信息級(jí)聯(lián)的特點(diǎn)聽(tīng)起來(lái)“表態(tài)一致”,但實(shí)際上可能都是錯(cuò)的?。ɡ靶畔_動(dòng)”的影響參與者123456789101112信號(hào)bbrrbrrbrrbr判斷假設(shè)第9個(gè)人悄悄告訴了第10個(gè)人他看到的球的顏色。第10個(gè)人應(yīng)該宣布什么?第11和12個(gè)人看到第9告訴第10其私有信號(hào),但不知道告訴的到底是什么。他倆應(yīng)該給出什么判斷?BBBBBBBBBRBR“信息擾動(dòng)”的影響參與者123456789101112信號(hào)b對(duì)信息級(jí)聯(lián)認(rèn)識(shí)的一個(gè)應(yīng)用假設(shè)你是老板,要做一個(gè)比較復(fù)雜的二選一(A,B)的決定,讓一個(gè)助手找一些專(zhuān)家征求意見(jiàn)你聽(tīng)說(shuō)助手是把專(zhuān)家們找來(lái)開(kāi)會(huì),會(huì)上請(qǐng)他們一一表達(dá)支持哪一個(gè)選項(xiàng)的意見(jiàn)后來(lái),你助手來(lái)匯報(bào)說(shuō)多數(shù)贊成選項(xiàng)A,你對(duì)選擇A是否有信心?如果他說(shuō)是絕大多數(shù),你的信心會(huì)增加嗎?對(duì)信息級(jí)聯(lián)認(rèn)識(shí)的一個(gè)應(yīng)用假設(shè)你是老板,要做一個(gè)比較復(fù)雜的二選防止錯(cuò)誤的

信息級(jí)聯(lián)防止有人利用信息級(jí)聯(lián)達(dá)到個(gè)人不正當(dāng)目的防止錯(cuò)誤的

信息級(jí)聯(lián)防止有人利用信息級(jí)聯(lián)達(dá)到個(gè)人不正當(dāng)目的《社會(huì)科學(xué)中的計(jì)算思維方法》《網(wǎng)絡(luò)、群體與市場(chǎng)》教學(xué)課件-010(從眾與流行)(第18章)Popularity,PowerLaw,ScaleFree,Richgetsricher

LongTail,Zipf’sLaw,2/8Law流行性冪律齊普夫定律“長(zhǎng)尾”富者愈富2/8律無(wú)標(biāo)度(第18章)Popularity,PowerLaw,S612017年8月人們關(guān)心的事物34個(gè)人提供信息共304詞語(yǔ)涉及153不同詞語(yǔ)詞頻的平均數(shù)=1.98詞頻的中位數(shù)=12017年8月人們關(guān)心的事物34個(gè)人提供信息2017年7月人們關(guān)心的事物

34個(gè)人提供信息共312詞語(yǔ)涉及162不同詞語(yǔ)詞頻的平均數(shù)=1.93詞頻的中位數(shù)=12017年7月人們關(guān)心的事物2017.8月事物流行性(詞頻)概率分布橫軸:詞頻=1,2,…,15該頻率下詞數(shù)縱軸:概率=——————不同詞的個(gè)數(shù)2017.8月事物流行性(詞頻)概率分布橫軸:詞頻=1,2,按流行度(詞頻)高低的排序橫軸:排位=1,2,…,153

縱軸:詞頻=15,0,0,12,…,8,7,7,7,6,…為什么兩個(gè)圖像都近似直線?按流行度(詞頻)高低的排序橫軸:為什么兩個(gè)圖像都近似直線?流行性(popularity)事物被人們關(guān)注、認(rèn)知、或偏愛(ài)的程度人(明星),書(shū)籍,歌曲,某一類(lèi)產(chǎn)品(例如軟飲料),某一類(lèi)服務(wù)(例如提供信息服務(wù)的網(wǎng)站),微博主,…研究:同一類(lèi)事物的不同實(shí)例被人們關(guān)注、認(rèn)知、或偏愛(ài)的程度的差別隨機(jī)性是否有什么規(guī)律?規(guī)律背后的機(jī)制?應(yīng)用?流行性(popularity)事物被人們關(guān)注、認(rèn)知、或偏愛(ài)的例如:設(shè)圖書(shū)城有14種書(shū):B1,B2,B3,…,B14,分別的銷(xiāo)售量如下表所示B1B2B3B4B5B6B7B8B9B10B11B12B13B1410020201002025150180252010020025502025501001501802004/143/142/141/14討論流行性的出發(fā)點(diǎn):數(shù)據(jù)與概率分布數(shù)據(jù)量越大越接近真實(shí)概率例如:設(shè)圖書(shū)城有14種書(shū):B1,B2,B3,…,B1一般地,以網(wǎng)頁(yè)入度為例給定一個(gè)國(guó)家(地區(qū))的網(wǎng)頁(yè)集合(S),發(fā)現(xiàn)其中一個(gè)網(wǎng)頁(yè)的入向鏈接數(shù)為k的概率f(k)是多少?n是網(wǎng)頁(yè)總數(shù)pi表示xi的入向鏈接數(shù)同類(lèi)事物的不同的數(shù)據(jù)集,是否有共性?不同類(lèi)事物的流行性分布是否有共性?一般地,以網(wǎng)頁(yè)入度為例給定一個(gè)國(guó)家(地區(qū))的網(wǎng)頁(yè)集合(S),數(shù)據(jù)實(shí)驗(yàn)表明,事物流行性概率分布大量各種不同類(lèi)型的數(shù)據(jù)集都顯現(xiàn)出這種性態(tài)因此,就說(shuō)這是反映流行性的一種規(guī)律,由于是冪函數(shù),俗稱(chēng)“冪律”c≥2流行度為k的概率數(shù)據(jù)實(shí)驗(yàn)表明,事物流行性概率分布大量各種不同類(lèi)型的數(shù)據(jù)集都顯北京大學(xué)課程的選課人數(shù)北京大學(xué)課程的選課人數(shù)冪律的習(xí)慣(圖形)表示log(f(k))是關(guān)于log(k)的線性函數(shù)以log(k)為橫軸,log(f(k))為縱軸的圖像是一條直線這等價(jià)于說(shuō)在雙對(duì)數(shù)坐標(biāo)(橫和縱)下,冪函數(shù)的圖像是一條直線冪律的習(xí)慣(圖形)表示log(f(k))是關(guān)于log(k因此,給定一組原始數(shù)據(jù)k:1,2,3,…f(k):…許多數(shù)據(jù)處理軟件都支持以對(duì)數(shù)坐標(biāo)作圖。因此,給定一組原始數(shù)據(jù)k:1,2,3,…許多數(shù)冪律的基本特性Scalefree(無(wú)標(biāo)度的,不受尺度影響的)Scalefree函數(shù)隱含著自相似(selfsimilarity)平均行為不反映典型行為“典型行為”-經(jīng)常遇到的;“平均行為”-總和/個(gè)數(shù)正態(tài)分布的“平均行為”反映“典型行為”典型看到“中等個(gè)子”,大個(gè)子很稀少冪律的基本特性Scalefree(無(wú)標(biāo)度的,不受尺度影響的ScaleFree=“無(wú)標(biāo)度”?一個(gè)事物從不同的尺度看,具有相同的形態(tài)F(ax),F(x)F(ax)=bF(x)冪函數(shù)就具有這種性質(zhì)!ScaleFree=“無(wú)標(biāo)度”?一個(gè)事物從不同的尺度看冪律的基本特性Scalefree(不受尺度影響的)Scalefree函數(shù)隱含著自相似(selfsimilarity)平均不反映典型“典型”-經(jīng)常遇到的;“平均”-總和/個(gè)數(shù)正態(tài)分布的“平均”反映“典型”典型看到“中等個(gè)子”,特別矮,特別高的都很稀少例如大家提供的關(guān)注信息,共304詞語(yǔ),153不同詞語(yǔ)詞頻的平均數(shù)=1.98詞頻的中位數(shù)=1冪律的基本特性Scalefree(不受尺度影響的)例如大家中國(guó)人均住房面積:符合冪律分布中國(guó)人均住房面積:符合冪律分布取值范圍

n=1,...,100

均值=4.65

意味著:看到比均值大的對(duì)象的可能性很高

具體算出來(lái),看到較大對(duì)象的概率約為0.2

最后這個(gè)計(jì)算表明看到比均值大一倍對(duì)象的概率約為0.1體會(huì)偏離“平均”的“非典型”也不罕見(jiàn)的算例取值范圍

n=1,...,100

均值=4.65

人們對(duì)事物的關(guān)注,或者說(shuō)事物的流行性(度)為什么呈冪律分布呢?類(lèi)似于“小世界”,人們希望找到這種相當(dāng)普遍的社會(huì)現(xiàn)象背后的機(jī)理(模型)人們對(duì)事物的關(guān)注,或者說(shuō)事物的流行性(度)為什么呈冪律分布呢冪律的成因(“富者更富”模型)網(wǎng)頁(yè)按照順序創(chuàng)建:1,2,3,…,j,…當(dāng)創(chuàng)建網(wǎng)頁(yè)j時(shí),以概率p或1-p選擇如下(a)或(b)執(zhí)行(a)以概率

p,均勻地、隨機(jī)地選擇一個(gè)早先創(chuàng)建的網(wǎng)頁(yè)

i,建立一個(gè)從

j到i的鏈接(b)以1-p的概率,以1-p的概率,按照與已有入度成比例的概率,選擇一個(gè)早先創(chuàng)建的網(wǎng)頁(yè)

i,建立一個(gè)從

j到

i

的鏈接。。。。。。。j此模型產(chǎn)生冪律ak-c,其中的指數(shù)c取決于概率p簡(jiǎn)而言之:如果人們都傾向于關(guān)注較多人關(guān)注的事物(即被他人影響),那么不同事物被關(guān)注度的分布就是冪律馬太效應(yīng)銀行貸款,更愿貸給錢(qián)多的,項(xiàng)目評(píng)審,已有項(xiàng)目多的更容易得到評(píng)優(yōu),人才帽子之類(lèi)問(wèn)題是,都知道這樣不一定對(duì),但人們依然傾向于如此。為什么呢??jī)缏傻某梢颍ā案徽吒弧蹦P停┚W(wǎng)頁(yè)按照順序創(chuàng)建:1,2,3,富者更富效應(yīng)的微觀不可預(yù)測(cè)性“富者更富”也具有級(jí)聯(lián)的意味,現(xiàn)實(shí)生活中有不少體現(xiàn)這種情形的現(xiàn)象最初階段充滿不確定性,“富”到一定程度后就開(kāi)始“起飛”與《哈利波特》同樣質(zhì)量的小說(shuō)在同一時(shí)期其實(shí)很多,但真正流行起來(lái)的很少同樣水平的歌星在同一時(shí)期其實(shí)很多,但真正出名的很少一類(lèi)事物流行史的細(xì)節(jié)不可能重演,但歷史的結(jié)果宏觀上總是如此(流行的分布)富者更富效應(yīng)的微觀不可預(yù)測(cè)性“富者更富”也具有級(jí)聯(lián)的意味,現(xiàn)歷史平行演化的一次模擬實(shí)驗(yàn)建一個(gè)音樂(lè)下載網(wǎng)站,向網(wǎng)民提供48首人們不太熟悉的歌曲的下載該網(wǎng)站也公布每首歌曲的“已下載次數(shù)”,后面上來(lái)的人能夠看到(從而就有一種促進(jìn)富者更富的功效)觀察一段時(shí)間后那些歌曲下載量的分布實(shí)驗(yàn)設(shè)計(jì)的妙處在:人們不知道他們被隨機(jī)分到8個(gè)類(lèi)似的網(wǎng)站之一(歌曲相同,初始狀態(tài)相同)!于是:研究人員看到了8段平行發(fā)展的歷史。歷史平行演化的一次模擬實(shí)驗(yàn)建一個(gè)音樂(lè)下載網(wǎng)站,向網(wǎng)民提供48“冪律”與“長(zhǎng)尾”的關(guān)系在討論同一類(lèi)產(chǎn)品(例如,書(shū)籍、唱片)的不同品種(書(shū))的銷(xiāo)量上,更多地用“長(zhǎng)尾”的概念如果一類(lèi)產(chǎn)品的不同品種的銷(xiāo)量(流行性)分布為冪律,則銷(xiāo)量至少為k的品種數(shù)也是冪律,但階次降1,從而曲線看起來(lái)“尾巴更長(zhǎng)”“冪律”與“長(zhǎng)尾”的關(guān)系在討論同一類(lèi)產(chǎn)品(例如,書(shū)籍、唱片)“長(zhǎng)尾”與“齊普夫定律”的關(guān)系齊普夫定律講的是,一類(lèi)事物(例如,詞匯)的不同品種(詞)的流行性(頻次)排行,從高到低,呈現(xiàn)為冪函數(shù)。這種“排行”函數(shù)相當(dāng)前述長(zhǎng)尾函數(shù)的反函數(shù)?!伴L(zhǎng)尾”與“齊普夫定律”的關(guān)系齊普夫定律講的是,一類(lèi)事物(例“齊普夫定律”與“2/8律”的關(guān)系“top20%”曲線下的面積約占整個(gè)面積的80%。銷(xiāo)量位次Zipf形式的表達(dá)20%

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論