新榜指數(shù)(NRI,NewRankIndex)算法說明_第1頁
新榜指數(shù)(NRI,NewRankIndex)算法說明_第2頁
新榜指數(shù)(NRI,NewRankIndex)算法說明_第3頁
新榜指數(shù)(NRI,NewRankIndex)算法說明_第4頁
新榜指數(shù)(NRI,NewRankIndex)算法說明_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、新榜指數(shù)(NRI )算法說明什么是新榜指數(shù)新榜指數(shù)(New Rank Index , NRI)系由新媒體排行榜( )基于海 量數(shù)據(jù)、用戶深度反饋及專家建議而推出, 用于衡量中國移動互聯(lián)網(wǎng)渠道新媒體(主要指兩 微一端)的傳播能力,此指數(shù)反映該新媒體主體的熱度和發(fā)展趨勢。以下算法主要針對微信進(jìn)行闡述 :算法簡述新榜指數(shù)是由原始數(shù)據(jù)參照基數(shù)通過計(jì)算公式推導(dǎo)出來的標(biāo)量數(shù)值,用以衡量原始數(shù) 據(jù)在其所屬維度的相對表現(xiàn)。例如,xx點(diǎn)贊數(shù)為:379,我們會將這一數(shù)據(jù)和點(diǎn)贊常數(shù)進(jìn)行比較,以確定其點(diǎn)贊數(shù)的相對位置,進(jìn)而轉(zhuǎn)換為其點(diǎn)贊指數(shù),其余指標(biāo)以此類推。該算法相較于常規(guī)加權(quán)有四大優(yōu)勢:1不僅顯示絕對表現(xiàn),還能反映

2、所處位置;2、標(biāo)準(zhǔn)化后,不同維度的指標(biāo)之間可以相互比較;3、 指標(biāo)之間可以相互運(yùn)算,從而得到綜合考察各維度的新榜指數(shù);4、不僅可以用于賬號間的比較,也可以用于賬號自身的跨期比較。算法1、選定指標(biāo)在微信的計(jì)算中,為兼顧其數(shù)量與質(zhì)量,我們使用總閱讀數(shù)、最高閱讀數(shù)、平均閱讀 數(shù)、頭條閱讀數(shù)、總點(diǎn)贊數(shù)五個指標(biāo)來對賬號進(jìn)行評估,其中: 整體指標(biāo)(總閱讀數(shù),R):指統(tǒng)計(jì)周期內(nèi)所有發(fā)布內(nèi)容的閱讀數(shù)總和;優(yōu)異指標(biāo)(最高閱讀,Rn):是指統(tǒng)計(jì)周期內(nèi)所有發(fā)布內(nèi)容中的單篇最高閱讀數(shù);質(zhì)量指標(biāo)(平均閱讀數(shù),Ra ):統(tǒng)計(jì)周期內(nèi)所有發(fā)布內(nèi)容的閱讀數(shù)平均值;主動預(yù)判指標(biāo)(頭條閱讀,Rh ):統(tǒng)計(jì)周期內(nèi)位置為頭條的內(nèi)容的閱

3、讀總數(shù);互動指標(biāo)(總點(diǎn)贊數(shù),Z):統(tǒng)計(jì)周期內(nèi)所有發(fā)布內(nèi)容的點(diǎn)贊數(shù)總和。2、指標(biāo)標(biāo)準(zhǔn)化 基于不同維度指標(biāo)的差異性,我們首先將所得數(shù)據(jù)標(biāo)準(zhǔn)化,即通過對各維度原始數(shù)據(jù)與該維 度常數(shù)的比值計(jì)算,得到該樣本各項(xiàng)指標(biāo)的千分化數(shù)值。在新榜指數(shù)中,以天為最小計(jì)算周期,將常規(guī)(1天推送一次,每次最多 8篇)的公眾號為對象在這一時間段內(nèi)總閱讀數(shù)、最高閱讀數(shù)、平均閱讀數(shù)、頭條閱讀數(shù)和點(diǎn)贊數(shù)共五個指標(biāo)的常數(shù)分別記為:結(jié)合新榜歷史數(shù)據(jù)樣本庫及微信平臺的發(fā)布規(guī)則一一1個常規(guī)的微信公眾號每天最多發(fā)布8篇,每次單篇閱讀數(shù)最高為 10萬我們記錄80萬為"總閱讀數(shù)”這一指標(biāo)理論上的1000分,對于某些特別賬號一一例如每

4、天可以推送多次的人民日報、央視新聞,則理論上,在該指標(biāo)上可以獲得比1000分更高的得分。故而:= 8 1 100000 = 800000石=100000= 100000鬲=100000Z=8*10000.在不同的時間周期, 即日、周、月、年(n=1,7,30,365 )下,以上常數(shù)具體數(shù)值為:HJRe ,Ra,M * RftI* Z在此基礎(chǔ)上,各指標(biāo)按以下公式進(jìn)行標(biāo)準(zhǔn)化:注:此處“ +1 ”是為了避免出現(xiàn)類似“0閱讀”時而產(chǎn)生無效值備注:In為自然對數(shù),如果a的x次方等于N (a>0,且a不等于1),那么數(shù)X 叫做以a為底N的對數(shù)(logarithm ),記作x=log aN。其中,a叫

5、做對數(shù)的底數(shù),N叫做真數(shù)。無理數(shù)e (e=2.71828)為底的對數(shù)稱為 自然對數(shù)(natural logarithm ),并記為In。Ld 呱“二2映=1= loSuM +M=til ogeM對取對數(shù)以后的數(shù)據(jù)進(jìn)行線性回歸,對各數(shù)據(jù)取對數(shù)之后不會改變數(shù)據(jù)的性質(zhì) 和關(guān)系,且所得到的數(shù)據(jù)易消除異方差問題;同時,取對數(shù)以后,經(jīng)濟(jì)變量具有彈 性的含義,所以一般對變量取對數(shù)形式。指標(biāo)加權(quán)由于此五項(xiàng)數(shù)據(jù)影響微信傳播能力的程度不同,我們賦予不同的權(quán)重,分別記為Rm ,3 Ra,3 Rh ,3 Z 。最終,新榜指數(shù)的計(jì)算公式表述為:NRI = o)rR +(oRmRin +(A)RaR'a + 軸屁

6、 + w2Z目前,我們使用的系數(shù)為3 R =0.75, 3 Rm =0.05, 3 Ra =0.1, 3 Rh =0.05, 3z =0.05。新榜始終相信,不同類別之間的簡單比較是沒有意義的,所以,在發(fā)布需要跨類別比較的月榜暨“中國微信500強(qiáng)”時,我們會賦予類別系數(shù),彰顯渠道價值。具體系數(shù)表如下:時事1文化0.99財(cái)富0.99健康0.98民生0.98時尚0.98科技0.98美磁0.98創(chuàng)業(yè)098樂活0.98汽車098旅行098樓市0.98幽默0955職場0.98情感Q98教育0.98體娛098學(xué)術(shù)102美體0.98政務(wù)0.99珍奢0.98098百科0955算法所使用數(shù)據(jù)的統(tǒng)計(jì)口徑日榜的統(tǒng)計(jì)

7、周期是所示日期0時至24時間,統(tǒng)計(jì)截止時間是次日中午12時,以確保子夜發(fā)布者亦可得到至少 12小時的傳播。周榜的統(tǒng)計(jì)周期是所示日期范圍(周一 0時至周 日24時),統(tǒng)計(jì)截止時間是下一個周一的中午12時。需要特別說明的是,我們的周榜并非日榜數(shù)據(jù)的簡單加總,而是重新更新并統(tǒng)計(jì),以記錄長尾效應(yīng)。月榜、年榜亦然。注:根據(jù)騰訊官方政策,微信影響力榜單所列微信閱讀數(shù)僅指前臺顯示數(shù)據(jù),且超過10萬者一律顯示為10萬,與微信管理后臺所顯示數(shù)據(jù)可能不一致。FQA1、為何要設(shè)定常數(shù)?正如我們將“ 1米”定義為平面電磁波(光)在“ 1/299,792,458秒”的持續(xù)時間內(nèi)在真空中 傳播行經(jīng)的長度一樣。我們基于理論

8、值和實(shí)際觀測值設(shè)定了各個指標(biāo)的相對參考值,用來對各個指標(biāo)進(jìn)行歸一化處理。2、1000分是最高分嗎?不是。但是1000分可以視為一個常規(guī)號 (一天發(fā)布1次)的能夠達(dá)到的極限一一發(fā)滿 8篇、 每篇閱讀數(shù)10萬、點(diǎn)贊1萬。但是,人民日報、央視新聞等擁有單日多次推送權(quán)限的賬號 存在理論上超越這一得分的可能;3、 常數(shù)設(shè)定中的點(diǎn)贊數(shù)的最高值為何沒用10萬,而是1萬?在實(shí)際監(jiān)測中(超過1000萬個文章樣本),新榜的技術(shù)人員觀測到過 6萬+的單篇點(diǎn) 贊數(shù),但是這是屬于極其特別的個例, 通過測試樣本分布 (單篇點(diǎn)贊超過1萬的樣本比例遠(yuǎn) 小于萬分之一),我們選定 1萬作為理論上限;4、算法會經(jīng)常變么,如發(fā)布上限

9、從 8篇/天變成了 10篇/天?新榜指數(shù)的核心價值是為所有賬號提供了一個參照系,只要這個參照系是穩(wěn)定的,那么比較就是有意義的。一個穩(wěn)定的體系更有利于長期的觀察和度量;類似微信官方策略的變化只會使得總閱讀一項(xiàng)指標(biāo)變得更容易達(dá)到1000分,甚至超越這一分?jǐn)?shù),但是并不會對這一算法產(chǎn)生決定性的影響;新榜技術(shù)人員會對數(shù)據(jù)環(huán)境進(jìn)行長期跟進(jìn),如果確有極大影響, 會及時調(diào)整優(yōu)化,并在公開渠道統(tǒng)一通知說明;5、新榜指數(shù)可以跨期比較么?可以。新榜指數(shù)為單調(diào)增函數(shù),只要時間維度一致(日周、月、年等),賬號之間、自身 與自身都是可以比較的。拓展兩微一端的獨(dú)立及跨平臺應(yīng)用1、微博、騰訊微社區(qū)、新聞客戶端等獨(dú)立應(yīng)用通過標(biāo)準(zhǔn)化指標(biāo)使得轉(zhuǎn)發(fā)、評論、PV、UV、樓中樓回復(fù)等變成獨(dú)立可比較的指標(biāo),每一個指標(biāo)均反映該對象在全部 樣本中的獨(dú)立表現(xiàn),進(jìn)行加權(quán)得到獨(dú)立應(yīng)用場景下的新榜指數(shù);2、雙微及兩微一端的綜合應(yīng)用與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論