《新媒體數(shù)據(jù)分析與應(yīng)用》課件 朱小棟 第1-6章 緒論、新媒體數(shù)據(jù)分析指標(biāo)-數(shù)據(jù)可視化_第1頁
《新媒體數(shù)據(jù)分析與應(yīng)用》課件 朱小棟 第1-6章 緒論、新媒體數(shù)據(jù)分析指標(biāo)-數(shù)據(jù)可視化_第2頁
《新媒體數(shù)據(jù)分析與應(yīng)用》課件 朱小棟 第1-6章 緒論、新媒體數(shù)據(jù)分析指標(biāo)-數(shù)據(jù)可視化_第3頁
《新媒體數(shù)據(jù)分析與應(yīng)用》課件 朱小棟 第1-6章 緒論、新媒體數(shù)據(jù)分析指標(biāo)-數(shù)據(jù)可視化_第4頁
《新媒體數(shù)據(jù)分析與應(yīng)用》課件 朱小棟 第1-6章 緒論、新媒體數(shù)據(jù)分析指標(biāo)-數(shù)據(jù)可視化_第5頁
已閱讀5頁,還剩244頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

新媒體數(shù)據(jù)分析與應(yīng)用第1章:緒論Chapter1:Introduction.本章提綱CONTENTS數(shù)據(jù)分析的相關(guān)知識(shí)KnowledgeofDataAnalysis01新媒體與新媒體數(shù)據(jù)NewMediaandNewMediaData02新媒體數(shù)據(jù)分析的過程N(yùn)ewMediaDataAnalysisProcess0301Netflix利用了大數(shù)據(jù)分析,使其成為全球數(shù)一數(shù)二的網(wǎng)絡(luò)流媒體視頻平臺(tái),由此可見,數(shù)據(jù)分析是非常有意義且商業(yè)價(jià)值很高的。本節(jié)從數(shù)據(jù)分析的相關(guān)基礎(chǔ)知識(shí)入手,介紹了數(shù)據(jù)分析的基本概念。數(shù)據(jù)分析的相關(guān)知識(shí)第1章:緒論CAB數(shù)據(jù)數(shù)據(jù)(或稱資料),是關(guān)于事件的一組離散、客觀的事實(shí)描述,是構(gòu)成信息和知識(shí)的原始材料,是載荷或記錄信息的按一定規(guī)則排列組合的物理符號(hào)。數(shù)據(jù)的表現(xiàn)形式有圖形、圖像、視頻、聲音、文字、數(shù)字、字符和符號(hào)等。知識(shí)知識(shí)是“與經(jīng)驗(yàn)、上下文、解釋和思考結(jié)合在一起的信息。它是一種可以隨時(shí)幫助人們決策與行動(dòng)的高價(jià)值信息”。知識(shí)可以分為顯性知識(shí)和隱性知識(shí)。顯性知識(shí)或已編碼的知識(shí)是指一種用正式的、系統(tǒng)化的語言傳輸?shù)闹R(shí);隱性知識(shí)擁有個(gè)人化的特征,這使得隱性知識(shí)很難正規(guī)化和傳播。信息“信息”的英文是“information”,它來源于拉丁文,原意是解釋、陳述?!掇o?!分小靶畔ⅰ钡慕忉尀榭陀^存在的消息、情況、情報(bào)等。雖然現(xiàn)在已很少用“情報(bào)”這個(gè)術(shù)語,但information在近代歷史上解釋為情報(bào)非常合適。在中國,高等學(xué)校的信息學(xué)專業(yè)、信息管理與信息系統(tǒng)專業(yè)是從早期的情報(bào)學(xué)專業(yè)衍生而來的。1.1.1數(shù)據(jù)、知識(shí)與信息第1章:緒論1.1.2數(shù)據(jù)分析的定義與作用數(shù)據(jù)分析是檢查、清理、轉(zhuǎn)換和建模數(shù)據(jù)的過程,其目的是發(fā)現(xiàn)有用的信息,提供結(jié)論并支持決策。數(shù)據(jù)分析包含多個(gè)方面、多種方法和以各種名稱命名的多種技術(shù),并且用于不同的業(yè)務(wù)、科學(xué)和社會(huì)科學(xué)領(lǐng)域。在當(dāng)今的商業(yè)世界中,數(shù)據(jù)分析在使決策更加科學(xué)、幫助企業(yè)更有效地運(yùn)營方面發(fā)揮著重要作用。數(shù)據(jù)分析運(yùn)用適當(dāng)?shù)慕y(tǒng)計(jì)分析方法對(duì)收集來的大量數(shù)據(jù)進(jìn)行分析,將它們加以匯總和理解并消化,以求最大化地開發(fā)數(shù)據(jù)的功能,發(fā)揮數(shù)據(jù)的作用。數(shù)據(jù)分析是為了提取有用的信息和形成結(jié)論,從而對(duì)數(shù)據(jù)加以詳細(xì)研究和概括總結(jié)的過程。

數(shù)據(jù)分析的數(shù)學(xué)基礎(chǔ)在20世紀(jì)早期就已確立,但直到計(jì)算機(jī)的出現(xiàn)才使實(shí)際操作成為可能,并使數(shù)據(jù)分析得以推廣。數(shù)據(jù)分析是數(shù)學(xué)與計(jì)算機(jī)科學(xué)相結(jié)合的產(chǎn)物。

請(qǐng)?jiān)谶@里開始你的表演現(xiàn)狀分析原因分析預(yù)測分析數(shù)據(jù)分析可以揭示企業(yè)的整體情況,并通過完成各種指標(biāo)來衡量運(yùn)行狀況,從而顯示整體情況是好是壞,表現(xiàn)如何。在企業(yè)運(yùn)營中,數(shù)據(jù)分析可以顯示業(yè)務(wù)的組成和運(yùn)行情況,在關(guān)注業(yè)務(wù)發(fā)展和變化的同時(shí),對(duì)企業(yè)的業(yè)務(wù)狀態(tài)有更深入的了解。針對(duì)某一事件,在對(duì)相關(guān)的數(shù)據(jù)進(jìn)行分析后,數(shù)據(jù)分析可以揭示該事件發(fā)生的原因。在企業(yè)運(yùn)營中,對(duì)現(xiàn)狀進(jìn)行分析之后,人們對(duì)公司的運(yùn)營有了基本的了解,但是不知道哪些地方運(yùn)營得好,哪些地方運(yùn)營得差,它們差異是什么,運(yùn)營好壞的原因是什么。這時(shí),人們就需要進(jìn)行數(shù)據(jù)分析,以進(jìn)一步明確業(yè)務(wù)變更的具體原因。數(shù)據(jù)分析能夠綜合目前已經(jīng)有的信息和數(shù)據(jù),通過一定的技術(shù)手段預(yù)測未來的情況。在企業(yè)運(yùn)營中,了解該企業(yè)運(yùn)營的現(xiàn)狀后,人們有時(shí)需要對(duì)企業(yè)的未來發(fā)展趨勢做出預(yù)測,為企業(yè)制定業(yè)務(wù)目標(biāo),并提供有效的戰(zhàn)略參考和決策依據(jù),以確保企業(yè)的持續(xù)健康發(fā)展,此時(shí),就需要對(duì)已有數(shù)據(jù)進(jìn)行分析。1.1.3數(shù)據(jù)分析的意義第1章:緒論1.1.4數(shù)據(jù)分析的價(jià)值1.改進(jìn)優(yōu)化業(yè)務(wù)改進(jìn)優(yōu)化業(yè)務(wù)就是讓業(yè)務(wù)變得更好,對(duì)企業(yè)而言主要體現(xiàn)在以下兩個(gè)方面第一方面是對(duì)企業(yè)用戶體驗(yàn)的改進(jìn),優(yōu)化原有業(yè)務(wù)流程,為用戶提供更好的用戶體驗(yàn)。例如,早些年QQ游戲大廳對(duì)玩家進(jìn)入游戲的流程再造,將原有的游戲進(jìn)入登錄的環(huán)節(jié)從4個(gè)變更為3個(gè)。第二方面體現(xiàn)在對(duì)企業(yè)資源的合理化分配利用上,更合理地優(yōu)化配置企業(yè)資源,進(jìn)而達(dá)到效益最大化的目的。例如,企業(yè)日常運(yùn)營中的廣告投放及內(nèi)部廣告資源分配優(yōu)化等就屬于此范疇,一方面利用精準(zhǔn)化廣告投放,提高廣告投放效率;另一方面根據(jù)廣告引流客戶量的大小做好企業(yè)資源分配,進(jìn)而提高用戶體驗(yàn),提升用戶留存率。2.發(fā)現(xiàn)業(yè)務(wù)機(jī)會(huì)發(fā)現(xiàn)業(yè)務(wù)機(jī)會(huì)主要是利用數(shù)據(jù)查找發(fā)現(xiàn)人們思維上的盲點(diǎn),進(jìn)而發(fā)現(xiàn)新的業(yè)務(wù)機(jī)會(huì)。例如,游戲企業(yè)常在游戲中埋點(diǎn)分析玩家的游戲操作行為數(shù)據(jù)及關(guān)鍵節(jié)點(diǎn)進(jìn)程數(shù)據(jù),以達(dá)到控制游戲進(jìn)度和難易度的目的,而在這個(gè)過程中可能發(fā)現(xiàn)新的業(yè)務(wù)機(jī)會(huì),進(jìn)而擴(kuò)展出譬如游戲安全操作標(biāo)準(zhǔn)及游戲安全產(chǎn)品之類的新業(yè)務(wù)滲透點(diǎn)。第1章:緒論1.1.4數(shù)據(jù)分析的價(jià)值3.創(chuàng)造新的商業(yè)價(jià)值創(chuàng)造新的商業(yè)價(jià)值主要是在數(shù)據(jù)價(jià)值的基礎(chǔ)上形成新的商業(yè)模式,將數(shù)據(jù)價(jià)值直接轉(zhuǎn)化為金錢模式。例如,之前比較火的個(gè)人征信業(yè)務(wù)就屬于此類。騰訊、阿里巴巴等企業(yè)在其擁有廣泛用戶數(shù)據(jù)的基礎(chǔ)上,分別成立了騰訊征信、芝麻信用等新的業(yè)務(wù)關(guān)聯(lián)企業(yè),而這些征信企業(yè)又衍生出相關(guān)的“刷臉”業(yè)務(wù),并將其擴(kuò)展到租車、租房等領(lǐng)域。4.監(jiān)視預(yù)警企業(yè)運(yùn)營狀態(tài)數(shù)據(jù)分析在企業(yè)運(yùn)營過程中還發(fā)揮著“醫(yī)生”的作用,一方面提供對(duì)企業(yè)日常運(yùn)營活動(dòng)的體檢服務(wù),對(duì)在業(yè)務(wù)運(yùn)營過程中可能會(huì)出現(xiàn)的問題進(jìn)行預(yù)警,將問題消滅在萌芽狀態(tài),防患于未然。例如,在企業(yè)業(yè)務(wù)擴(kuò)充過程中,對(duì)投資合并對(duì)象的背景和發(fā)展歷史等情況的盡職調(diào)查就屬于此類。另一方面,數(shù)據(jù)分析還提供企業(yè)日常運(yùn)營過程中的“巡診就診”服務(wù),找出企業(yè)日常運(yùn)營中的問題,揭露過去和預(yù)測未來。02在新媒體領(lǐng)域中,數(shù)據(jù)分析也有非常獨(dú)特的價(jià)值。與普通的數(shù)據(jù)分析不同,新媒體領(lǐng)域中的數(shù)據(jù)和數(shù)據(jù)分析有其自身的特點(diǎn)。本節(jié)介紹了新媒體的概念、特征和發(fā)展趨勢,以及新媒體數(shù)據(jù)的概念、特征和分析過程。新媒體與新媒體數(shù)據(jù)1.2.1新媒體概念和特征新媒體的概念第1章:緒論新媒體的概念最先出自加拿大媒介研究學(xué)家馬歇爾·麥克盧漢在1959年的全美高等教育學(xué)會(huì)會(huì)議中發(fā)表的題為“電子革命:新媒體的革命影響”演講。麥克盧漢認(rèn)為,媒體即信息,當(dāng)社會(huì)靠集體行動(dòng)開發(fā)出一種新媒介(如印刷術(shù)、電報(bào)、照片和廣播)時(shí),它就贏得了表達(dá)新信息的權(quán)利。很顯然,麥克盧漢所指的“新媒體”主要是相對(duì)印刷術(shù)而言的,具體是指廣播,所以它并不是人們現(xiàn)在所熟知的新媒體的概念。所以說,新媒體的“新”是一個(gè)相對(duì)的概念?,F(xiàn)在口口相傳的“新媒體”概念出自于20世紀(jì)60年代的美國。美國哥倫比亞廣播電視網(wǎng)絡(luò)技術(shù)研究所所長戈?duì)柕埋R克在發(fā)表的一份關(guān)于開發(fā)電子錄像商品的計(jì)劃中提出了“NewMedia”(新媒體)這個(gè)概念。1969年,美國傳播政策總統(tǒng)特委會(huì)主席羅斯托在提交給時(shí)任美國總統(tǒng)尼克松的報(bào)告中,也多次使用了“NewMedia”這個(gè)概念。那時(shí),新媒體更多是指電子媒體中的創(chuàng)新性應(yīng)用。1.2.1新媒體概念和特征新媒體的特征第1章:緒論迎合人們休閑娛樂、學(xué)習(xí)時(shí)間“碎片化”的需求。

隨著社會(huì)發(fā)展的高速化,加之生活節(jié)奏的高速化,人們很難抽出集中的時(shí)間來娛樂、學(xué)習(xí)與消遣。新媒體的出現(xiàn)正好迎合了這種“碎片化”時(shí)間消費(fèi)的趨勢。這種迎合體現(xiàn)在幾個(gè)方面:首先,新媒體打破了地域的限制,使信息的傳播超越了地理?xiàng)l件的制約,無論是城市還是鄉(xiāng)村,信息伴隨著各種媒介出現(xiàn)在大眾面前,使得在信息面前“人人平等”的局面出現(xiàn)。其次,新媒體打破了時(shí)間的限制,人們可以隨時(shí)隨地獲取信息。伴隨著無限網(wǎng)絡(luò)的普及,這種趨勢會(huì)更加明顯,借助于客戶終端的多樣化,受眾人群可以借助形式多樣的新媒體實(shí)現(xiàn)“碎片化”的時(shí)間消費(fèi)。1.2.1新媒體概念和特征新媒體的特征第1章:緒論滿足隨時(shí)隨地互動(dòng)性表達(dá)、娛樂與信息需要。

傳統(tǒng)的報(bào)紙、廣播、電視等傳播方式是“中心化”,是一對(duì)多的圓錐形傳播。但是新媒體完全“去中心化”,實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)、面對(duì)面的傳播。這樣就有利于受眾針對(duì)不同的信息進(jìn)行自我化、個(gè)性化的“評(píng)頭論足”。同時(shí),受眾還可以借助各種客戶端實(shí)現(xiàn)遠(yuǎn)程視頻、遠(yuǎn)程圖片的交流,使交流的形式更具多元化、多樣化。這些優(yōu)勢是傳統(tǒng)媒體不能具備的,也是傳統(tǒng)媒體“望塵莫及”的。1.2.1新媒體概念和特征新媒體的特征第1章:緒論人們使用新媒體的目的性與選擇的主動(dòng)性更強(qiáng)。

如果人們要在傳統(tǒng)媒體上發(fā)表意見,往往需要付出比較高的代價(jià),這種代價(jià)有經(jīng)濟(jì)實(shí)力方面的,有社會(huì)地位方面的,還有個(gè)人水平方面的,沒有一定的代價(jià)是無法進(jìn)入傳統(tǒng)媒體的視野的。新媒體技術(shù)的發(fā)展徹底改變了受眾這種被動(dòng)接受、傳播信息的局面。隨著以互聯(lián)網(wǎng)為主的新媒體等手段的發(fā)展,受眾可以借助各種形式的“話筒”發(fā)表自己的個(gè)性化的語言,現(xiàn)在比較流行的形式有論壇、微博、微信、郵箱等。這些新穎的信息傳播工具的出現(xiàn)給受眾帶來了極大的便利性,受眾可以持各種觀點(diǎn)進(jìn)行交流、探討。1.2.1新媒體概念和特征新媒體的特征第1章:緒論新媒體的使用使市場細(xì)分更加充分,內(nèi)容選擇更具個(gè)性化。

新媒體已經(jīng)對(duì)傳統(tǒng)媒體的所有方面進(jìn)行了全面的融合,新媒體應(yīng)用日益廣泛。即時(shí)通訊早已由文字聊天發(fā)展到了語音聊天、視頻聊天;博客也已經(jīng)發(fā)展到利用語音甚至圖像傳播信息;手機(jī)媒體更是有一種融合所有傳統(tǒng)媒體的勢頭。新媒體多種多樣的載體、媒介形式能夠很好地供使用者更替使用,同時(shí)使網(wǎng)絡(luò)資料不斷更新和擴(kuò)充。新媒體將圖形、文字、聲音、動(dòng)畫等融為一體,提供點(diǎn)對(duì)點(diǎn)的信息傳播服務(wù),每個(gè)人都可以用一個(gè)私有的可信賴的傳播載體,而信息傳播者針對(duì)不同的受眾提供個(gè)性化的服務(wù)。在傳播形式上,新媒體具有很強(qiáng)的直觀性、形象性和娛樂性。1.2.1新媒體概念和特征我國新媒體的發(fā)展趨勢第1章:緒論新基建帶動(dòng)數(shù)字經(jīng)濟(jì)迎來全面提速提質(zhì)階段。直播和短視頻仍處于黃金發(fā)展賽道?!?G+”加速產(chǎn)業(yè)互聯(lián)網(wǎng)變局?;ヂ?lián)網(wǎng)巨頭積極布局超級(jí)App生態(tài)。微傳播價(jià)值與媒體融合價(jià)值回歸本質(zhì)?!岸浣?jīng)濟(jì)”迸發(fā)市場發(fā)展活力。網(wǎng)絡(luò)文化呈“破圈化”發(fā)展趨勢。數(shù)字社會(huì)治理共同體建設(shè)不斷推進(jìn)。1.2.2新媒體數(shù)據(jù)的分類、特征和分析過程新媒體數(shù)據(jù)的分類第1章:緒論數(shù)值型數(shù)據(jù)數(shù)值型數(shù)據(jù)主要由數(shù)字組成。通過對(duì)大量數(shù)字進(jìn)行統(tǒng)計(jì)與分析,可以總結(jié)并評(píng)估營銷效果。常見的數(shù)值型數(shù)據(jù)包括閱讀量數(shù)據(jù)(見圖1-2)、粉絲數(shù)據(jù)、網(wǎng)店銷售數(shù)據(jù)、網(wǎng)站瀏覽數(shù)據(jù)、活動(dòng)參與數(shù)據(jù)等。

1.2.2新媒體數(shù)據(jù)的分類、特征和分析過程新媒體數(shù)據(jù)的分類第1章:緒論圖文型數(shù)據(jù)圖文型數(shù)據(jù)不是由數(shù)字構(gòu)成的,而是由文字或圖片等形式構(gòu)成的。圖文型數(shù)據(jù)主要通過問卷調(diào)查、結(jié)構(gòu)化比較、分析匯總等形式獲得,其研究目的不是評(píng)估量化的數(shù)據(jù)結(jié)果,而是找到運(yùn)營方向。常見的圖文型數(shù)據(jù)包括網(wǎng)站結(jié)構(gòu)分類(在線學(xué)習(xí)網(wǎng)站結(jié)構(gòu)分類見圖1-3)、賬號(hào)粉絲分類、同行微信公眾號(hào)自定義菜單歸類、消費(fèi)者反饋、多平臺(tái)矩陣分布等。1.2.2新媒體數(shù)據(jù)的分類、特征和分析過程新媒體數(shù)據(jù)的特征第1章:緒論及時(shí)性

新媒體傳播的速度非???,新媒體數(shù)據(jù)表現(xiàn)出明顯的即時(shí)性特征,網(wǎng)民通過手機(jī)、電腦或其他智能終端能夠快速發(fā)布數(shù)據(jù)和及時(shí)接收數(shù)據(jù)。打破了傳統(tǒng)媒體定時(shí)傳播的規(guī)律,可以把數(shù)據(jù)無時(shí)間限制和無地域限制地進(jìn)行傳播。1.2.2新媒體數(shù)據(jù)的分類、特征和分析過程新媒體數(shù)據(jù)的特征第1章:緒論

新媒體與傳統(tǒng)媒體相比具有超強(qiáng)的交互性。傳統(tǒng)媒體是單向傳播,不管是廣播、電視還是報(bào)紙都是單向傳送數(shù)據(jù)的,媒體處于強(qiáng)勢地位,決定著受眾接受什么樣的數(shù)據(jù),用戶很難進(jìn)行數(shù)據(jù)反饋,其交互性很差。在新媒體環(huán)境下,數(shù)據(jù)的傳輸是雙向的,甚至是多向的。同時(shí),以微博、博客等為代表的新媒體技術(shù),也從根本上改變了用戶的受眾角色,公眾既可以是數(shù)據(jù)的接收者,又可以是數(shù)據(jù)的發(fā)送者;既可以是數(shù)據(jù)的制作者,又可以是數(shù)據(jù)的傳播者。交互性1.2.2新媒體數(shù)據(jù)的分類、特征和分析過程新媒體數(shù)據(jù)的特征第1章:緒論

新媒體利用通信衛(wèi)星和全球聯(lián)網(wǎng)的網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)傳輸,完全打破了有線網(wǎng)絡(luò)的限制和國家等行政區(qū)劃及地理區(qū)域的限制,可以在地球上的任何角落和世界相連。特別是手機(jī)新媒體發(fā)送數(shù)據(jù)時(shí)間短、接收數(shù)據(jù)速度快、受制約因素少,幾乎不受任何時(shí)間和地域的限制,在移動(dòng)互聯(lián)網(wǎng)絡(luò)覆蓋的全球任何地方、任何時(shí)間都可以搜索數(shù)據(jù)、查閱數(shù)據(jù)、發(fā)布數(shù)據(jù),這是報(bào)刊、廣播、電視等傳統(tǒng)媒體無法啟及的高度。新媒體的跨時(shí)空性1.2.2新媒體數(shù)據(jù)的分類、特征和分析過程新媒體數(shù)據(jù)的特征第1章:緒論新媒體的失真性

微博、微信、博客、QQ、論壇等作為新媒體的重要數(shù)據(jù)傳播工具,它可以為每個(gè)人提供自己的客戶終端。以手機(jī)微博、微信、微視頻等新媒體作為傳播媒介,可以隨時(shí)隨地發(fā)布自己的位置、狀態(tài)、心情和所見所聞,同時(shí)由于互聯(lián)網(wǎng)為用戶提供了虛擬的空間,用戶可以匿名登陸,廣大用戶可以自由地表達(dá)自己的觀點(diǎn)、發(fā)布消息、傳達(dá)資訊,可以就自己關(guān)心的話題留言、發(fā)帖、評(píng)論、投票,上傳統(tǒng)媒體不能說的內(nèi)容在新媒體可以輕松實(shí)現(xiàn)。雖然匿名登陸的特性可以更好地保護(hù)公眾隱私,在最大程度上實(shí)現(xiàn)言論自由,但也導(dǎo)致虛假數(shù)據(jù)泛濫,通過新媒體傳播出來的數(shù)據(jù)可信度不高等問題,數(shù)據(jù)的真實(shí)性遭到公眾的質(zhì)疑。

03互聯(lián)網(wǎng)每天都有大量的數(shù)據(jù)產(chǎn)生,新媒體運(yùn)營團(tuán)隊(duì)每天都會(huì)遇到粉絲數(shù)據(jù)、流量數(shù)據(jù)、轉(zhuǎn)化數(shù)據(jù)、下載數(shù)據(jù)等。如果將所有數(shù)據(jù)都進(jìn)行統(tǒng)計(jì)與分析,會(huì)嚴(yán)重影響工作效率,同時(shí)導(dǎo)致大量的資源浪費(fèi)。因此,人們必須有目的、有方法地分析與挖掘數(shù)據(jù),使數(shù)據(jù)展現(xiàn)出真正的價(jià)值。新媒體數(shù)據(jù)分析的過程01明確分析目的和思路在獲取數(shù)據(jù)之前,首先需要根據(jù)數(shù)據(jù)分析的目的篩選出需要采集的目標(biāo)數(shù)據(jù),這是確保整個(gè)數(shù)據(jù)分析過程合理有效的首要條件第1章:緒論02數(shù)據(jù)收集確定好目標(biāo)數(shù)據(jù)以后,依據(jù)確定的目標(biāo)數(shù)據(jù)列表對(duì)目標(biāo)數(shù)據(jù)進(jìn)行有效采集。根據(jù)數(shù)據(jù)采集的難易程度,可以將數(shù)據(jù)采集分為數(shù)據(jù)實(shí)時(shí)采集和數(shù)據(jù)抽樣采集。03數(shù)據(jù)處理數(shù)據(jù)處理是指對(duì)收集到的數(shù)據(jù)進(jìn)行加工、整理,以便開展數(shù)據(jù)分析,它是數(shù)據(jù)分析前必不可少的階段。04數(shù)據(jù)分析數(shù)據(jù)分析是指通過數(shù)據(jù)分析手段、方法和技巧對(duì)準(zhǔn)備好的數(shù)據(jù)進(jìn)行探索、分析,從中發(fā)現(xiàn)因果關(guān)系、內(nèi)部聯(lián)系和業(yè)務(wù)規(guī)律,并提供決策參考。05數(shù)據(jù)展現(xiàn)數(shù)據(jù)展現(xiàn)也可稱數(shù)據(jù)可視化。在一般情況下,數(shù)據(jù)分析的結(jié)果都是通過圖表等方式來展現(xiàn)的。借助數(shù)據(jù)展現(xiàn)手段,能更直觀地讓數(shù)據(jù)分析師表述想要展現(xiàn)的信息、觀點(diǎn)和建議。06數(shù)據(jù)分析報(bào)告最后階段就是撰寫數(shù)據(jù)分析報(bào)告,這是對(duì)整個(gè)數(shù)據(jù)分析成果的匯總和呈現(xiàn)。通過分析報(bào)告,把數(shù)據(jù)分析的目的、過程、結(jié)果及方案完整地呈現(xiàn)出來,為商業(yè)目的提供參考。本章小結(jié)第1章:緒論本章通過介紹數(shù)據(jù)、知識(shí)和信息的定義來引入數(shù)據(jù)分析的概念。數(shù)據(jù)是事實(shí)或觀察的結(jié)果,是對(duì)客觀事物的邏輯歸納,是用于表示客觀事物的未經(jīng)加工的原始素材。知識(shí)是闡述了數(shù)據(jù)分析的定義和作用。數(shù)據(jù)分析是檢查、清理、轉(zhuǎn)換和建模數(shù)據(jù)的過程,其目的是發(fā)現(xiàn)有用的信息,提供結(jié)論并支持決策。通過數(shù)據(jù)分析,我們能夠進(jìn)行現(xiàn)狀分析、原因分析和預(yù)測分析。新媒體數(shù)據(jù)分析主要由五個(gè)步驟組成:明確分析目的和思路、數(shù)據(jù)收集、數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)展現(xiàn)和數(shù)據(jù)分析報(bào)告。本章內(nèi)容結(jié)束!Endofthischapter!新媒體數(shù)據(jù)分析與應(yīng)用新媒體數(shù)據(jù)分析與應(yīng)用第2章:新媒體數(shù)據(jù)分析指標(biāo)Chapter2:NewMediaDataAnalysisIndex本章提綱CONTENTS新媒體數(shù)據(jù)指標(biāo)體系01數(shù)據(jù)運(yùn)營維度02用戶增長維度——以微信公眾號(hào)為例03用戶屬性與互動(dòng)度——以微信公眾號(hào)為例04圖文維度——以微信公眾號(hào)為例05用戶互動(dòng)維度——以微信公眾號(hào)為例0601用數(shù)據(jù)分析來實(shí)現(xiàn)新媒體運(yùn)營工作的日常優(yōu)化和迭代,其前提是搭建指標(biāo)體系,做好數(shù)據(jù)采集和監(jiān)控工作,其中第一步就是梳理業(yè)務(wù)流程,搭建影響關(guān)鍵指標(biāo)的數(shù)據(jù)模型。新媒體數(shù)據(jù)指標(biāo)體系第2章:新媒體數(shù)據(jù)分析指標(biāo)轉(zhuǎn)化指標(biāo)轉(zhuǎn)化次數(shù)傳播指標(biāo)K因子、邀請(qǐng)率、邀請(qǐng)接受率、傳播周期拉新指標(biāo)瀏覽量、下載量、新增用戶、獲取成本等活躍指標(biāo)活躍用戶數(shù)、活躍率、在線時(shí)長、啟動(dòng)次數(shù)、頁面瀏覽量等留存指標(biāo)留存率、留存系數(shù)、留存存活率等Acquisition拉新用戶Activation活躍用戶Retention留存用戶Revenue獲取收入Refer傳播第2章:新媒體數(shù)據(jù)分析指標(biāo)2.1新媒體數(shù)據(jù)指標(biāo)體系2.1.1拉新指標(biāo)

拉新指標(biāo)是獲取新用戶時(shí)最重要的指標(biāo)。拉新的過程主要為:新媒體運(yùn)營人員進(jìn)行渠道投放后,用戶接觸到產(chǎn)品后進(jìn)行下載,最終注冊(cè)成為新用戶。(1)瀏覽量。

瀏覽量也稱曝光量,是指產(chǎn)品的推廣信息在社交媒體、搜索引擎、應(yīng)用商店等渠道中被多少用戶看到。與瀏覽量相對(duì)應(yīng)的是單擊量,單擊量與瀏覽量之比稱為單擊通過率CTR(CTR=單擊量/瀏覽量),很多廣告平臺(tái)會(huì)用CTR來評(píng)估廣告質(zhì)量。(2)下載量。

下載量指的是某個(gè)產(chǎn)品的下載次數(shù),是衡量拉新效果的結(jié)果指標(biāo)。(3)新增用戶。

新增用戶是指下載并成功注冊(cè)的用戶。單純下載下來并不意味著就是新用戶,如果沒有注冊(cè),那么只能算是一個(gè)無效用戶。對(duì)于新用戶的界定,每個(gè)產(chǎn)品是不一樣的,大部分的產(chǎn)品是用戶注冊(cè)了App就被定義為新用戶。(4)獲取成本。

獲取新用戶必然是要花費(fèi)一定成本的,而這是最容易被忽略的。目前常見的成本的計(jì)算方式有CPM(CostPerMill,千次曝光成本,每展現(xiàn)給1000個(gè)人所花費(fèi)的成本)、CPC(CostPerClick,單次單擊成本,每單擊一次所花費(fèi)的成本)、CPA(CostPerAction,單次獲客成本,每獲取一個(gè)新用戶所花費(fèi)的成本)。第2章:新媒體數(shù)據(jù)分析指標(biāo)2.1新媒體數(shù)據(jù)指標(biāo)體系2.1.2活躍指標(biāo)當(dāng)獲取了新用戶后,接下來關(guān)心這些新用戶是否在使用產(chǎn)品,以及他們是否活躍的問題。(1)活躍用戶數(shù)。

活躍用戶數(shù)所查看的指標(biāo)主要是DAU(DailyActiveUser,每日活躍用戶數(shù)),指的是在24小時(shí)內(nèi)活躍用戶的總量。與其對(duì)應(yīng)的還有WAU(WeeklyActiveUser)、MAU(MonthlyActiveUser)等。(2)活躍率。

活躍用戶數(shù)衡量的是產(chǎn)品的市場體量,而活躍率衡量的則是產(chǎn)品的健康。(3)在線時(shí)長。

通過在線時(shí)長可以分析出用戶的粘性。但需要注意的是,不同產(chǎn)品類型的訪問時(shí)長不同,社交類產(chǎn)品的用戶在線時(shí)長通常會(huì)長于工具類產(chǎn)品的用戶在線時(shí)長,內(nèi)容平臺(tái)類產(chǎn)品的用戶在線時(shí)長通常會(huì)長于金融理財(cái)類產(chǎn)品的用戶在線時(shí)長等。(4)啟動(dòng)次數(shù)。

啟動(dòng)次數(shù)體現(xiàn)了用戶的使用頻率。用戶的日均啟動(dòng)次數(shù)越多,說明用戶對(duì)產(chǎn)品的依賴性越高,活躍度也就越好。(5)頁面瀏覽量。

頁面瀏覽量主要分為PV和UV兩個(gè)指標(biāo)。PV(PageView)是頁面瀏覽量,UV(UniqueVisitor)是一定時(shí)間內(nèi)訪問網(wǎng)頁的人數(shù),用戶在網(wǎng)頁的一次訪問請(qǐng)求可以看作1個(gè)PV,用戶看了10個(gè)網(wǎng)頁,則PV為10。

第2章:新媒體數(shù)據(jù)分析指標(biāo)2.1新媒體數(shù)據(jù)指標(biāo)體系2.1.3留存指標(biāo)留存指的是在一批新增用戶中,在指定的時(shí)間段內(nèi)沒有卸載App的用戶。新增、卸載、留存的關(guān)系可用如下關(guān)系式表達(dá):新增=卸載+留存(1)留存率。

留存率表示留存的好壞,常用的留存率指標(biāo)有:24小時(shí)留存率、次日留存率、7日留存率、15日留存率、30日留存率。

24小時(shí)留存率表示:一批新增用戶中,從首次打開示例App的時(shí)刻算起,24小時(shí)過后,依然能被數(shù)據(jù)統(tǒng)計(jì)平臺(tái)統(tǒng)計(jì)到用戶數(shù)量占據(jù)新增用戶數(shù)量的百分比。例如,第一天的新增用戶為100個(gè)人,這100個(gè)人里面,在安裝了24小時(shí)之后,還能被統(tǒng)計(jì)平臺(tái)統(tǒng)計(jì)到30個(gè)人,那么這批新增用戶的24小時(shí)留存率為30%。次日留存率則表示:第一天的新增用戶中,在第二天依然能被數(shù)據(jù)統(tǒng)計(jì)平臺(tái)統(tǒng)計(jì)到的用戶。例如,第一天的新增用戶為100個(gè)人,如果過了第一天24點(diǎn),還剩下50個(gè)人,那么次日留存率為50%。第2章:新媒體數(shù)據(jù)分析指標(biāo)2.1新媒體數(shù)據(jù)指標(biāo)體系2.1.3留存指標(biāo)(2)留存系數(shù)。

留存系數(shù)指的是對(duì)已有App的留存率進(jìn)行積分運(yùn)算,得到一個(gè)比較穩(wěn)定的積分公式。有了留存系數(shù),人們只需要知道第一天的留存率,就能大概預(yù)測出未來幾天示例App的留存情況。

右圖是某產(chǎn)品留存率示意圖。

第2章:新媒體數(shù)據(jù)分析指標(biāo)2.1新媒體數(shù)據(jù)指標(biāo)體系2.1.3留存指標(biāo)(3)留存存活率。

留存存活率指的是一批新增用戶中,留存的用戶中的(這里特指沒有卸載的用戶)活躍用戶的占比,留存存活率主要用于衡量示例App的存活能力。

簡單來說,每款A(yù)pp都希望被用戶一直使用,但是,現(xiàn)在手機(jī)對(duì)于App的管理越來越嚴(yán)苛,一旦示例App放入后臺(tái),那么其存活的可能性就變得極低。在這種情況下,如何保證App的存活率就成了一件十分頭疼的事情。留存存活率可用如下公式表示:留存存活率=活躍÷(新增-卸載)

第2章:新媒體數(shù)據(jù)分析指標(biāo)2.1新媒體數(shù)據(jù)指標(biāo)體系2.1.4轉(zhuǎn)化指標(biāo)(1)轉(zhuǎn)化次數(shù)。

轉(zhuǎn)化次數(shù)是指訪客到達(dá)轉(zhuǎn)化目標(biāo)網(wǎng)頁或指完成了站長所期望完成動(dòng)作的次數(shù),比如撥打了熱線電話組件,或者點(diǎn)開了咨詢按鈕組件。(2)轉(zhuǎn)化率。

轉(zhuǎn)化率是指用戶進(jìn)行了相應(yīng)的行動(dòng)的訪問次數(shù)與總訪問次數(shù)的比率,這里所指的相應(yīng)的行動(dòng)可以是用戶購買、用戶登錄、用戶注冊(cè)、用戶訂閱、用戶下載等一系列用戶行為。轉(zhuǎn)化率的計(jì)算公式為:轉(zhuǎn)化率=轉(zhuǎn)化次數(shù)÷訪問次數(shù)以用戶登錄為例,如果每十次訪問中,就有一個(gè)登錄網(wǎng)站,那么此網(wǎng)站的登錄轉(zhuǎn)化率就為10%,通常網(wǎng)站轉(zhuǎn)化率的數(shù)據(jù)可以通過日志文件和流量統(tǒng)計(jì)分析系統(tǒng)獲得。轉(zhuǎn)化率的數(shù)值越高,說明越多的訪次完成了網(wǎng)站運(yùn)營人員希望訪客進(jìn)行的操作。

第2章:新媒體數(shù)據(jù)分析指標(biāo)2.1新媒體數(shù)據(jù)指標(biāo)體系2.1.5傳播指標(biāo)(1)K因子。K因子也被稱為病毒系數(shù),用來衡量推薦的效果,即一個(gè)發(fā)起推薦的用戶可以帶來多少新用戶。K因子的計(jì)算公式:K因子=發(fā)起邀請(qǐng)的用戶數(shù)×轉(zhuǎn)化率

例如,發(fā)起邀請(qǐng)的用戶數(shù)為3,轉(zhuǎn)化率為30%,則K=3×0.3=0.9,也就是說一個(gè)發(fā)起邀請(qǐng)的用戶最終可以帶來0.9個(gè)用戶。(2)邀請(qǐng)率和邀請(qǐng)接受率。

邀請(qǐng)率是指收到邀請(qǐng)信息的用戶數(shù)占全部用戶的百分比,而邀請(qǐng)接受率是成功接受邀請(qǐng)的用戶數(shù)占收到邀請(qǐng)信息的用戶數(shù)的百分比,計(jì)算公式為:邀請(qǐng)率=邀請(qǐng)次數(shù)÷總用戶數(shù)邀請(qǐng)接受率=接受次數(shù)÷邀請(qǐng)次數(shù)(3)傳播周期。

傳播周期是指用戶完成從傳播到轉(zhuǎn)化新用戶所需要的時(shí)間,一般用來衡量傳播的速度。

02數(shù)據(jù)運(yùn)營維度用戶數(shù)據(jù)用戶數(shù)據(jù)是反應(yīng)用戶屬性和用戶相關(guān)的數(shù)據(jù)圖文數(shù)據(jù)新媒體平臺(tái)自帶的圖文數(shù)據(jù)通常被稱為基礎(chǔ)圖文指標(biāo),這是運(yùn)營人員必看的數(shù)據(jù)。競品數(shù)據(jù)競品就是競爭對(duì)手的產(chǎn)品。競品數(shù)據(jù)就是競爭對(duì)手產(chǎn)品的相關(guān)數(shù)據(jù)。行業(yè)數(shù)據(jù)不同的行業(yè)往往有不同的數(shù)據(jù)指標(biāo)。行業(yè)數(shù)據(jù)能幫助運(yùn)營人員了解市場格局和行業(yè)變化,制訂適宜的運(yùn)營策略。第2章:新媒體數(shù)據(jù)分析指標(biāo)第2章:新媒體數(shù)據(jù)分析指標(biāo)2.2數(shù)據(jù)運(yùn)營維度2.2.1用戶數(shù)據(jù)用戶數(shù)據(jù)是反應(yīng)用戶屬性和用戶相關(guān)的數(shù)據(jù)。雖然用戶數(shù)據(jù)定義很簡潔,但其并不簡單,用戶數(shù)據(jù)包含及可深挖的內(nèi)容很多。從小的方面來講,用戶數(shù)據(jù)包含日活和月活等,再大的方面包含從用戶畫像、用戶屬性、用戶層級(jí)到用戶心理、用戶行為習(xí)慣等。這一切都需要有用戶數(shù)據(jù)的支持。當(dāng)然,根據(jù)產(chǎn)品特性的不同,人們要了解用戶的深度和側(cè)重點(diǎn)都有所不同,例如電商更側(cè)重于用戶的喜好、年齡及購買力等,金融類更側(cè)重于用戶的信用、工作信息、財(cái)務(wù)信息等。2.2.2圖文數(shù)據(jù)新媒體平臺(tái)自帶的圖文數(shù)據(jù)通常被稱為基礎(chǔ)圖文指標(biāo),這是運(yùn)營人員必看的數(shù)據(jù)。例如,通過它們,運(yùn)營人員可以知道每篇公眾號(hào)圖文的送達(dá)人數(shù)、閱讀人數(shù)、轉(zhuǎn)發(fā)人數(shù)。以微信公眾號(hào)為例,公眾號(hào)基礎(chǔ)圖文指標(biāo)主要包含單篇圖文閱讀數(shù)據(jù)、單篇圖文傳播數(shù)據(jù)和多篇圖文閱讀數(shù)據(jù)。第2章:新媒體數(shù)據(jù)分析指標(biāo)2.2數(shù)據(jù)運(yùn)營維度2.2.3競品數(shù)據(jù)競品就是競爭對(duì)手的產(chǎn)品。競品數(shù)據(jù)就是競爭對(duì)手產(chǎn)品的相關(guān)數(shù)據(jù)。競品分析基于“如何更好地滿足用戶需求”,通過對(duì)比自家產(chǎn)品和競爭產(chǎn)品在各個(gè)維度上的指標(biāo),明確自身的優(yōu)勢、劣勢、機(jī)會(huì)和威脅,為產(chǎn)品設(shè)計(jì)、運(yùn)營活動(dòng)、戰(zhàn)略規(guī)劃等提供市場參考和行動(dòng)建議。競品數(shù)據(jù)主要包含以下幾個(gè)方面的內(nèi)容。(1)企業(yè)信息。

企業(yè)信息指的是競爭對(duì)手的公司技術(shù)、市場、產(chǎn)品、運(yùn)營團(tuán)隊(duì)規(guī)模、核心目標(biāo)、產(chǎn)品定位和行業(yè)品牌影響力,實(shí)際季度年度盈利數(shù)值,各條產(chǎn)品線資金重點(diǎn)投入信息,占據(jù)公司主盈利的產(chǎn)品線等。(2)產(chǎn)品信息。

產(chǎn)品信息指的是競品版本發(fā)布的情況,產(chǎn)品功能細(xì)分和對(duì)比,產(chǎn)品的穩(wěn)定性、易用性、用戶體驗(yàn)交互、視覺設(shè)計(jì)實(shí)力、技術(shù)實(shí)現(xiàn)框架優(yōu)劣勢等。(3)運(yùn)營信息。

運(yùn)營信息指的是競品用戶群體覆蓋及市場占有率,競品運(yùn)營策略、盈利模式等。在新媒體運(yùn)營過程中,除了分析自身數(shù)據(jù),對(duì)競品的數(shù)據(jù)觀測和分析也是一項(xiàng)很重要的工作。做好競品數(shù)據(jù)分析可以更客觀地評(píng)估自身運(yùn)營狀況,也可以從中發(fā)現(xiàn)新的機(jī)會(huì)。

第2章:新媒體數(shù)據(jù)分析指標(biāo)2.2數(shù)據(jù)運(yùn)營維度2.2.4行業(yè)數(shù)據(jù)不同的行業(yè)往往有不同的數(shù)據(jù)指標(biāo)。(1)互聯(lián)網(wǎng)行業(yè)?;ヂ?lián)網(wǎng)行業(yè)主要按照產(chǎn)品生命周期來劃分,在拉新階段有成本指標(biāo)、策略指標(biāo)等;在活躍階段需要關(guān)注周期性的活躍用戶數(shù)、產(chǎn)品使用時(shí)長等指標(biāo);在留存階段,如何讓用戶持續(xù)活躍、提高用戶粘性,或者將已經(jīng)流失的老用戶重新召回成使用用戶,所以留存率、流失率和召回率是這個(gè)階段需要重點(diǎn)關(guān)注的;在轉(zhuǎn)化階段,用戶開始貢獻(xiàn)商業(yè)價(jià)值,不同產(chǎn)品的轉(zhuǎn)化目標(biāo)不同;最后在傳播階段需要關(guān)注老用戶傳播推薦產(chǎn)品、帶來新用戶的過程。(2)在線教育行業(yè)。在線教育行業(yè)的分析指標(biāo)在流程上可以按照:拉新獲課—付費(fèi)—續(xù)費(fèi)復(fù)購的過程來分析,其重點(diǎn)在于提高轉(zhuǎn)化率,降低投產(chǎn)比,同時(shí)對(duì)學(xué)員、課程進(jìn)行分析,打造出符合用戶需求,受用戶歡迎的課程產(chǎn)品與組合。(3)零售行業(yè)。零售行業(yè)主要分為三個(gè)方面:人、貨和場。這里的人指的是兩個(gè)方面,一是企業(yè)員工,二是消費(fèi)者。在這個(gè)消費(fèi)者掌握主動(dòng)權(quán)的時(shí)代,想要做好零售,除了加強(qiáng)員工管理,提升人員效率,更重要的是提高消費(fèi)者忠誠度。貨就是指商品,商品數(shù)據(jù)分析的核心就是圍繞進(jìn)銷存展開的,其重點(diǎn)就是對(duì)商品結(jié)構(gòu)的分析和商品消化跟進(jìn)分析。場就是消費(fèi)場景,所有連接消費(fèi)者和商品的終端,就是場,例如線下門店、線上的購物網(wǎng)站、APP、小程序等。03用戶增長維度——以微信公眾號(hào)為例第2章:新媒體數(shù)據(jù)分析指標(biāo)2.3用戶增長維度—以微信公眾號(hào)為例以微信公眾平臺(tái)為例,可以在微信公眾號(hào)后臺(tái)查看昨天的關(guān)注人數(shù)變化,以及與前天、7天前、30天前的關(guān)注人數(shù)進(jìn)行對(duì)比,體現(xiàn)為日、周、月的百分比變化,如圖所示。對(duì)運(yùn)營人員來說,其優(yōu)先需要關(guān)注的指標(biāo)是“新關(guān)注人數(shù)”,它是賬號(hào)拉新能力的體現(xiàn)。如果某天發(fā)現(xiàn)“新關(guān)注人數(shù)”相比平時(shí)的數(shù)據(jù)有明顯上升,要么說明上一篇文章內(nèi)容受到用戶的歡迎,要么說明某項(xiàng)推廣起作用了,這樣就可以多準(zhǔn)備一些與之相關(guān)的內(nèi)容。2.3.1核心數(shù)據(jù)指標(biāo)第2章:新媒體數(shù)據(jù)分析指標(biāo)2.3用戶增長維度—以微信公眾號(hào)為例除了查看當(dāng)前數(shù)據(jù),運(yùn)營人員還可以針對(duì)新關(guān)注人數(shù)、取消關(guān)注人數(shù)、凈增關(guān)注人數(shù)、累積關(guān)注人數(shù)進(jìn)行趨勢分析。在微信公眾號(hào)后臺(tái),趨勢分析可選擇的時(shí)間周期為7天、14天、30天或365天之內(nèi)某個(gè)時(shí)間段的關(guān)注人數(shù)變化,圖所示為某微信公眾號(hào)2020-10-21至2020-11-19的新關(guān)注人數(shù)變化。2.3.2關(guān)鍵指標(biāo)趨勢圖第2章:新媒體數(shù)據(jù)分析指標(biāo)2.3用戶增長維度—以微信公眾號(hào)為例如果要將上個(gè)月與這個(gè)月用戶的增長情況進(jìn)行對(duì)比分析,則可以選擇按時(shí)間進(jìn)行單月的數(shù)據(jù)對(duì)比分析,如右圖所示。如果對(duì)比后發(fā)現(xiàn)自己的賬號(hào)“漲粉”數(shù)比上個(gè)月同期的“漲粉”數(shù)少,那就需要尋找原因。2.3.2關(guān)鍵指標(biāo)趨勢圖第2章:新媒體數(shù)據(jù)分析指標(biāo)2.3.3新增關(guān)注來源分析新增關(guān)注來源是大部分?jǐn)?shù)據(jù)分析人員很容易忽略的數(shù)據(jù),它的研究價(jià)值在于了解目前哪個(gè)推廣方式的效果更好搜一搜如果有40%的關(guān)注量來自公眾號(hào)搜索,則說明這類公眾號(hào)已經(jīng)有一定的品牌知名度,定位也相對(duì)垂直,或者是在廣告宣傳方面做得比較到位。掃描二維碼這是十分常見的關(guān)注方式,用戶通過掃描二維碼關(guān)注主要分為線上和線下兩種場景。圖文頁右上角菜單用戶在閱讀文章的界面,選擇右上角菜單中的“查看公眾號(hào)”,即可進(jìn)入公眾號(hào)主頁進(jìn)行關(guān)注。圖文頁內(nèi)公眾號(hào)名稱用戶通過文章標(biāo)題下方的藍(lán)色字體進(jìn)行關(guān)注也是一種較為常見的關(guān)注方式,很多公眾號(hào)也會(huì)在文章開頭提示用戶通過此方式來關(guān)注公眾號(hào)。名片分享名片分享一般是用戶主動(dòng)將公眾號(hào)推薦給朋友或分享到群,如果通過這個(gè)方式帶來了新增用戶,則說明公眾號(hào)質(zhì)量很不錯(cuò)。支付后關(guān)注用戶通過支付后關(guān)注的公眾號(hào)必須認(rèn)證過,并且開通了微信支付功能。用戶通過微信付款后會(huì)默認(rèn)關(guān)注該公眾號(hào)。04用戶屬性與互動(dòng)維度——以微信公眾號(hào)為例很多新媒體平臺(tái)的數(shù)據(jù)分析后臺(tái)會(huì)包括用戶屬性數(shù)據(jù)。用戶屬性數(shù)據(jù)是指對(duì)用戶按照性別、年齡、城市等不同屬性進(jìn)行劃分,通過了解用戶屬性,運(yùn)營人員可以更有針對(duì)性地、更好地為用戶提供內(nèi)容和服務(wù)。第2章:新媒體數(shù)據(jù)分析指標(biāo)人口特征人口特征包括性別分布、年齡分布和地區(qū)分布等。運(yùn)營人員可以根據(jù)這些數(shù)據(jù)對(duì)文章的風(fēng)格進(jìn)行調(diào)整。例如,在中年男性用戶占比較大的情況下,通常不適合討論與美妝、時(shí)尚相關(guān)的話題,或者也不適合使用可愛的語言風(fēng)格。下圖分別為某平臺(tái)粉絲管理中心的粉絲性別、粉絲年齡分布。第2章:新媒體數(shù)據(jù)分析指標(biāo)地域歸屬這塊數(shù)據(jù)的參考價(jià)值較大,運(yùn)營人員可以非常清晰地知道自己的關(guān)注用戶在各個(gè)城市的分布情況,依據(jù)此數(shù)據(jù)可以做一些關(guān)鍵的決策。右圖是微信公眾號(hào)關(guān)注用戶省(直轄市)級(jí)分布表。訪問設(shè)備同樣的標(biāo)題和封面在不同訪問設(shè)備上顯示的效果是不一樣的。例如,某個(gè)公眾號(hào)通過公眾號(hào)機(jī)型終端分布,發(fā)現(xiàn)使用蘋果設(shè)備的用戶最多,那么整個(gè)圖文的排版、封面尺寸的選擇、標(biāo)題的長度都需要優(yōu)先調(diào)整到蘋果設(shè)備用戶閱讀體驗(yàn)最滿意的狀態(tài)。下圖微信公眾號(hào)關(guān)注用戶終端分布。05圖文維度——以微信公眾號(hào)為例新媒體平臺(tái)上每一篇圖文內(nèi)容的數(shù)據(jù)情況稱為基礎(chǔ)圖文指標(biāo),這是新媒體運(yùn)營中必須參考的數(shù)據(jù)。通過它們,運(yùn)營人員可以知道每篇圖文的送達(dá)人數(shù)、閱讀人數(shù)、轉(zhuǎn)發(fā)人數(shù)等。第2章:新媒體數(shù)據(jù)分析指標(biāo)2.5.1單篇圖文數(shù)據(jù)單篇圖文數(shù)據(jù)分析是對(duì)單次推送的圖文數(shù)據(jù)進(jìn)行分析的,如下圖所示。對(duì)于已群發(fā)的內(nèi)容,新媒體數(shù)據(jù)運(yùn)營人員可以看到群發(fā)后7天的基礎(chǔ)數(shù)據(jù)。閱讀次數(shù):單擊圖文頁去重人數(shù),包括非粉絲,具體閱讀來源包括公眾號(hào)會(huì)話、朋友圈、好友轉(zhuǎn)發(fā)、歷史消息等。分享次數(shù):轉(zhuǎn)發(fā)或分享至好友、朋友圈、微博的去重用戶數(shù),包括非粉絲的分享。第2章:新媒體數(shù)據(jù)分析指標(biāo)2.5.1單篇圖文數(shù)據(jù)單擊單篇內(nèi)容右側(cè)的“詳情”,還可以查看送達(dá)轉(zhuǎn)化、分享轉(zhuǎn)化、數(shù)據(jù)趨勢、閱讀完成情況及用戶頭像。(1)送達(dá)轉(zhuǎn)化。送達(dá)轉(zhuǎn)化俗稱“打開率”,其公式為:送達(dá)轉(zhuǎn)化=公眾號(hào)消息閱讀次數(shù)÷送達(dá)人數(shù)(2)分享轉(zhuǎn)化。分享轉(zhuǎn)化包含兩個(gè):一個(gè)是首次分享次數(shù)與公眾號(hào)消息閱讀次數(shù)之比,這個(gè)數(shù)值代表了這篇文章的首次分享率;另一個(gè)是分享產(chǎn)生的閱讀次數(shù)與總分享次數(shù)之比,這數(shù)值體現(xiàn)了用戶分享帶來了多少閱讀量,其中閱讀來源包括好友會(huì)話、群聊、朋友圈、朋友在看等。第2章:新媒體數(shù)據(jù)分析指標(biāo)2.5.1單篇圖文數(shù)據(jù)單擊單篇內(nèi)容右側(cè)的“詳情”,還可以查看送達(dá)轉(zhuǎn)化、分享轉(zhuǎn)化、數(shù)據(jù)趨勢、閱讀完成情況及用戶頭像。(3)數(shù)據(jù)趨勢。數(shù)據(jù)趨勢包括該文章在不同傳播渠道中的圖文閱讀情況(閱讀的人數(shù)和次數(shù))和圖文分享情況(轉(zhuǎn)發(fā)或分享到好友會(huì)話、群聊、朋友圈及選擇朋友在看的人數(shù)及次數(shù))(4)閱讀完成情況。在單篇文章的閱讀完成情況里,文章被分為20等份,每5%為一個(gè)錨點(diǎn),可以看到用戶在每個(gè)錨點(diǎn)位置的跳出比例(5)用戶畫像。用戶畫像包括性別分布、年齡分布和地域分布,可以對(duì)照賬號(hào)的用戶畫像來查看第2章:新媒體數(shù)據(jù)分析指標(biāo)2.5.1單篇圖文數(shù)據(jù)單擊單篇內(nèi)容右側(cè)的“詳情”,還可以查看送達(dá)轉(zhuǎn)化、分享轉(zhuǎn)化、數(shù)據(jù)趨勢、閱讀完成情況及用戶頭像。(3)數(shù)據(jù)趨勢。數(shù)據(jù)趨勢包括該文章在不同傳播渠道中的圖文閱讀情況(閱讀的人數(shù)和次數(shù))和圖文分享情況(轉(zhuǎn)發(fā)或分享到好友會(huì)話、群聊、朋友圈及選擇朋友在看的人數(shù)及次數(shù))(4)閱讀完成情況。在單篇文章的閱讀完成情況里,文章被分為20等份,每5%為一個(gè)錨點(diǎn),可以看到用戶在每個(gè)錨點(diǎn)位置的跳出比例(5)用戶畫像。用戶畫像包括性別分布、年齡分布和地域分布,可以對(duì)照賬號(hào)的用戶畫像來查看第2章:新媒體數(shù)據(jù)分析指標(biāo)2.5.2全部圖文數(shù)據(jù)全部圖文數(shù)據(jù)是對(duì)公眾號(hào)整體內(nèi)容質(zhì)量的分析,是指該公眾號(hào)發(fā)出去的所閱圖文在某時(shí)間段的閱讀數(shù)據(jù)的總和。全部圖文數(shù)據(jù)主要包含4個(gè)核心數(shù)據(jù)段:圖文閱讀次數(shù)、原文閱讀次數(shù)、分享轉(zhuǎn)發(fā)次數(shù)、微信收藏人數(shù)。(1)圖文閱讀次數(shù):所有圖文在某個(gè)時(shí)間段的閱讀次數(shù)。(2)原文閱讀次數(shù):用戶單擊一篇文章左下角“閱讀原文”的次數(shù),這個(gè)數(shù)據(jù)很考驗(yàn)用戶的黏性,以及本篇文章的內(nèi)容質(zhì)量。(3)分享轉(zhuǎn)發(fā)次數(shù):所有圖文在某個(gè)時(shí)間段的分享次數(shù)。(4)微信收藏人數(shù):所有圖文在某個(gè)時(shí)間段的收藏人數(shù)(去重且包括非粉絲)。06用戶互動(dòng)維度——以微信公眾號(hào)為例用戶互動(dòng)數(shù)據(jù)是指用戶對(duì)內(nèi)容的點(diǎn)贊、留言等互動(dòng)情況,是衡量用戶黏性的重要數(shù)據(jù)。以微信公眾號(hào)為例,用戶常見的操作行為包括兩類,一類是基于某篇圖文的留言、點(diǎn)贊、贊賞,另一類是基于公眾號(hào)收到的用戶消息。第2章:新媒體數(shù)據(jù)分析指標(biāo)2.6.1留言點(diǎn)贊運(yùn)營人員可以用留言或點(diǎn)贊與閱讀量的比值來衡量用戶對(duì)該篇文章的互動(dòng)情況,該比值越高,用戶對(duì)該篇文章互動(dòng)越明顯。通過橫向比較不同文章之間的留言點(diǎn)贊情況,運(yùn)營人員可以得知哪些內(nèi)容是用戶愿意發(fā)表意見的,哪些內(nèi)容是用戶不太感興趣的。對(duì)于互動(dòng)效果好的內(nèi)容類型,運(yùn)營人員可以多策劃這方面的文章,來提升用戶黏性。2.6.2用戶消息運(yùn)營人員為了引導(dǎo)用戶互動(dòng)和關(guān)注,經(jīng)常會(huì)策劃一些送福利的活動(dòng),例如,在微信公眾號(hào)中運(yùn)營人員常用的方法是設(shè)置關(guān)鍵詞自動(dòng)回復(fù),如果用戶想要知道這次活動(dòng)的參與情況,就必須關(guān)注公眾號(hào)消息數(shù)據(jù)指標(biāo)。在微信公眾平臺(tái)和統(tǒng)計(jì)消息分析,可查看用戶在公眾號(hào)的互動(dòng)情況。通過選擇小時(shí)報(bào)、日?qǐng)?bào)、周報(bào)或月報(bào),運(yùn)營人員可以查看相應(yīng)時(shí)間內(nèi)的消息發(fā)送人數(shù)、消息發(fā)送次數(shù)及人均發(fā)送次數(shù)。本章小結(jié)本章從新媒體數(shù)據(jù)分析指標(biāo)方面,系統(tǒng)的闡述了新媒體數(shù)據(jù)指標(biāo)體系和用戶運(yùn)營唯獨(dú)的各項(xiàng)數(shù)據(jù)指標(biāo)。我們?cè)谧鲂旅襟w數(shù)據(jù)分析和新媒體運(yùn)營工作前,搭建好所需要的指標(biāo)體系非常重要,這不僅對(duì)后續(xù)數(shù)據(jù)處理和統(tǒng)計(jì)提供了標(biāo)準(zhǔn),也為數(shù)據(jù)評(píng)價(jià)搭建了評(píng)價(jià)指標(biāo)。對(duì)于新媒體數(shù)據(jù)運(yùn)營,需要查看如下幾個(gè)緯度的數(shù)據(jù):用戶數(shù)據(jù)、圖文數(shù)據(jù)、競品數(shù)據(jù)、行業(yè)數(shù)據(jù)。第2章:新媒體數(shù)據(jù)分析指標(biāo)本章內(nèi)容結(jié)束!Endofthischapter!新媒體數(shù)據(jù)分析與應(yīng)用新媒體數(shù)據(jù)分析與應(yīng)用第3章:新媒體數(shù)據(jù)的準(zhǔn)備本章提綱CONTENTS新媒體的數(shù)據(jù)來源01理解數(shù)據(jù)023.1新媒體的數(shù)據(jù)來源第3章:新媒體的數(shù)據(jù)來源

3.1.1新媒體數(shù)據(jù)類型朋友圈一般指的是微信上的一個(gè)社交功能,用戶可以通過朋友圈發(fā)表文字和圖片,同時(shí)可通過其他軟件將文章或音樂分享到朋友圈。用戶可以對(duì)好友新發(fā)布的內(nèi)容或照片進(jìn)行“評(píng)論”或“點(diǎn)贊”,其他用戶只能看到相同好友的評(píng)論或點(diǎn)贊。用此作為主要推廣平臺(tái)的新媒體團(tuán)隊(duì),也可借助新媒體的東風(fēng),拓寬了他們的營銷思路,借助“社群運(yùn)營+朋友圈運(yùn)營”的雙重新模式來進(jìn)行品牌的宣傳、產(chǎn)品的推廣、知名度的提升、營銷利潤的增加。右圖是微商借助朋友圈出售產(chǎn)品的截圖。1.微信朋友圈數(shù)據(jù)第3章:新媒體的數(shù)據(jù)來源

3.1.1新媒體數(shù)據(jù)類型與朋友圈數(shù)據(jù)相對(duì)應(yīng)的是微信公眾號(hào)數(shù)據(jù),該數(shù)據(jù)對(duì)微信公眾號(hào)的運(yùn)營與產(chǎn)品、品牌下一步的發(fā)展都有很強(qiáng)的借鑒分析作用。利用公眾號(hào)平臺(tái)進(jìn)行自媒體活動(dòng),簡單來說就是進(jìn)行一對(duì)多的媒體行為活動(dòng)。通過變換風(fēng)格內(nèi)容并分析閱讀數(shù)據(jù),運(yùn)營人員可以分析出粉絲的閱讀喜好與偏好;通過分析后臺(tái)粉絲數(shù)量的增減,運(yùn)營人員可以分析前一階段的宣傳與推廣,是否真的起到了積極正面的作用。微信公眾號(hào)數(shù)據(jù)自身自有的計(jì)算渠道,運(yùn)營人員能夠很直觀地了解當(dāng)天的運(yùn)營狀況,包含新增重視數(shù)、撤銷重視數(shù)、單篇文章閱覽量、悉數(shù)圖文閱覽量,甚至還能夠挑選時(shí)間階段進(jìn)行計(jì)算。右圖是某商家利用公眾號(hào)來出售產(chǎn)品的真實(shí)截圖,圖中公眾號(hào)名稱和認(rèn)證地址略去。2.微信公眾號(hào)數(shù)據(jù)第3章:新媒體的數(shù)據(jù)來源

3.1.1新媒體數(shù)據(jù)類型微博是指一種基于用戶關(guān)系信息分享、傳播及獲取通過關(guān)注機(jī)制分享簡短實(shí)時(shí)信息的廣播式的社交媒體和網(wǎng)絡(luò)平臺(tái),允許用戶通過Web、Mail、App、IM、SMS及PC、手機(jī)等多種終端接入,以文字、圖片、視頻等多媒體形式,實(shí)現(xiàn)信息的即時(shí)分享、傳播互動(dòng)。微博作為新型社交媒體的代表,在現(xiàn)代社會(huì)尤其是年輕人中,起到了極強(qiáng)的輿論影響作用。微博熱搜榜(見右圖)更是可以左右部分輿論的風(fēng)向。事實(shí)上,微博作為一種社交平臺(tái),免費(fèi)向大眾開放。無論是個(gè)人還是企業(yè)都能夠在微博后臺(tái)檢查詳細(xì)的微博數(shù)據(jù),其具體方式是登錄網(wǎng)頁版微博后,單擊“管理中心”,進(jìn)入“數(shù)據(jù)助手,了解當(dāng)前的微博數(shù)據(jù)。作為運(yùn)營人員,最常關(guān)注的微博數(shù)據(jù)有閱覽數(shù)、閱覽量、視頻播放量、粉絲來源和粉絲新增及取關(guān)數(shù)等。3.微博數(shù)據(jù)第3章:新媒體的數(shù)據(jù)來源

3.1.1新媒體數(shù)據(jù)類型今日頭條是北京字節(jié)跳動(dòng)科技有限公司開發(fā)的一款基于數(shù)據(jù)挖掘的推薦引擎產(chǎn)品,為用戶推薦信息、提供連接人與信息服務(wù)的產(chǎn)品。今日頭條基于個(gè)性化推薦引擎技術(shù),根據(jù)每個(gè)用戶的興趣、位置等多個(gè)維度進(jìn)行個(gè)性化推薦,推薦內(nèi)容不僅包括狹義上的新聞,還包括音樂、電影、游戲、購物等資訊。根據(jù)用戶的社交行為、閱讀行為、地理位置、職業(yè)、年齡等挖掘出興趣。通過分析用戶的社交行為,今日頭條的推薦系統(tǒng)可以在5秒內(nèi)計(jì)算出用戶興趣;再通過分析用戶行為,用戶每次操作后,10秒內(nèi)更新用戶模型。作為一種新興的內(nèi)容平臺(tái),今日頭條的后臺(tái)具有更加強(qiáng)大的數(shù)據(jù)統(tǒng)計(jì)功能。新媒體運(yùn)營人員及相關(guān)產(chǎn)業(yè)的人,可以借助今日頭條的相關(guān)數(shù)據(jù),對(duì)雙標(biāo)題效果(見右圖)、內(nèi)容、推薦、閱讀、評(píng)論進(jìn)行相關(guān)分析。4.今日頭條數(shù)據(jù)第3章:新媒體的數(shù)據(jù)來源

3.1.1新媒體數(shù)據(jù)類型抖音同樣作為字節(jié)跳動(dòng)的主打產(chǎn)品,與今日頭條的推薦信息有所區(qū)別,今日頭條推薦狹義上的新聞,還包括音樂、電影、游戲、購物等資訊,而抖音則以短視頻為主,是一個(gè)面向全年齡的音樂短視頻社交平臺(tái)。根據(jù)對(duì)抖音平臺(tái)及其經(jīng)營模式的相關(guān)分析,需要關(guān)注的數(shù)據(jù)主要來自以下幾個(gè)方面(見右圖):粉絲數(shù)量、點(diǎn)贊互動(dòng)數(shù)據(jù)、粉絲的年齡性別、個(gè)人認(rèn)證情況等進(jìn)行多維度數(shù)據(jù)查找篩選。可根據(jù)已知的商品關(guān)鍵詞及商品鏈接、品牌等關(guān)鍵詞進(jìn)行查找相關(guān)帶貨達(dá)人??刹榭磶ж涍_(dá)人的視頻帶貨銷量數(shù)據(jù)。5.抖音數(shù)據(jù)第3章:新媒體的數(shù)據(jù)來源

3.1.2網(wǎng)站數(shù)據(jù)網(wǎng)站數(shù)據(jù)分析(見右圖)是通過觀察、調(diào)查、實(shí)驗(yàn)、測量等方式,通過數(shù)據(jù)的顯示形式把網(wǎng)站各方面的情況反映出來,使運(yùn)營人員更加了解網(wǎng)站的運(yùn)營情況,便于調(diào)整網(wǎng)站的運(yùn)營策略。網(wǎng)站數(shù)據(jù)分析是圍繞顧客進(jìn)行的,公司不同部門需要的數(shù)據(jù)不一樣:市場部門想知道哪些廣告能帶來有價(jià)值的客戶;編輯部門想知道用戶喜歡哪些文章;采購部門了解用戶經(jīng)常購買哪些產(chǎn)品等。第3章:新媒體的數(shù)據(jù)來源

3.1.2網(wǎng)站數(shù)據(jù)對(duì)虛擬空間商來說,網(wǎng)站流量是指用戶在訪問網(wǎng)站過程中產(chǎn)生的數(shù)據(jù)量大小。網(wǎng)站流量統(tǒng)計(jì)的主要指標(biāo)包括以下幾個(gè)方面。獨(dú)立訪問者數(shù)量(UniqueVisitors)。重復(fù)訪問者數(shù)量(RepeatVisitors)。頁面瀏覽數(shù)(PageViews)。每個(gè)訪問者的頁面瀏覽數(shù)(PageViewsperuser)。某些具體文件/頁面的統(tǒng)計(jì)指標(biāo),例如頁面顯示次數(shù)、文件下載次數(shù)等。1.網(wǎng)站流量跳出率指用戶通過搜索關(guān)鍵詞來到網(wǎng)站,僅瀏覽了一個(gè)頁面就離開的訪問次數(shù)與所有訪問次數(shù)的百分比。觀察關(guān)鍵詞的跳出率就可以得知用戶對(duì)網(wǎng)站內(nèi)容的認(rèn)可,或者說網(wǎng)站是否對(duì)用戶有吸引力。跳出率的計(jì)算公式如下:跳出率=訪問一個(gè)頁面后離開網(wǎng)站的次數(shù)/總訪問次數(shù)2.跳出率第3章:新媒體的數(shù)據(jù)來源

3.1.2網(wǎng)站數(shù)據(jù)“來路”就是用戶通過什么地址鏈接目標(biāo)網(wǎng)站。例如,某某網(wǎng)頁上有一個(gè)鏈接,其鏈接到了網(wǎng)頁上。當(dāng)訪客單擊網(wǎng)頁上的鏈接,鏈接到了目標(biāo)網(wǎng)頁上,則該網(wǎng)站的來路就是鏈接。最常見的幾種網(wǎng)站來路如下圖所示。3.網(wǎng)站來路第3章:新媒體的數(shù)據(jù)來源

3.1.2網(wǎng)站數(shù)據(jù)網(wǎng)站訪問深度就是用戶在瀏覽某個(gè)網(wǎng)站的過程中瀏覽的該網(wǎng)站的頁數(shù)。如果用戶一次性瀏覽的該網(wǎng)站的頁數(shù)多,那么基本上可以認(rèn)定,該網(wǎng)站有用戶感興趣的東西。用戶訪問網(wǎng)站的深度用數(shù)據(jù)可以理解為網(wǎng)站平均訪問的頁面數(shù),就是PV和UV的比值,這個(gè)比值越大,用戶體驗(yàn)度越好,網(wǎng)站的粘性也越高。在自媒體時(shí)代,提高網(wǎng)站的訪問深度,可以從以下兩個(gè)方面著手:首先,要不斷調(diào)整網(wǎng)站的排版與布局,迎合當(dāng)今時(shí)代的審美需要。網(wǎng)站的結(jié)構(gòu)應(yīng)當(dāng)適應(yīng)該網(wǎng)站的主題,盡可能簡單明了,將預(yù)定的功能設(shè)置明確,迎合簡單明了的時(shí)代主題。其次,對(duì)網(wǎng)站的內(nèi)容也要進(jìn)行不斷調(diào)整。網(wǎng)站的設(shè)計(jì)與板塊處理,作為一種外在因素,只能暫時(shí)吸引用戶,若想真正留住用戶,將其變成潛在客戶或留住原有客戶,還需要有用的信息,用戶可以獲得自己想要的東西。

4.訪問深度第3章:新媒體的數(shù)據(jù)來源

3.1.3爬蟲工具

網(wǎng)絡(luò)爬蟲又稱網(wǎng)頁蜘蛛、網(wǎng)絡(luò)機(jī)器人、網(wǎng)頁追逐者,是一種按照一定的規(guī)則自動(dòng)地抓取互聯(lián)網(wǎng)信息的程序或腳本。

在新媒體時(shí)代,各種信息爆炸式增長。隨著網(wǎng)絡(luò)的迅速發(fā)展,互聯(lián)網(wǎng)成為大量信息的載體,如何有效地提取并利用這些信息成為一個(gè)巨大的挑戰(zhàn)。搜索引擎作為輔助人們檢索信息的工具,成為用戶訪問互聯(lián)網(wǎng)的入口和指南。但是,通用搜索引擎也存在著一定的局限性。針對(duì)搜索引擎的問題與不足,通過爬蟲軟件,一些看似微不足道的數(shù)據(jù)在收集、整理、提取、分析之后會(huì)產(chǎn)生巨大的裨益。

第3章:新媒體的數(shù)據(jù)來源

3.1.3爬蟲工具垂直搜索是指將搜索范圍細(xì)分至某一專業(yè)領(lǐng)域,針對(duì)初次獲取的網(wǎng)頁信息進(jìn)行更深層次的整合,最終形成“純度”更高的專業(yè)領(lǐng)域信息。以采購招標(biāo)信息為主的網(wǎng)站,例如中國采摘網(wǎng)、劍魚,其數(shù)據(jù)就是利用爬蟲從網(wǎng)上的上萬家企事業(yè)單位爬取來的,再經(jīng)過技術(shù)整合后發(fā)布到網(wǎng)站上提供服務(wù)。經(jīng)過這樣的操作,即使一個(gè)新開發(fā)的網(wǎng)站,通過數(shù)據(jù)采集技術(shù)也可以很輕松地填滿所有內(nèi)容,讓其能夠正常運(yùn)營。1.行業(yè)垂直搜索——招標(biāo)信息平臺(tái)大數(shù)據(jù)在個(gè)人金融授信的方面起著重要作用。結(jié)合新媒體的背景,利用爬蟲技術(shù)獲取個(gè)人消費(fèi)信息,進(jìn)行整合分析,為個(gè)人消費(fèi)提供指南。2.金融消費(fèi)——個(gè)人金融授信在信息社會(huì),比別人先一步掌握信息的人是市場的贏家,傳統(tǒng)模式的人工處理顯然是低效率的。借助爬蟲技術(shù),商家在入駐某網(wǎng)站后,系統(tǒng)能自動(dòng)抓取廠商工單,售后管理變得簡單高效。在新媒體平臺(tái)的輔助下,后臺(tái)管理員可以及時(shí)獲取用戶的閱覽、購買信息,及時(shí)處理各項(xiàng)訂單。3.信息鏈接互聯(lián)第3章:新媒體的數(shù)據(jù)來源

3.1.4數(shù)據(jù)收集中常見的問題與解決方案新媒體時(shí)代的信息爆炸,帶來了巨大的信息量,反倒讓信息收集者不知道選取哪些有用的信息。數(shù)據(jù)收集是一件非常煩瑣的事情,一旦出現(xiàn)失誤,就會(huì)浪費(fèi)大量的時(shí)間和精力。收集數(shù)據(jù)時(shí),如果不知道從何處下手,則可以從數(shù)據(jù)使用者的角度出發(fā),把握數(shù)據(jù)分析的切入點(diǎn)。1.不知從何處下手在新媒體的背景下,過量的信息同樣帶來一個(gè)問題,那就是收集的信息可能是無用的,并不能滿足當(dāng)前的目標(biāo)要求。然而在大量的信息中查找有效信息,是無法避免的,因而在一定的范圍內(nèi)查找有用信息,要具有針對(duì)性。雖然信息的種類多種多樣,信息的來源也是多種多樣的,但是只要找到了有針對(duì)性的問題,就可以找到自己所需要的信息。2.收集的信息無用同樣,在新媒體這個(gè)大數(shù)據(jù)時(shí)代,人們獲取信息的渠道增多,獲取的信息量也增多,但是在這個(gè)信息時(shí)代,想要在巨量的信息中將自己所需要的信息完全提取,也不是一件容易的事,沒有將所需要的信息完全采集,就導(dǎo)致數(shù)據(jù)分析結(jié)論不夠真實(shí),缺乏證據(jù)。3.收集的信息不全面3.2理解數(shù)據(jù)第3章:新媒體的數(shù)據(jù)來源

3.2.1字段與記錄數(shù)據(jù)包含字段與記錄,可以從數(shù)據(jù)分析的角度來理解字段和記錄的概念。字段是事物或現(xiàn)象的某種特征。如圖中的“月份”“總篇數(shù)”等都是字段,字段在統(tǒng)計(jì)學(xué)中稱為變量。記錄是事物或現(xiàn)象的具體表現(xiàn)。如圖中的“總篇數(shù)”可以是130或131等,記錄也稱數(shù)據(jù)或變量值。第3章:新媒體的數(shù)據(jù)來源

3.2.2數(shù)據(jù)類型數(shù)據(jù)還有一個(gè)基本的屬性就是數(shù)據(jù)類型,不同軟件中定義的數(shù)據(jù)類型不太一致,但是數(shù)字、文字和日期型是最常用的三類數(shù)據(jù)類型。在Excel中有很多數(shù)據(jù)類型,想要查看具體的數(shù)據(jù)類型,可在Excel中的任意一個(gè)單元格單擊鼠標(biāo)右鍵,在彈出的快捷菜單中選擇“設(shè)置單元格格式”選項(xiàng),彈出一個(gè)對(duì)話框,如下圖所示。在這個(gè)對(duì)話框中,可以看到不同的數(shù)據(jù)類型,如數(shù)值、文本、日期、貨幣、會(huì)計(jì)專用、時(shí)間、百分比、分?jǐn)?shù)、科學(xué)記數(shù)、特殊等。第3章:新媒體的數(shù)據(jù)來源

3.2.2數(shù)據(jù)類型雖然Excel中有這么多數(shù)據(jù)類型,但最終都可以歸結(jié)為以下兩大類。字符型數(shù)據(jù):字符型數(shù)據(jù)是不具有計(jì)算能力的文字?jǐn)?shù)據(jù)類型。它包括中文字符、英文字符、數(shù)字字符(非數(shù)值型)等。例如,成績表中的“姓名”變量為字符型數(shù)據(jù)。數(shù)值型數(shù)據(jù):數(shù)值型數(shù)據(jù)是直接使用自然數(shù)或度量單位進(jìn)行計(jì)量的數(shù)值數(shù)據(jù)。如,成績表中的“編號(hào)”“成績”就是數(shù)值型數(shù)據(jù),這類數(shù)據(jù)可以直接用算術(shù)方法進(jìn)行匯總和分析,這一點(diǎn)是區(qū)分?jǐn)?shù)據(jù)是否屬于數(shù)值型數(shù)據(jù)的重要依據(jù)。第3章:新媒體的數(shù)據(jù)來源

3.2.3數(shù)據(jù)表數(shù)據(jù)表由字段、記錄構(gòu)成,滿足一定的數(shù)據(jù)類型。數(shù)據(jù)分析需要的數(shù)據(jù)表,在設(shè)計(jì)時(shí)的具體要求如下。(1)數(shù)據(jù)表由標(biāo)題行和數(shù)據(jù)部分組成。(2)第一行是表的列標(biāo)題(字段名),列標(biāo)題不能重復(fù)。(3)第二行起是數(shù)據(jù)部分,數(shù)據(jù)部分的每一行數(shù)據(jù)稱為一個(gè)記錄,并且數(shù)據(jù)部分不允許出現(xiàn)空白行和空白列。(4)數(shù)據(jù)表中不能存在合并單元格。(5)數(shù)據(jù)表與其他數(shù)據(jù)之間應(yīng)該留出至少一個(gè)空白行和空白列。1.?dāng)?shù)據(jù)表設(shè)計(jì)要求第3章:新媒體的數(shù)據(jù)來源

3.2.3數(shù)據(jù)表數(shù)據(jù)表由表名、表中的字段和表的記錄三個(gè)部分組成。設(shè)計(jì)數(shù)據(jù)表結(jié)構(gòu)就是定義數(shù)據(jù)表文件名,確定數(shù)據(jù)表包含哪些字段,各字段的字段名、字段類型及寬度,并將這些數(shù)據(jù)輸入計(jì)算機(jī)中。在建立表之前都必須設(shè)計(jì)表結(jié)構(gòu),表結(jié)構(gòu)描述了一個(gè)表的框架。設(shè)計(jì)表結(jié)構(gòu)實(shí)際上就是定義組成一個(gè)表的字段個(gè)數(shù),以及每個(gè)字段的名稱、數(shù)據(jù)類型和長度等信息。設(shè)計(jì)表的結(jié)構(gòu)要求如下。(1)確定表名。表名要確保唯一性,表的名稱要與用途相符,簡略、直觀、見名知意。(2)確定字段名稱。

字段名長度小于64個(gè)字符。字段名可以包括字母、漢字、數(shù)字、空格和其他字符。字段名不可以包括句號(hào)(。)、感嘆號(hào)(!)、方括號(hào)([])和頓號(hào)(、)。字段名不可以以先導(dǎo)空格開頭。(3)確定字段類型。以微軟提供的Access辦公軟件為例,它提供了10種數(shù)據(jù)類型,以滿足字段的不同需要。(4)確定字段屬性。例如字段大小、格式、默認(rèn)值、必填字段、有效性規(guī)則、有效性文本和索引等。(5)確定表中唯一能識(shí)別記錄的主關(guān)鍵詞段,即主鍵。1.?dāng)?shù)據(jù)表結(jié)構(gòu)本章小結(jié)在本章中,我們了解了新媒體數(shù)據(jù)的來源。新媒體的數(shù)據(jù)類型包括微信朋友圈數(shù)據(jù)、微信公眾號(hào)數(shù)據(jù)、微博數(shù)據(jù)、今日頭題數(shù)據(jù)以及抖音數(shù)據(jù)。也了解了網(wǎng)站數(shù)據(jù)的一些專有名詞,包括網(wǎng)站流量、跳出率、網(wǎng)站來源、訪問深度。同時(shí),我們?cè)跀?shù)據(jù)搜集中會(huì)遇到很多問題,包括不知道怎么下手,收集的數(shù)據(jù)無用或者不全面,對(duì)數(shù)據(jù)類型不理解等等,我們這章中都做了具體的介紹,并給出了一些相對(duì)應(yīng)的解決方案。第3章:新媒體的數(shù)據(jù)來源本章內(nèi)容結(jié)束!Endofthischapter!新媒體數(shù)據(jù)分析與應(yīng)用新媒體數(shù)據(jù)分析與應(yīng)用第4章:新媒體數(shù)據(jù)的處理本章提綱CONTENTS數(shù)據(jù)清洗01數(shù)據(jù)加工024.1數(shù)據(jù)清洗第4章:新媒體數(shù)據(jù)的處理4.1數(shù)據(jù)清洗數(shù)據(jù)清洗指的是對(duì)數(shù)據(jù)進(jìn)行重新檢查,發(fā)現(xiàn)其中常見的錯(cuò)誤,其目的主要在于刪除重復(fù)信息、糾正存在的錯(cuò)誤,提高數(shù)據(jù)分析的準(zhǔn)確性。數(shù)據(jù)清洗的基本流程是先檢查數(shù)據(jù)中可能存在的錯(cuò)誤,包括檢查數(shù)據(jù)與元數(shù)據(jù)的一致性,處理重復(fù)值和缺失值等。因?yàn)閺臄?shù)據(jù)庫中收集來的數(shù)據(jù)是從多個(gè)業(yè)務(wù)系統(tǒng)中抽取而來的,其中包含歷史數(shù)據(jù),這樣就避免不了有的數(shù)據(jù)是錯(cuò)誤數(shù)據(jù)、有的數(shù)據(jù)之間有沖突,這些錯(cuò)誤的或有沖突的數(shù)據(jù)顯然是人們不想要的。數(shù)據(jù)清洗就是把這類數(shù)據(jù)清洗掉,過濾不符合要求的數(shù)據(jù),具體而言就是將多余的重復(fù)的數(shù)據(jù)篩選清除,將確實(shí)的數(shù)據(jù)補(bǔ)充完整,將錯(cuò)誤的數(shù)據(jù)糾正或刪除。對(duì)清洗后的數(shù)據(jù)進(jìn)行數(shù)據(jù)分析,能夠得到較為準(zhǔn)確的結(jié)論,從而能夠?yàn)楣芾頉Q策提供支持。第4章:新媒體數(shù)據(jù)的處理

4.1.1重復(fù)數(shù)據(jù)的處理——自定義需要處理的數(shù)據(jù)表

首先,在Excel中自定義一個(gè)帶有重復(fù)數(shù)據(jù)和缺失數(shù)據(jù)的數(shù)據(jù)表,如下圖所示。圖中數(shù)據(jù)表的第二列含有缺失數(shù)據(jù),第三列含有重復(fù)數(shù)據(jù)。圖4-1第4章:新媒體數(shù)據(jù)的處理

4.1.1重復(fù)數(shù)據(jù)的處理——識(shí)別重復(fù)數(shù)據(jù)在處理重復(fù)數(shù)據(jù)之前,需要先對(duì)數(shù)據(jù)表中的重復(fù)數(shù)據(jù)進(jìn)行識(shí)別,尤其是當(dāng)數(shù)據(jù)量特別大的時(shí)候,這一步尤為重要。在Excel中共有四種識(shí)別重復(fù)數(shù)據(jù)的方法。countif函數(shù)的作用是對(duì)區(qū)域中滿足單個(gè)指定條件的單元格進(jìn)行計(jì)數(shù),其基本格式為countif(range,criteria),range表示想要計(jì)算的單元格范圍,criteria表示計(jì)算條件,其形式可以為數(shù)字、表達(dá)式或文本。如圖4-1中所示,在D2單元格中輸入函數(shù)表達(dá)式:=COUNTIF(C1:C4,C1),然后拖動(dòng)單元格右下角的“+”號(hào)至D5單元格,顯示結(jié)果如圖4-2所示。1.函數(shù)法(使用countif函數(shù))圖4-2第4章:新媒體數(shù)據(jù)的處理

4.1.1重復(fù)數(shù)據(jù)的處理——識(shí)別重復(fù)數(shù)據(jù)在Excel中也可以直接使用功能導(dǎo)航區(qū)域的篩選功能直接篩選出非重復(fù)值,首先選擇數(shù)據(jù)單元格區(qū)域,然后選擇“數(shù)據(jù)”選項(xiàng)卡,找到“高級(jí)”對(duì)話框。在彈出的對(duì)話框中選擇“將篩選結(jié)果復(fù)制到其他位置”選項(xiàng),復(fù)制到單元格,同時(shí)勾選“選擇不重復(fù)的記錄”復(fù)選框,單擊“確定”按鈕。2.高級(jí)篩選法結(jié)果:第4章:新媒體數(shù)據(jù)的處理

4.1.1重復(fù)數(shù)據(jù)的處理——識(shí)別重復(fù)數(shù)據(jù)使用條件格式法的突出顯示重復(fù)值的功能也可將重復(fù)值顯示出來?!伴_始”選項(xiàng)卡下依選擇“條件格式”→“突出顯示單元格規(guī)則”→“重復(fù)值”,在彈出的對(duì)話框中單擊“確定”按鈕。3.條件格式法重復(fù)值將顯示為淺紅填充色的深紅色文本利用條件格式法處理重復(fù)值的步驟第4章:新媒體數(shù)據(jù)的處理

4.1.1重復(fù)數(shù)據(jù)的處理——識(shí)別重復(fù)數(shù)據(jù)數(shù)據(jù)透視表法的原理類似于函數(shù)法,通過計(jì)算數(shù)據(jù)重復(fù)的頻次,出現(xiàn)2次及以上就說明該數(shù)據(jù)屬于重復(fù)項(xiàng)。其操作過程具體如下,在E1單元格單擊“插入”選項(xiàng)卡,選擇“數(shù)據(jù)透視表”選項(xiàng),如下圖:4.?dāng)?shù)據(jù)透視表法利用數(shù)據(jù)透視表法處理重復(fù)值的步驟一第4章:新媒體數(shù)據(jù)的處理

4.1.1重復(fù)數(shù)據(jù)的處理——識(shí)別重復(fù)數(shù)據(jù)在彈出的對(duì)話框中,選擇要分析的區(qū)域?yàn)镃1:C5,選擇放置數(shù)據(jù)透視表的位置為E1,單擊“確定”按鈕,如下圖。單擊生成的數(shù)據(jù)透視表,在右方“數(shù)據(jù)透視表字段”中勾選“收益(萬元)”選項(xiàng),再將“收益(萬元)”選項(xiàng)拖動(dòng)到“數(shù)值”區(qū)域,最后單擊“數(shù)值”下拉按鈕,在彈出的下拉列表中選擇“值字段設(shè)置”為“計(jì)數(shù)”,其結(jié)果如下圖所示。4.?dāng)?shù)據(jù)透視表法彈出“創(chuàng)建數(shù)據(jù)透視表”對(duì)話框利用數(shù)據(jù)透視表法處理重復(fù)值的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.1.1重復(fù)數(shù)據(jù)的處理——?jiǎng)h除重復(fù)數(shù)據(jù)利用上述四種方法中的任意一種即可查看數(shù)據(jù)中的重復(fù)數(shù)據(jù),之后便可采取刪除重復(fù)數(shù)據(jù)的操作。在Excel中刪除重復(fù)數(shù)據(jù)的具體操作如下:首先選擇所要處理的單元區(qū)域,在上方導(dǎo)航窗口選擇“數(shù)據(jù)”選項(xiàng)卡,在“數(shù)據(jù)工具”組中選擇“刪除重復(fù)項(xiàng)”選項(xiàng)。

刪除重復(fù)數(shù)據(jù)的步驟一第4章:新媒體數(shù)據(jù)的處理

4.1.1重復(fù)數(shù)據(jù)的處理——?jiǎng)h除重復(fù)數(shù)據(jù)在彈出的對(duì)話框中選擇“擴(kuò)展選定區(qū)域”→“刪除重復(fù)項(xiàng)”→只勾選“列”→“確定”,最后Excel將彈出提示對(duì)話框,提示有多少重復(fù)值被刪除,有多少唯一值被保留。刪除重復(fù)數(shù)據(jù)的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.1.2缺失數(shù)據(jù)的處理缺失數(shù)據(jù)是指數(shù)據(jù)中某個(gè)或某些屬性的值存在缺失或不完整。缺失值產(chǎn)生的原因多種多樣,例如,由于數(shù)據(jù)收集或保存時(shí)造成的數(shù)據(jù)缺失,人的主觀失誤、歷史局限或有意隱瞞造成的數(shù)據(jù)缺失等。1.概念識(shí)別缺失數(shù)據(jù)的具體操作如下:選定需要處理的區(qū)域,單擊“開始”選項(xiàng)卡,單擊“編輯”組中的“查找和選擇”下拉按鈕在彈出的下拉菜單中單擊“定位條件”命令,在彈出的對(duì)話框中選擇“空值”單選按鈕。2.識(shí)別單擊“定位條件”命令

第4章:新媒體數(shù)據(jù)的處理

4.1.2缺失數(shù)據(jù)的處理在彈出的對(duì)話框中選擇“空值”單選按鈕,如圖所示。最終結(jié)果如右圖所示,所有含有空值的單元格均被顯示出來。選擇“空值”單選按鈕識(shí)別缺失數(shù)據(jù)的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.1.2缺失數(shù)據(jù)的處理(1)填充法保持單元格數(shù)據(jù)區(qū)域中所有空值的選中狀態(tài),按“=”鍵,再按“↑”鍵,最后按“Ctrl+Enter”快捷鍵,即可將所有空值都填充為所在組對(duì)應(yīng)的第一個(gè)單元中的值。3.處理利用填充法處理缺失數(shù)據(jù)的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.1.2缺失數(shù)據(jù)的處理(2)查找替換法當(dāng)缺失值以某種特殊標(biāo)識(shí)出現(xiàn)時(shí),可以采用查找替換的方式進(jìn)行處理,除了單擊“查找和替換”選項(xiàng)卡,還可以使用快捷鍵進(jìn)行查找和替換??旖萱I“Ctrl+H”可實(shí)現(xiàn)替換功能,快捷鍵“Ctrl+F”可實(shí)現(xiàn)查找功能。首先對(duì)原始的數(shù)據(jù)進(jìn)行修改,在一列的缺失值位置全部輸入“#NA”,表示缺失值。按下“Ctrl+F”快捷鍵進(jìn)行查找,在彈出的對(duì)話框中輸入“#NA”進(jìn)行查找,單擊“查找全部”按鈕,其結(jié)果如圖所示。3.處理利用查找法查看缺失數(shù)據(jù)的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.1.2缺失數(shù)據(jù)的處理查看完缺失數(shù)據(jù)后,按下“Ctrl+H”快捷鍵進(jìn)行替換,在對(duì)應(yīng)的文本框內(nèi)輸入內(nèi)容,將缺失值“#NA”替換為“50”,單擊“全部替換”按鈕,如圖所示。3.處理利用替換法替換缺失數(shù)據(jù)的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理4.1.3檢查數(shù)據(jù)的錯(cuò)誤在實(shí)際的數(shù)據(jù)分析中,數(shù)據(jù)還可能存在其他類型的錯(cuò)誤,并不是只有重復(fù)數(shù)據(jù)和缺失數(shù)據(jù)。在Excel中可以使用“數(shù)據(jù)有效性”來進(jìn)行錯(cuò)誤數(shù)據(jù)的檢查,數(shù)據(jù)有效性中存在多種檢查的規(guī)則。下面以一個(gè)簡單的例子來說明。利用4.1.2節(jié)中查找替換法的原始數(shù)據(jù),檢查是否存在缺失值及大于4的整數(shù)。選定A和B兩列作為需要檢查的區(qū)域,單擊上方導(dǎo)航欄中的“數(shù)據(jù)”選項(xiàng)卡,單擊“數(shù)據(jù)有效性”命令,在彈出的下拉菜單中選擇“數(shù)據(jù)有效性”選項(xiàng),如下圖所示。選擇“數(shù)據(jù)有效性”選項(xiàng)第4章:新媒體數(shù)據(jù)的處理4.1.3檢查數(shù)據(jù)的錯(cuò)誤彈出“數(shù)據(jù)有效性”對(duì)話框中,在“允許”下拉列表中選擇“整數(shù)”,在“數(shù)值”下拉列表中選擇“小于或等于”,在“最大值”文本框中輸入40,同時(shí)取消勾選“忽略空值”,單擊確定,如下圖所示。“數(shù)據(jù)有效性”對(duì)話框第4章:新媒體數(shù)據(jù)的處理4.1.3檢查數(shù)據(jù)的錯(cuò)誤設(shè)定完數(shù)據(jù)有效性檢查的規(guī)則后,再單擊“圈釋無效數(shù)據(jù)”命令,即可篩選出不在有效性規(guī)則內(nèi)的數(shù)據(jù),其結(jié)果如下圖所示。利用數(shù)據(jù)有效性檢查數(shù)據(jù)的結(jié)果圖4.2數(shù)據(jù)加工在一般情況下,數(shù)據(jù)經(jīng)過清洗后,依然無法滿足數(shù)據(jù)分析需求,還要經(jīng)過進(jìn)一步的加工處理,最終形成簡潔、規(guī)范、清晰的樣本數(shù)據(jù),這個(gè)過程通常包括數(shù)據(jù)抽取、數(shù)據(jù)計(jì)算、數(shù)據(jù)分組和數(shù)據(jù)轉(zhuǎn)換。第4章:新媒體數(shù)據(jù)的處理

4.2.1數(shù)據(jù)抽取字段拆分是指為了截取某一字段中的部分信息,將該字段拆分成兩個(gè)或多個(gè)字段。例如,身份證號(hào)碼中包含地區(qū)編碼和出生年月日信息。首先隨機(jī)輸入5個(gè)身份證號(hào)碼,如下圖所示。(注意:在輸入此部分?jǐn)?shù)據(jù)前,要先清除數(shù)據(jù)有效性規(guī)則,否則可能會(huì)報(bào)錯(cuò))1.字段拆分對(duì)數(shù)據(jù)庫中現(xiàn)有的字段進(jìn)行整合加工,以形成分析所需要的新的字段,即為數(shù)據(jù)抽取。它包括字段拆分和隨機(jī)抽樣。隨機(jī)輸入5個(gè)虛擬身份證號(hào)碼數(shù)據(jù)表第4章:新媒體數(shù)據(jù)的處理

4.2.1數(shù)據(jù)抽取使用MID函數(shù)分別提取前6位地區(qū)編碼,第7位到第10位是出生年份,第11到14位為出生日期。MID函數(shù)的格式是MID(text,start_num,num_chars),text是指需要抽取的文本字符串,start_num是指定字符串的開始位置,num_chars是指定提取的字符數(shù)量。因此,在B2單元格輸入函數(shù)公式:=MID(A2,1,6)表示對(duì)A2單元格中的文本字符串,從第1個(gè)位置開始,抽取6個(gè)數(shù)字,即為地區(qū)編碼。同樣在C2單元格輸入函數(shù)公式:=MID(A2,7,4)表示出生年份,在D2單元格輸入函數(shù)公式:=MID(A2,11,4)表示出生日期。最后在各列拖動(dòng)右下角的“+”號(hào),套用函數(shù)格式,將各列分別命名為“地區(qū)編碼”、“出生年份”和“出生日期”,結(jié)果如下圖所示。利用MID函數(shù)進(jìn)行字段拆分的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.2.1數(shù)據(jù)抽取隨機(jī)抽樣是按照隨機(jī)的原則,也就是保證總體中每個(gè)樣本都有同等的機(jī)會(huì)被抽中。在對(duì)海量級(jí)數(shù)據(jù)進(jìn)行計(jì)算時(shí),如果要對(duì)所有數(shù)據(jù)進(jìn)行計(jì)算,往往難度較大,因此對(duì)數(shù)據(jù)進(jìn)行隨機(jī)抽樣就很有必要。首先新建一個(gè)空白表,在A1單元格輸入公式:=RAND(),即生成一個(gè)范圍[0,1]的服從均勻分布的隨機(jī)數(shù),套用格式至A25單元格,即生成25個(gè)隨機(jī)數(shù),如右圖所示。2.隨機(jī)抽樣利用RAND函數(shù)生成25個(gè)隨機(jī)數(shù)第4章:新媒體數(shù)據(jù)的處理

4.2.1數(shù)據(jù)抽取首先加載“數(shù)據(jù)分析工具”,依次單擊上方導(dǎo)航欄的“文件”→“選項(xiàng)”→“加載項(xiàng)”,選擇“分析工具庫”選項(xiàng),單擊對(duì)話框下方“轉(zhuǎn)到”按鈕,如右圖所示。2.隨機(jī)抽樣加載“數(shù)據(jù)分析工具”第4章:新媒體數(shù)據(jù)的處理

4.2.1數(shù)據(jù)抽取然后勾選“分析工具庫”復(fù)選框,單擊“確定”按鈕,在導(dǎo)航欄“數(shù)據(jù)”選項(xiàng)卡下就會(huì)出現(xiàn)“數(shù)據(jù)分析”選項(xiàng),如右圖所示。2.隨機(jī)抽樣利用數(shù)據(jù)分析工具進(jìn)行隨機(jī)抽樣的步驟一第4章:新媒體數(shù)據(jù)的處理

4.2.1數(shù)據(jù)抽取單擊“數(shù)據(jù)分析”選項(xiàng),在彈出的對(duì)話框中選擇“抽樣”分析工具,“輸入?yún)^(qū)域”選擇A1:A25,“隨機(jī)樣本數(shù)”選擇10,“輸出區(qū)域”選擇B1:B10,單擊“確定”按鈕,如右圖所示。2.隨機(jī)抽樣“抽樣”對(duì)話框第4章:新媒體數(shù)據(jù)的處理

4.2.1數(shù)據(jù)抽取結(jié)果如圖所示,成功隨機(jī)抽取10個(gè)樣本。需要注意的是,由于使用的是隨機(jī)數(shù),每次單擊時(shí)隨機(jī)數(shù)都會(huì)發(fā)生變化,故圖中數(shù)據(jù)會(huì)不一致,但這不影響常規(guī)數(shù)據(jù)的隨機(jī)抽樣。2.隨機(jī)抽樣利用數(shù)據(jù)分析工具進(jìn)行隨機(jī)抽樣的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.2.2數(shù)據(jù)計(jì)算有時(shí)候源數(shù)據(jù)并不能滿足需求,因此需要對(duì)獲取的數(shù)據(jù)源進(jìn)行簡單計(jì)算,得到想要的數(shù)據(jù),以便更好地進(jìn)行數(shù)據(jù)分析。例如有一組銷售數(shù)據(jù),需要分別計(jì)算各產(chǎn)品的銷售額和總計(jì)的銷售額,利用簡單的函數(shù)計(jì)算即可完成。原始的銷售數(shù)據(jù)表第4章:新媒體數(shù)據(jù)的處理

4.2.2數(shù)據(jù)計(jì)算首先,在D2單元格輸入公式:=B2*C2,套用格式至D4,獲得各個(gè)產(chǎn)品對(duì)應(yīng)的銷售額。然后在B5單元格輸入公式:=SUM(B2:B4),套用格式至D5,得到總銷量和總銷售額,結(jié)果如下圖所示。利用函數(shù)進(jìn)行簡單計(jì)算的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.2.2數(shù)據(jù)計(jì)算當(dāng)然,也可以利用導(dǎo)航欄“開始”選項(xiàng)卡下面的“編輯”選項(xiàng),選擇“自動(dòng)求和”等函數(shù)進(jìn)行計(jì)算,如下圖所示。利用“編輯”選項(xiàng)進(jìn)行簡單計(jì)算第4章:新媒體數(shù)據(jù)的處理

4.2.3數(shù)據(jù)分組數(shù)據(jù)分組是按照數(shù)據(jù)分析的目的,將原始的數(shù)據(jù)源按照一定的規(guī)則劃分成不同的組別,分組后的數(shù)據(jù)包含某個(gè)范圍的數(shù)據(jù),便于實(shí)現(xiàn)數(shù)據(jù)分析的目的。在Excel中可以使用IF函數(shù)進(jìn)行數(shù)據(jù)分組的操作。IF函數(shù)是一個(gè)邏輯判斷函數(shù),IF函數(shù)可對(duì)數(shù)值大小進(jìn)行判斷,并賦予相應(yīng)的分組標(biāo)簽。IF函數(shù)可表示為IF(logical_test,[value_if_true],[value_if_false]),其中l(wèi)ogical_test是條件表達(dá)式,即邏輯判斷條件,當(dāng)條件滿足時(shí)返回value_if_true,當(dāng)條件不滿足時(shí)返回value_if_false。首先,生成20個(gè)年齡數(shù)據(jù),然后在輸出單元格中輸入公式:=IF(A2<50,“(0,50)”,“[50,+∞”)),最后在輸出區(qū)域套用格式,輸出結(jié)果如右圖所示。利用IF函數(shù)進(jìn)行簡單分組的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理

4.2.3數(shù)據(jù)分組當(dāng)想要分成多個(gè)組時(shí),只需要在IF函數(shù)中嵌套IF函數(shù),例如,在圖4-31中的C2單元格中輸入公式:=IF(A2<30,“(0,30)”,IF(A2<45,“[30,45)”,“[45,+∞”)),將年齡分組成三個(gè)組,其結(jié)果如下圖所示。利用IF函數(shù)進(jìn)行多個(gè)分組的結(jié)果圖第4章:新媒體數(shù)據(jù)的處理4.2.4數(shù)據(jù)轉(zhuǎn)換數(shù)據(jù)加工的最后一個(gè)部分就是數(shù)據(jù)轉(zhuǎn)換,在數(shù)據(jù)分析時(shí),獲取的元數(shù)據(jù)有時(shí)候是文本,可能就無法進(jìn)行計(jì)算。此時(shí)就需要對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換成能夠處理的數(shù)據(jù)類型。常用的數(shù)據(jù)轉(zhuǎn)換主要有數(shù)據(jù)表轉(zhuǎn)置和數(shù)據(jù)類型轉(zhuǎn)換。1.概念將簡單信息表進(jìn)行轉(zhuǎn)置,選定需要轉(zhuǎn)置的輸入?yún)^(qū)域并右擊,在彈出的快捷菜單中單擊“復(fù)制”命令。選定想要輸

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論