版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、目錄/Contents1.1 什么是數(shù)據分析1.2 統(tǒng)計學的幾個基本概念第一章 數(shù)據分析概述1.3 統(tǒng)計指標的分類1.1 什么是數(shù)據分析數(shù)據分析是指對大量數(shù)據進行整理后,利用適當?shù)慕y(tǒng)計分析方法,把隱藏在數(shù)據背后的信息提煉出來,并加以概括總結的過程。數(shù)據分析包括如下幾個主要內容。 現(xiàn)狀分析:分析已經發(fā)生了什么。 原因分析:分析為什么發(fā)生某一現(xiàn)狀。 預測分析:分析將來可能發(fā)生什么。1.1 數(shù)字通信系統(tǒng)的基本概念1.1.1 數(shù)據分析的過程數(shù)據分析的過程主要包括6個既相對獨立又相互聯(lián)系的階段,下面分別進行介紹。1確定分析目的2收集數(shù)據3數(shù)據處理4數(shù)據分析5數(shù)據展現(xiàn)6撰寫報告41.1.2 數(shù)據分析的工具
2、數(shù)據分析的相關工具可以分成以下3種。(1)存放數(shù)據的工具。(2)分析數(shù)據的工具。(3)做分析報告的工具。1.2 統(tǒng)計學的幾個基本概念1.2.1 現(xiàn)象總體和現(xiàn)象個體現(xiàn)象總體(以下簡稱總體)是由客觀存在的、具有某種共同性質又有差別的許多個別單位所構成的整體。構成總體的每一個事物或基本單位,叫現(xiàn)象個體(以下簡稱個體)。原始資料最初就是從每個個體中取得的,所以個體是各項統(tǒng)計數(shù)字最原始的承擔者。根據表1-1的數(shù)據,進一步理解什么是總體,什么是個體。姓名性別身高(cm)體重(kg)愛好張三男17568籃球李四男17270唱歌王二女16350舞蹈表1-1 某學校全體學生資料一覽表總體必須具備3個特性:大量性
3、、同質性和變異性。(1)大量性:是總體的量的規(guī)定性,即指總體的形成要有一個相對規(guī)模的量,僅僅由個別單位或極少量的單位不足以構成總體。(2)同質性:是指構成總體的各個單位至少有一種性質是共同的,同質性是將總體各單位結合起來構成總體的基礎,也是總體的質的規(guī)定性。(3)變異性:是指總體各個單位除了具有某種或某些共同性質以外,在其他方面則各不相同,具有質的差異和量的差別,這種差別叫變異。例如:在研究江西省所有工業(yè)企業(yè)的工業(yè)總產值時(見表1-2),每個企業(yè)的工業(yè)總產值都是個體,但在研究其中某一個企業(yè)的工業(yè)總產值時,則該企業(yè)又成了總體。企業(yè)名稱工業(yè)總產值(萬元)企業(yè)14000企業(yè)26000企業(yè)39000表
4、1-2 江西省工業(yè)企業(yè)總產值一覽表1.2.2 標志和標志表現(xiàn)通常,每個個體具有許多屬性和特征。這些屬性或特征叫標志。標志的屬性或數(shù)量在每個個體的具體表現(xiàn),叫標志表現(xiàn)。標志按其性質可以分為數(shù)量標志和品質標志。 數(shù)量標志:以數(shù)量的多少來表示的標志,表示事物量的特性。 品質標志:不能用數(shù)量而只能以性質屬性上的差別即文字來表示的標志,表示事物質的特征。1.2.3 統(tǒng)計指標假如通過對表1-1的統(tǒng)計計算,可能得出以下統(tǒng)計結果: 學??側藬?shù)5000人 男生人數(shù)2600人 女生人數(shù)2400人 男女性別比1.08:1 平均身高172cm 平均體重62kg這些數(shù)據在統(tǒng)計學上都稱為統(tǒng)計指標。統(tǒng)計指標就是反映總體的數(shù)
5、量特征的概念和具體數(shù)值。通常,一個完整的統(tǒng)計指標包含指標名稱和指標數(shù)值兩部分。1.3 統(tǒng)計指標的分類1按反映的內容或數(shù)值表現(xiàn)形式劃分按照其反映的內容或其數(shù)值表現(xiàn)形式,可劃分為總量指標、相對指標和平均指標。(1)總量指標:反映總體規(guī)模的統(tǒng)計指標,通常以絕對數(shù)的形式來表現(xiàn),因此又稱為絕對數(shù)。總量指標是人們認識總體的起點,是計算其他統(tǒng)計指標的基礎。(2)相對指標:是兩個總量指標之比,因此又稱相對數(shù)。(3)平均指標:平均指標又稱平均數(shù),是總體在某一空間或時間上的平均數(shù)量狀況。2按所反映的數(shù)量特點與內容劃分按照其所反映的數(shù)量特點和內容,可劃分為數(shù)量指標和質量指標。(1)數(shù)量指標:反映總體的范圍廣度、規(guī)模
6、大小和數(shù)量多少的指標。它表示事物外延量的大小,通常有計量單位,用絕對數(shù)表示。其指標數(shù)值大小隨總體范圍的大小而增減變動。(2)質量指標:反映總體的質量、強度、經濟效果等的統(tǒng)計指標。它表示事物內涵量的狀況,通常用相對數(shù)或平均數(shù)表示。其指標的數(shù)值大小與總體范圍大小沒有直接的關系。1.3.1 總量指標總量指標是指統(tǒng)計匯總后得到的具有計量單位的統(tǒng)計指標,反映研究總體在一定時期或時點的總規(guī)模、總水平或性質相同的總體規(guī)模的數(shù)量差異。按總量指標所反映的時間狀況來劃分,總量指標可以分為時期指標和時點指標。(1)時期指標:是反映總體在一段時間內的累計總和。(2)時點指標:是反映總體在某一時點上的狀態(tài)總數(shù)。1時期指
7、標與時點指標的區(qū)別(1)性質相同的時期指標的數(shù)值可以相加,而時點指標相加則無意義。(2)同類時期指標數(shù)值的大小與時期長短有直接關系,而時點指標則沒有這種關系。(3)時期指標數(shù)值是經常登記取得,而時點指標則不是。2指標與標志的區(qū)別(1)標志是用于描述個體的,指標是用于描述總體的。(2)標志只是一個名稱,不含數(shù)值(標志表現(xiàn));指標既含名稱又含數(shù)值。3指標與標志的聯(lián)系(1)具有對應關系。標志與指標名稱往往是同一概念。(2)具有匯總關系。統(tǒng)計指標的數(shù)值由標志表現(xiàn)匯總得來。(3)具有變換關系。隨著研究目的的變換,原有的總體轉變?yōu)閭€體,相應的統(tǒng)計指標名稱也就成為標志;反之亦然。1.3.2 相對指標相對指標
8、分為結構相對指標、對比相對指標、完成程度相對指標等。1結構相對指標結構相對指標又稱結構相對數(shù)或比重指標,是在統(tǒng)計分組的基礎上,總體中某一組的數(shù)值與總體指標數(shù)值的比值,以說明總體內部組成情況,一般用百分數(shù)表示。例如,表1-3為我國第二次農業(yè)普查農業(yè)生產經營戶數(shù)量及構成表,其中的第3列數(shù)據就是結構相對指標。表1-3 我國第二次農業(yè)普查農業(yè)生產經營戶數(shù)量及構成結構相對指標具有如下特點。(1)分子分母不能互換。(2)指標值1。(3)指標值之和1。常用的合格率、恩格爾系數(shù)都屬于結構相對指標。2對比相對指標任何事物都是既有共性特征,又有個性特征的,只有通過對比,才能分辨出事物的性質、變化、發(fā)展的規(guī)律。數(shù)據
9、分析亦如此,對龐大的數(shù)據做單獨分析,通常很難發(fā)現(xiàn)其意義,只有將不同數(shù)據進行對比,才能發(fā)現(xiàn)更多本質現(xiàn)象。這種分析數(shù)據的方法就叫對比分析法。通常情況下,數(shù)據對比可以分成靜態(tài)對比和動態(tài)對比。(1)靜態(tài)相對指標靜態(tài)相對指標是指同一總體在相同時間下不同組(部門、單位、地區(qū))的數(shù)據對比,通常用比值、倍數(shù)、系數(shù)或百分數(shù)表示。靜態(tài)相對指標有如下特點。 同一總體、同一指標、同一時間、不同組的數(shù)值對比。 分子、分母可以互換。(2)動態(tài)相對指標動態(tài)相對指標是指同一總體在不同時間下的數(shù)據對比,以說明總體在不同時間上的發(fā)展變化情況,所以也叫發(fā)展速度,通常用百分數(shù)表示。例如同比發(fā)展速度和環(huán)比發(fā)展速度。動態(tài)相對指標有如下特
10、點。 同一總體、同一指標、不同時間的數(shù)值對比。 分子、分母不可以互換。3完成程度相對指標完成程度相對指標是實際完成值與目標計劃值進行對比,通常用百分數(shù)表示。其計算公式為:1.3.3 平均指標平均指標又叫平均數(shù),是指反映總體各單位某一數(shù)量標志值在具體時間、地點、條件下達到的一般水平的綜合指標。平均指標按計算和確定方法的不同,分為算術平均數(shù)和幾何平均數(shù)。1算術平均數(shù)算術平均數(shù)是指總體的總量指標與單位總數(shù)的比值。算術平均數(shù)是一種應用最為廣泛的平均數(shù),其計算公式為:2幾何平均數(shù)幾何平均數(shù)是n個數(shù)連乘積開n次方根,其計算公式為:對于同一組數(shù)據來說,幾何平均數(shù)算術平均數(shù)。幾何平均數(shù)適用于計算平均合格率、平
11、均本利率、平均發(fā)展速度、平均增長速度等。目錄/Contents2.1 理解數(shù)據2.2 數(shù)據的來源第二章 數(shù)據的收集2.1 理解數(shù)據2.1.1 數(shù)據的類型在Excel中,數(shù)據類型細分起來有很多(見圖2-1),但是歸根結底還是四大類,分別是:數(shù)值、貨幣、日期與時間、文本。圖2-1 Excel數(shù)據類型1.1 數(shù)字通信系統(tǒng)的基本概念在數(shù)據運算過程中,我們發(fā)現(xiàn),數(shù)值、貨幣、日期與時間都可以進行加、減、乘、除等算術運算,所以統(tǒng)稱為數(shù)值型;而文本只能進行簡單的“計數(shù)”,不能進行算術運算,仍稱文本型。所以,在Excel數(shù)據分析中,我們把數(shù)據類型分成兩種:數(shù)值型數(shù)據和文本型數(shù)據。數(shù)值型數(shù)據對應統(tǒng)計學中的數(shù)量標志
12、的標志表現(xiàn),文本型數(shù)據對應統(tǒng)計學中的品質標志的標志表現(xiàn)。42.1.2 數(shù)據的呈現(xiàn)形式1不同個體在同一標志上的不同取值在Excel中,這樣的數(shù)據可以排成一列,也可以排成一行或一個矩形塊。某公司100名職工的月基本工資數(shù)據資料如圖2-2和圖2-3所示。圖2-2 單列數(shù)據圖2-3 矩形塊數(shù)據2數(shù)據清單不同個體在多個標志上的取值所組成的二維表格,在Excel中叫數(shù)據清單,如圖2-4所示。圖2-4 數(shù)據清單Excel數(shù)據清單包含一行列標題和多行數(shù)據,清單中的每一列稱為一個字段,列標題稱為字段名(即統(tǒng)計學中的標志);清單中的每一列數(shù)據的類型和格式完全相同;清單中每一行數(shù)據稱為一條記錄。數(shù)據清單中不能有合并
13、單元格的形式。多個相關的數(shù)據清單在一起,就稱為一個數(shù)據庫。2.2 數(shù)據的來源2.2.1 一手數(shù)據1觀察法觀察法是指調查人員親自到現(xiàn)場對調查對象進行觀察,在被調查者不察覺的情況下獲得數(shù)據資料的一種調查方法。2采訪法采訪法是通過指派調查人員對被調查者提問,據被調查者的答復取得資料的一種調查方法。3問卷調查法問卷調查法是把調查項目列于表格上形成問卷,通過發(fā)放問卷搜集調查對象情況的一種采集資料的方法。問卷中問題的設計應注意以下原則。(1)具體性原則,即問題的內容要具體,不要提抽象、籠統(tǒng)的問題。(2)單一性原則,即問題的內容要單一,不要把兩個或兩個以上的問題合在一起提。(3)通俗性原則,即表述問題的語言
14、要通俗,不要使用使被調查者感到陌生的語言,特別要避免使用過于專業(yè)的術語。(4)準確性原則,即表述問題的語言要準確,不要使用模棱兩可、含混不清或容易產生歧義的語言或概念。(5)簡明性原則,即表述問題的語言應該盡可能簡單明確,不要冗長和啰唆。(6)客觀性原則,即表述問題的語言要客觀,不要有誘導性或傾向性語言。(7)非否定性原則,即要避免使用否定句形式表述問題。(8)可能性原則,即必須符合被調查者回答問題的能力。凡是超越被調查者理解能力、記憶能力、計算能力、回答能力的問題,都不應該提出。(9)自愿性原則,即必須考慮被調查者是否自愿真實回答問題。凡被調查者不可能自愿真實回答的問題,都不應該正面提出。4
15、抽樣調查法抽樣調查法是根據隨機性原則,從研究對象的總體中抽取一部分個體作為樣本進行調查研究,據此推斷有關總體的數(shù)字特征的研究方法。抽樣應遵循以下原則。(1)隨機取樣。(2)取樣應具有代表性。(3)若樣本由具有明顯不同特征的部分組成,應按比例從各部分抽樣。5實驗法實驗法是在設定的特殊實驗場所、特殊狀態(tài)下,對調查對象進行實驗以獲得所需的資料。6報告法報告法是通過報告單位根據一定的原始記錄和臺賬,根據統(tǒng)計表的格式和要求,按照隸屬關系,逐級向有關部門提供統(tǒng)計資料的一種調查方法。7自動生成在大數(shù)據時代,數(shù)據的產生方式呈現(xiàn)多樣化,如從傳感器、攝像頭自動收集的數(shù)據,電子商務在線交易日志數(shù)據、應用服務器日志數(shù)
16、據等自動保存的數(shù)據都是自動生成的數(shù)據。2.2.2 二手數(shù)據二手數(shù)據也稱為次級數(shù)據,是指那些從同行或一些媒體上獲得的、經過加工整理的數(shù)據,比如國家統(tǒng)計局定期發(fā)布的各種數(shù)據,從報紙、電視上獲取的各種數(shù)據。1導入Access數(shù)據(1)在Excel中單擊“數(shù)據”|“自Access”按鈕,如圖2-5所示。圖2-5 導入Access數(shù)據(2)在彈出的對話框中選擇需要的Access文件“圖書銷售.accdb”,如圖2-6所示。圖2-6 選擇Access文件(3)單擊“打開”按鈕,在彈出的對話框中選擇需要的表“銷售情況”,如圖2-7所示。(4)在彈出的對話框中確定數(shù)據的顯示方式和放置位置,如圖2-8所示。圖2
17、-7 選擇Access表圖2-8 選擇顯示方式和放置位置(5)單擊“確定”按鈕,導入的結果如圖2-9所示。圖2-9 導入的結果2導入網站表格數(shù)據(1)在Excel中單擊“數(shù)據”|“自網站”按鈕,如圖2-10所示。(2)輸入或復制并粘貼網址。圖2-10 導入網站數(shù)據圖2-11 選擇導入的表格導入的結果如圖2-12所示。(3)也可以選擇網頁上的數(shù)據后,單擊鼠標右鍵,在彈出的快捷菜單中選擇“復制”命令,如圖2-13所示,再到Excel中粘貼即可。圖2-12 導入的結果圖2-13 復制數(shù)據3利用爬蟲軟件下載網絡數(shù)據萬維網上更多的數(shù)據是以非表格形式呈現(xiàn)的。如何有效地提取并利用這些信息成為一個巨大的挑戰(zhàn)。
18、為了解決上述問題,定向抓取相關網頁資源的軟件聚焦網絡爬蟲應運而生。聚焦網絡爬蟲是一種能自動下載萬維網數(shù)據的程序,它能按照一定的規(guī)則,根據既定的目標,自動地抓取萬維網上的數(shù)據。目錄/Contents3.1 數(shù)據清洗3.2 數(shù)據的來源第三章 數(shù)據的處理3.3 數(shù)據的修整3.1 數(shù)據清洗數(shù)據清洗就是將格式錯誤的數(shù)據進行處理糾正,將錯誤的數(shù)據糾正或刪除,將缺失的數(shù)據補充完整,將重復多余的數(shù)據刪除。3.1.1 數(shù)據一致性處理通過統(tǒng)計調查收集上來的數(shù)據,經常會出現(xiàn)同一字段的數(shù)據格式不一致的問題,如圖3-1所示。這會直接影響后續(xù)的數(shù)據分析,所以必須對數(shù)據的格式做出一致性處理。圖3-1 數(shù)據格式不一致的資料1
19、.1 數(shù)字通信系統(tǒng)的基本概念下面就以圖3-1所示的數(shù)據為例,將“身高”這個字段中的數(shù)據去掉字符“cm”。打開Excel文件“數(shù)據處理.xlsx”,找到“數(shù)據清洗”工作表。(1)把鼠標指針移到字母C上,當指針變成 時,單擊選擇C列,如圖3-2所示。(2)選擇“查找和選擇”|“替換”命令,如圖3-3所示。4 圖3-2 選擇C列圖3-3 選擇“替換”命令(3)在“查找和替換”對話框的“查找內容”中輸入“cm”,設置“替換為”為空,單擊“全部替換”按鈕完成替換,如圖3-4所示。替換后的結果如圖3-5所示。圖3-4 輸入查找內容和替換內容圖3-5 替換后的結果3.1.2 缺失數(shù)據的處理數(shù)據清單中,單元格
20、如果出現(xiàn)空值,就認為數(shù)據存在缺失。缺失數(shù)據的處理方法通常有以下3種: 用樣本均值(或眾數(shù)、中位數(shù))代替缺失值; 將有缺失值的記錄刪除; 保留該記錄,在要用到該值做分析時,將其臨時刪除(最常用方法)。首先來解決如何發(fā)現(xiàn)缺失數(shù)據,僅靠眼睛來搜索缺失數(shù)據顯然是不現(xiàn)實的,一般我們用“定位條件”來查找缺失數(shù)據的單元格。下面演示將“年齡”字段中的空值均替換為“18”。(1)選擇“年齡”所在的E列。(2)選擇“查找和選擇”|“定位條件”命令,如圖3-6所示。(3)在“定位條件”對話框中,選中“空值”單選項,如圖3-7所示。圖3-6 選擇“定位條件”命令 圖3-7 選擇定位條件“空值”(4)單擊“確定”按鈕后
21、,E列所有的空白單元格呈選中狀態(tài),如圖3-8所示。(5)輸入替代值“18”,按Ctrl+Enter組合鍵確認,結果如圖3-9所示。圖3-8 查找到所有空白單元格圖3-9 統(tǒng)一輸入新的數(shù)據3.1.3 刪除重復記錄刪除重復記錄的操作極其簡單,只需單擊數(shù)據表的任意位置,再單擊“數(shù)據”|“刪除重復項”按鈕即可,如圖3-10所示。圖3-10 刪除重復項3.2 數(shù)據加工數(shù)據加工的手段主要有數(shù)據轉置、字段分列、字段匹配、數(shù)據抽取、數(shù)據計算。3.2.1 數(shù)據轉置操作的方法是:先復制好橫行數(shù)據,然后在粘貼時單擊“開始”|“剪貼板”組“粘貼”按鈕下面的三角箭頭,單擊“轉置”按鈕即可,如圖3-11所示。圖3-11
22、轉置性粘貼3.2.2 字段分列(1)選擇“字段分列”工作表的A列數(shù)據,如圖3-12所示。(2)單擊“數(shù)據”|“分列”按鈕,如圖3-13所示。 圖3-12 選擇A列 圖3-13 數(shù)據分列(3)要將字段“姓名”中的第一個字分列出來,所以選中“固定列寬”單選項,如圖3-14所示。圖3-14 選中“固定列寬”單選項(4)單擊“下一步”按鈕,在刻度尺上單擊鼠標確定分列的位置,如圖3-15所示。(5)單擊“下一步”按鈕,確定目標區(qū)域的起點單元格D1,如圖3-16所示。圖3-15 確定分列位置圖3-16 確定目標區(qū)域(6)單擊“完成”按鈕,分列的結果如圖3-17所示。圖3-17 分列結果3.2.3 字段匹配
23、字段匹配就是將原數(shù)據清單中沒有但其他數(shù)據清單中有的字段匹配過來。例如,文件“數(shù)據處理.xlsx”中的“全校名單”工作表是某校2015級全體學生的基本信息(見圖3-18),“四級名單”工作表是2015級學生中報考了英語四級的學生名單(見圖3-19)。圖3-18 “全校名單”工作表圖3-19 “四級名單”工作表(1)將“白有成”的身份證號碼匹配到單元格D2。(2)雙擊D2的填充柄完成填充,將所有人的身份證號碼都匹配過來,結果如圖3-21所示。圖3-20 vlookup函數(shù)的參數(shù)設置圖3-21 匹配結果3.2.4 數(shù)據抽取數(shù)據抽取是指利用原數(shù)據清單中某些字段的部分信息得到一個新字段。常用的數(shù)據抽取函
24、數(shù)有l(wèi)eft()、right()、mid()、year()、month()、day()、weekday()。圖3-22 weekday函數(shù)應用3.2.5 數(shù)據計算例1:文件“數(shù)據處理.xlsx”的“數(shù)據計算1”工作表中只有“銷量”和“單價”,沒有“銷售額”,可以通過公式“銷售額=單價銷量”來計算銷售額,如圖3-23所示。圖3-23 計算銷售額例2:文件“數(shù)據處理.xlsx”的“數(shù)據計算2”工作表中只有“成交單數(shù)”和“好評單數(shù)”,可以通過公式“好評率=”來計算好評率,如圖3-24所示。圖3-24 計算好評率例3:文件“數(shù)據處理.xlsx”的“數(shù)據計算3”工作表中,已知商品的“上架日期”和“下架日
25、期”,可以通過公式“銷售天數(shù)=下架日期-上架日期”來計算商品的銷售天數(shù),如圖3-25所示。圖3-25 計算銷售天數(shù)例4:文件“數(shù)據處理.xlsx”的“數(shù)據計算4”工作表中,已知商品的“上架日期”,要計算迄今為止的上架天數(shù),可以用函數(shù)today來獲取當天的日期,用公式“=today()-B2”來計算上架天數(shù),如圖3-26所示。圖3-26 計算上架天數(shù)例5:文件“數(shù)據處理.xlsx”的“數(shù)據計算3”工作表中,可以用公式“=D2/360”計算銷售年數(shù),結果為3.6,如圖3-27所示。圖3-27 計算銷售年數(shù)這樣計算出來的年數(shù)通常是一個小數(shù),如果希望得到整數(shù),可以用int函數(shù)取整,即用公式“=int(
26、D2/360)”,結果是3,如圖3-28所示。因為int函數(shù)的功能是返回不大于括號內參數(shù)的整數(shù)。圖3-28 用int函數(shù)取整如果要進行四舍五入式取整,則要用函數(shù)round。當round(number,digits)函數(shù)的第二個參數(shù)為0時,就可以對第一個參數(shù)進行四舍五入式取整,所以在編輯欄將公式修改為“=round(D2/360,0)”即可,如圖3-29所示。圖3-29 用round函數(shù)取整函數(shù)int(number)的功能是向下取整(數(shù)軸上離左邊最近的整數(shù)),如圖3-30所示。圖3-30 int函數(shù)解釋所以,int(6.4)=int(6.7)=6,int(-6.4)=int(-6.7)=-7。函
27、數(shù)round(number,digits)的功能是進行四舍五入運算,功能解釋如表3-1所示。number1263.472digits-2-1012四舍五入的位數(shù)十位個位取整保留1位小數(shù)保留2位小數(shù)結果1300126012631263.51263.47表3-1 round函數(shù)解釋3.3 數(shù)據的修整在一段較長的時間內,由于普通的、持續(xù)的、決定性等基本因素的作用,總體往往呈現(xiàn)逐漸向上或向下變動的趨勢,如圖3-31所示。圖3-31 明顯的向上趨勢在這樣的趨勢中,也不排除受一些偶然因素或不規(guī)則因素的影響,出現(xiàn)與整體趨勢相差很大的極端數(shù)據,如圖3-32中箭頭所對應的數(shù)據所示。移動平均法就是從時間數(shù)列的第一
28、位數(shù)值開始,按一定項數(shù)求平均數(shù),逐項移動,形成一個新的動態(tài)數(shù)列。常用的移動平均法有三項移動平均法和四項移動平均法。圖3-32 局部的數(shù)據異動3.3.1 三項移動平均法例:計算圖3-33所示的表格中,商品銷售額的三項移動平均數(shù)。分析:選擇單元格區(qū)域A1:B13,單擊“插入”|“散點圖”|“僅帶數(shù)據標記的散點圖”按鈕,如圖3-34所示。圖3-33 20042015年銷售額統(tǒng)計圖3-34 插入散點圖結果得到圖3-35所示的散點圖,從散點圖可以直觀地看出,第3個點明顯偏小,而第6個點明顯偏大,這可能是由不確定因素的影響造成的。在這種情況下,可以通過移動平均法對數(shù)據做修整,盡量排除不確定因素對數(shù)據造成的
29、影響。圖3-35 原始數(shù)據的散點圖 圖3-36 選擇“平均值”命令 圖3-37 計算三項平均數(shù)圖3-38 計算三項移動平均數(shù)圖3-39 修整后的數(shù)據散點圖3.3.2 四項移動平均法例:計算圖3-40所示的表格中商品銷售額的四項移動平均數(shù)。圖3-40 四項移動平均數(shù)的計算下面在Excel中用函數(shù)average計算四項移動平均數(shù)。(1)打開文件“數(shù)據處理.xlsx”中的“四項移動平均”工作表,在C3中使用公式“=average(B2:B5)”計算第一個四項移動平均數(shù),如圖3-41所示。(2)確認C3的計算后,將C3的填充柄填充到C11。圖3-41 計算四項移動平均數(shù)(3)在D4中使用公式“=ave
30、rage(C3:C4)”,如圖3-42所示。(4)確認D4的計算后,將D4的填充柄填充到D11。注意:若采用奇數(shù)項移動平均,平均值對準居中原時間數(shù)列的項數(shù),一次可得趨勢值。若采用偶數(shù)項移動平均,平均值未對準居中原時間數(shù)列的項數(shù),需再通過一次移動平均進行正位。圖3-42 計算四項移動平均正位數(shù)3.3.3 分析工具庫的加載和應用在Excel中,還可以用分析工具庫完成移動平均數(shù)的計算。默認情況下,Excel并沒有安裝分析工具庫。下面介紹分析工具庫的安裝過程。(1)在Excel 2010窗口中,選擇“文件”|“選項”命令。(2)在隨后打開的“Excel選項”對話框中,單擊左邊的“加載項”選項后,再單擊
31、下方的“轉到”按鈕,如圖3-43所示。圖3-43 加載項(3)在隨后打開的“加載宏”對話框中,選中“分析工具庫”復選項,單擊“確定”按鈕,如圖3-44所示。(4)加載成功后,會在”數(shù)據”選項卡中看到一個新的功能“數(shù)據分析”,如圖3-45所示。圖3-44 加載“分析工具庫”圖3-45 加載成功后的“數(shù)據”選項卡下面介紹利用“數(shù)據分析”功能計算三項移動平均數(shù)的方法。(1)打開文件“數(shù)據處理.xlsx”中的“三項移動平均”工作表,單擊“數(shù)據”|“數(shù)據分析”按鈕。(2)在隨后打開的“數(shù)據分析”對話框中選擇“移動平均”選項,如圖3-46所示。圖3-46 選擇“移動平均”選項(3)在“移動平均”對話框中設
32、置各參數(shù)如圖3-47所示,最終結果如圖3-48所示。圖3-47 三項“移動平均”的設置圖3-48 最終結果目錄/Contents4.1 數(shù)據分組 4.2 描述性統(tǒng)計第四章 數(shù)據的分析 4.3 動態(tài)數(shù)列的分析與預測 4.4 相關分析與回歸分析 4.5 綜合評價分析法 4.6 四象限分析法4.1 數(shù)據分組4.1.1 統(tǒng)計分組的概念統(tǒng)計分組是根據統(tǒng)計研究的需要,按照一定的標志,將總體區(qū)分為若干個性質不同而又有聯(lián)系的組成部分,并計算各組的頻數(shù)或比重的一種統(tǒng)計方法。這些組成部分稱為這一總體的“組”。按照每組標志表現(xiàn)的多少,統(tǒng)計分組可以分成單項式分組和組距式分組。1單項式分組一個變量值作為一組,稱為單項式
33、分組,一般適用于離散型變量且變量變動不大的場合。例如,如果考試成績以五分制計算,則全體學生的成績可以分為六組,即5分、4分、3分、2分、1分、0分,如表4-1所示。組別人數(shù)5分2304分7603分13892分3401分790分2合計2800表4-1 單項式分組1.1 數(shù)字通信系統(tǒng)的基本概念2組距式分組以一個區(qū)間作為一組,稱為組距式分組,一般適用于連續(xù)型變量或離散數(shù)據較多的場合。組距式分組又可以分成等距分組和不等距分組。例如,如果學生的成績以百分制計算,則全體學生的成績可以采用等距分組分成10組,如表4-2所示;也可以采用不等距分組分成5組,如表4-3所示。4組別人數(shù)01001020520301
34、83040574050905060250607012107080102080901189010032表4-2 等距分組組別人數(shù)40分以下804060分3406070分12107080分102080分以上150表4-3 不等距分組對于某一個組(a,b),我們稱a為該組的下限,b為該組的上限;上限與下限之差(b-a)叫組距, 叫組中值。組中值未必是該組數(shù)據的平均值,但由于其計算簡單,常作為該組的代表值。采用組距式分組一般經過以下幾個步驟。(1)確定組數(shù)。(2)確定各組的組距。(3)統(tǒng)計各組的頻數(shù)。3次數(shù)分布在統(tǒng)計分組的基礎上,將總體中所有單位按組歸類整理,形成總體中各單位數(shù)在各組間的分配,叫次數(shù)分
35、布。分配在各組的單位數(shù)叫頻數(shù)。各組頻數(shù)與總頻數(shù)的比值叫頻率或比率。各頻率之和為1或100%。各種不同性質的總體都有著特殊的次數(shù)分布,概括起來,主要有鐘形分布、U形分布和J形分布。(1)鐘形分布當次數(shù)分布出現(xiàn)兩端次數(shù)較少、中間次數(shù)較多的狀態(tài)時,所繪制的曲線就像一口鐘,所以叫鐘形分布。鐘形分布有對稱分布和非對稱分布兩種。對稱分布的特征是中間變量值分布的次數(shù)最多,兩側變量值隨著與中間變量值距離的增大而逐漸減少,并且圍繞中心變量值兩端呈對稱分布,即為正態(tài)分布,如圖4-1所示。圖4-1 正態(tài)分布在非對稱的鐘形分布中,又分左偏分布和右偏分布兩種。左偏分布的平均數(shù)在峰值的左邊,右偏分布的平均數(shù)在峰值的右邊,
36、如圖4-2和圖4-3所示。圖4-2 左偏分布 圖4-3 右偏分布(2)U形分布當次數(shù)分布出現(xiàn)兩端次數(shù)較多,靠近中間次數(shù)較少的狀態(tài)時,所繪制出來的曲線如同英文字母“U”字一樣,所以叫U形分布,如圖4-4所示。圖4-4 U形分布(3)J形分布J形分布有兩種,一種是正J形分布,另一種是反J形分布。當次數(shù)隨著變量的增大而增多時,繪制的曲線圖就像英文字母“J”,所以叫正J形分布,如圖4-5所示。當次數(shù)隨著變量的增大而減少時,繪制的曲線圖就如反寫的英文字母“J”,所以叫反J形分布,如圖4-6所示。 圖4-5 正J形分布圖4-6 反J形分布4.1.2 利用“數(shù)據透視表”分組數(shù)據透視表可以將Excel數(shù)據庫中
37、的數(shù)據進行分組,建立各種形式的交叉數(shù)據列表。數(shù)據透視表將篩選和分類匯總等功能結合在一起,可根據不同需要以不同方式查看數(shù)據。插入透視表的主要步驟如下。(1)單擊數(shù)據區(qū)域的任意一個單元格,再選擇“插入”|“數(shù)據透視表”命令。(2)如果第一步按前面的要求做了,那這一步打開的“創(chuàng)建數(shù)據透視表”對話框中就會自動選擇所有的數(shù)據區(qū)域,透視表的位置默認為“新工作表”,如圖4-7所示。如果不想更改透視表的位置,只需單擊“確定”按鈕即可。圖4-7 確定要分析的數(shù)據及透視表放置位置(3)將分組標志(Excel中叫“字段”)拖到“行標簽”“列標簽”或“報表篩選”處(首選“行標簽”,其次是“列標簽”,盡量不要拖到“報表
38、篩選”),將要統(tǒng)計的標志(字段)全部拖到“數(shù)值”處,如圖4-8所示。圖4-8 確定分組標志及統(tǒng)計標志如果統(tǒng)計是品質標志,統(tǒng)計方式默認為“計數(shù)”;如果統(tǒng)計的是數(shù)量標志,統(tǒng)計方式默認為“求和”。如果要修改統(tǒng)計方式,可以單擊右邊的下三角形,在彈出的列表框中選擇“值字段設置”命令,如圖4-9所示,然后在“值字段設置”對話框中修改統(tǒng)計方式,如圖4-10所示。圖4-9 修改值字段設置 圖4-10 修改統(tǒng)計方式例1:打開工作簿“數(shù)據分組.xlsx”,利用數(shù)據透視表功能統(tǒng)計“一月銷售記錄”工作表中每種商品的總銷售額。(1)單擊“一月銷售記錄”工作表數(shù)據區(qū)域的任意一個單元格,再選擇“插入”|“數(shù)據透視表”命令,
39、打開“創(chuàng)建數(shù)據透視表”對話框,里面自動選擇了要分析的數(shù)據為“一月銷售記錄!$A$1:$C$531”,透視表的位置為“新工作表”,如圖4-11所示。圖4-11 確定要分析的數(shù)據及透視表放置位置(2)將“銷售商品”拖至“行標簽”處,將“銷售額”拖至“數(shù)值”處,即得到每種商品的總銷售額,如圖4-12所示。圖4-12 統(tǒng)計每種商品的總銷售額例2:將工作簿“數(shù)據分組.xlsx”中的“2015年銷售記錄”工作表的數(shù)據根據“日期”字段按季度分組,并統(tǒng)計每個季度的“成交商品數(shù)”。(1)單擊“2015年銷售記錄”工作表數(shù)據區(qū)域的任意一個單元格,再選擇“插入”|“數(shù)據透視表”命令,打開“創(chuàng)建數(shù)據透視表”對話框。(
40、2)要分析的數(shù)據區(qū)域為“2015年銷售記錄!$A$1:$F$363”,透視表的位置為“新工作表”,如圖4-13所示。圖4-13 要分析的數(shù)據及透視表放置位置(3)將“日期”拖到“行標簽”處,將“成交商品數(shù)”拖到“數(shù)值”處,如圖4-14所示。圖4-14 按日期分組統(tǒng)計成交商品數(shù)(4)在透視表的“行標簽”下任意單元格上單擊鼠標右鍵,在彈出的快捷菜單中選擇“創(chuàng)建組”命令,如圖4-15所示。(5)在隨后打開的“分組”對話框中選擇“步長“為“季度”,如圖4-16所示。圖4-15 創(chuàng)建組圖4-16 按季度分組(6)單擊“確定”按鈕,統(tǒng)計結果如圖4-17所示。圖4-17 各季度的成交商品數(shù)例3:將工作簿“數(shù)
41、據分組.xlsx”中的“商品詳情”工作表數(shù)據按“單價”進行等距分組(組距為50),統(tǒng)計各組的“點擊次數(shù)”。(1)單擊“商品詳情”工作表數(shù)據區(qū)域的任意一個單元格,再選擇“插入”|“數(shù)據透視表”命令,將“單價”拖至“行標簽”處,將“點擊次數(shù)”拖至“數(shù)值”處,如圖4-18所示。圖4-18 按單價分組統(tǒng)計點擊次數(shù)(2)在透視表的“行標簽”下任意單元格上單擊鼠標右鍵,在彈出的快捷菜單中選擇“創(chuàng)建組”命令,如圖4-19所示。(3)修改起始值為100,終止值為400,步長為50,如圖4-20所示。圖4-19 創(chuàng)建組圖4-20 修改起始值、終止值、步長注意:當各組的上下限互不相等時,各組是既含下限又含上限的;
42、但當前一組的上限與后一組的下限相同時,數(shù)據透視表統(tǒng)計結果遵循“含下限、不含上限”的原則。4.1.3 利用“數(shù)據分析”之“直方圖”功能統(tǒng)計各組的頻數(shù)利用透視表可以完成對數(shù)據的單項分組和等距分組。如果要對數(shù)據進行不等距分組,透視表就無能為力了,此時可以利用“數(shù)據分析”之“直方圖”功能進行分組。透視表就無能為力了,此時可以利用“數(shù)據分析”之“直方圖”功能進行分組。例:將工作簿“數(shù)據分組.xlsx”中的“數(shù)學成績”工作表的數(shù)據按“40分以下”“4060分”“6070分”“7080分”“80分以上”分成5組,并統(tǒng)計各組的人數(shù)。(1)在F列輸入各組的上限值:40、60、70、80、100,如圖4-21所示
43、。(2)選擇“數(shù)據”|“數(shù)據分析”命令。(3)在“數(shù)據分析”對話框中選擇“直方圖”,如圖4-22所示。 圖4-21 組上限 圖4-22 選擇直方圖(4)“直方圖”對話框中的“輸入區(qū)域”是指要分析的數(shù)據區(qū)域,操作時先單擊該輸入框,再在“數(shù)學成績”工作表中選擇整個D列(在字母D上單擊即可選擇整個D列),這時輸入區(qū)域會自動顯示絕對引用的方式$D:$D;“接收區(qū)域”是指組上限區(qū)域,操作時先單擊該輸入框,再在“數(shù)學成績”工作表中選擇單元格區(qū)域F1:F6,這時接收區(qū)域也會自動顯示絕對引用的方式$F$1:$F$6。因為單元格D1和F1里的數(shù)據是標志,所以下面選中“標志”復選項,如圖4-23所示。圖4-23
44、設置輸入區(qū)域和接收區(qū)域(5)如果選中了“圖表輸出”復選框,還將自動輸出直方圖,如圖4-24所示。圖4-24 直方圖4.1.4 用frequency、countif函數(shù)統(tǒng)計頻數(shù)1frequency函數(shù)frequency函數(shù)的功能就是統(tǒng)計各組的頻數(shù),因此它是一個數(shù)組函數(shù),即它返回的結果不是一個數(shù),而是一組數(shù)。例1:用frequency函數(shù)對“數(shù)學成績(1)”工作表的數(shù)據按“40分以下”“4060分” “6070分”“7080分”“80分以上”進行分組統(tǒng)計。(1)打開“數(shù)學成績(1)”工作表,在F2:F6中輸入各組的上限:40、60、70、80、100。選擇區(qū)域G2:G6,用于放統(tǒng)計結果,如圖4-2
45、5所示。圖4-25 選擇放置結果的單元格區(qū)域(2)插入frequency函數(shù)。(3)在frequency函數(shù)參數(shù)對話框中,在第一個輸入框中選擇D列(結果顯示D:D);在第2個輸入框中選擇組上限區(qū)域(F1:F6),如圖4-26所示。(4)按Ctrl+Shift+Enter組合鍵確認,結果如圖4-27所示。圖4-26 frequency函數(shù)參數(shù)圖4-27 統(tǒng)計結果2countif函數(shù)countif函數(shù)的功能是統(tǒng)計滿足一定條件的單元格個數(shù),使用格式為:countif(單元格區(qū)域,條件)。例2:用countif函數(shù)對“數(shù)學成績(2)”工作表的數(shù)據按“40分以下”“4060分”“6070分”“7080分
46、”“80分以上”進行分組統(tǒng)計。使用的公式和結果如圖4-28所示。圖4-28 用countif統(tǒng)計區(qū)間的頻數(shù) 4.2 描述性統(tǒng)計描述性統(tǒng)計主要用于計算總體的總量指標、平均指標、中位數(shù)、眾數(shù)、極差、方差、標準差、標準差系數(shù)等。4.2.1 總量指標和平均指標根據總體反應的具體內容,總量指標劃分為標志總量和單位總量。(1)標志總量:總體某一標志的總和xi。(2)單位總量:總體所包含個體數(shù)的多少。如果收集的數(shù)據是一條一條的原始記錄,而且是精確的數(shù)據,則用sum函數(shù)計算標志總量,用count函數(shù)計算單位總量,用average函數(shù)計算平均指標。例1:打開文件“描述性統(tǒng)計.xlsx”中的“捐款資料”工作表,計
47、算總捐款金額、總捐款人數(shù)、人均捐款金額。圖4-29 計算標志總量圖4-30 計數(shù) 圖4-31 計算單位總量圖4-32 用函數(shù)average計算算數(shù)平均數(shù)例2:學院新生入學年齡統(tǒng)計表如圖4-33所示,請統(tǒng)計新生的平均年齡。數(shù)據文件見“描述性統(tǒng)計.xlsx”中的“平均年齡”工作表。圖4-33 年齡統(tǒng)計表圖4-34 增加“xf”列和“合計”行圖4-35 計算xf的值 圖4-36 計算f 圖4-37 計算xf在Excel中,函數(shù)sumproduct的功能是計算兩組或多組數(shù)據的乘積之和。圖4-38 計算平均年齡本例可用函數(shù)sumproduct直接計算xf,操作如下。(1)插入sumproduct函數(shù),在
48、“函數(shù)參數(shù)”對話框的第一個參數(shù)中選擇單元格區(qū)域A3:A7,在第二個參數(shù)中選擇單元格區(qū)域B3:B7,如圖4-39所示。圖4-39 sumproduct函數(shù)參數(shù)設置(2)所以,平均年齡的計算可以直接用公式“=sumproduct(A3:A7,B3:B7)/sum(B3:B7)”完成,不需要計算xf、f、xf,如圖4-40所示。圖4-40 用sumproduct和sum計算平均年齡例3:IT企業(yè)對IT人才中高級程序員的素質要求也越來越高,其中包括團隊意識與協(xié)作能力、文檔處理與測試能力、規(guī)范化代碼編寫能力、需求理解與分析能力、模塊化思維能力、學習與總結能力、項目設計與流程處理能力、整體項目評估能力、團
49、隊組織與管理能力等。有一名某高級程序員叫張三,300名同事對他的評價投票資料如圖4-41所示,請計算他各個項目的平均得分。數(shù)據文件為工作簿“描述性統(tǒng)計.xlsx”中的“程序員測評”工作表。圖4-41 評價投票資料在Excel中的操作如下。(1)在單元格G3中使用公式“=(B3*100+C3*85+D3*65+E3*45+F3*30)/300”計算“團隊意識與協(xié)作”的平均得分,如圖4-42所示。(2)雙擊G3的填充柄,即可得到其他項目的平均得分。圖4-42 “團隊意識與協(xié)作”的平均得分例4:某次考試成績分組統(tǒng)計情況如圖4-43所示,請計算此次考試的平均分。數(shù)據文件為工作簿“描述性統(tǒng)計.xlsx”
50、中的“平均成績”工作表。圖4-43 考試成績分組統(tǒng)計(1)計算各組的組中值x,并將每組的組中值直接錄入到C列,如圖4-44所示。(2)計算xf、f、xf,并用公式“=D7/B7”計算平均得分66.9,結果如圖4-45所示。圖4-44 計算組中值x圖4-45 計算平均分例5:打開文件“描述性統(tǒng)計.xlsx”中的“月薪調查”工作表,如圖4-46所示,請計算平均月薪。圖4-46 月薪調查數(shù)據圖4-47 對數(shù)據分組圖4-48 調整組別順序圖4-49 復制粘貼“值”圖4-50 計算結果4.2.2 中位數(shù)和眾數(shù)中位數(shù)是指將總體各單位的標志值按大小順序排列時位于數(shù)列中間位置的數(shù)據。如果有偶數(shù)個數(shù)據,則取中間
51、兩個數(shù)的平均數(shù)。中位數(shù)用字母Me(median)表示。眾數(shù)是指總體中出現(xiàn)次數(shù)最多的數(shù)據,用字母Mo(mode)表示。1用函數(shù)median計算中位數(shù)Me例1:打開文件“描述性統(tǒng)計.xlsx”的“捐款資料”工作表,計算“捐款金額”的中位數(shù)。用函數(shù)median計算中位數(shù)Me,如圖4-52所示。圖4-51 有異常數(shù)據的散點圖圖4-52 用函數(shù)median計算中位數(shù)2用函數(shù)mode計算眾數(shù)Mo例2:打開文件“描述性統(tǒng)計.xlsx”的“捐款資料”工作表,計算“捐款金額”的眾數(shù),如圖4-53所示。圖4-53 用函數(shù)mode計算眾數(shù)4.2.3 極差、方差、標準差和標準差系數(shù)有一組數(shù)據:x1、x2、x3、x4、
52、 極差=最大值-最小值; 方差= ; 標準差= ; 標準差系數(shù)= 。這幾個指標用于描述數(shù)據的差異程度和離散程度。指標值越大,說明數(shù)據的離散程度越大,即數(shù)據波動幅度大,平均值的代表性越差;指標值越小,說明數(shù)據越平穩(wěn),波動幅度小,平均值的代表性越好。如果直接從數(shù)學角度用數(shù)學公式的方法來計算方差和標準差是比較煩瑣的。在Excel中,用函數(shù)計算要方便得多,如圖4-54圖4-57所示。圖4-54 用函數(shù)max和min的差計算極值圖4-55 用函數(shù)var.p計算方差圖4-56 用函數(shù)stdev.p計算標準差 極差R=max()-min(); 方差2=var.p(); 標準差=stdev.p(); 標準差系
53、數(shù) 。圖4-57 計算標準差系數(shù)4.2.4 利用“數(shù)據分析”之“描述統(tǒng)計”功能計算描述性指標例:打開文件“描述性統(tǒng)計.xlsx”的“捐款資料”工作表,用“描述統(tǒng)計”的方法統(tǒng)計“捐款金額”的各項描述性統(tǒng)計指標。(1)單擊“數(shù)據”|“數(shù)據分析”按鈕,打開“數(shù)據分析”對話框,選擇“描述統(tǒng)計”功能,單擊“確定”按鈕,如圖4-58所示。圖4-58 “數(shù)據分析”之“描述統(tǒng)計”(2)在“描述統(tǒng)計”對話框中設置輸入區(qū)域(可選擇整列)、輸出區(qū)域(僅選擇起點),如圖4-59所示。(3)單擊“確定”按鈕,結果如圖4-60所示。圖4-59 描述統(tǒng)計設置圖4-60 描述統(tǒng)計結果描述統(tǒng)計”結果中其他指標的含義或公式如下。
54、 標準誤差: 。 峰度:衡量數(shù)據離群度的指標。 偏度:衡量數(shù)據偏斜平均數(shù) 的方向和程度。 區(qū)域:極值。 求和:標志總量。 觀測數(shù):單位總量。 4.3 動態(tài)數(shù)列的分析與預測動態(tài)數(shù)列是指將總體在不同時間上的指標數(shù)值按時間先后排列而成的序列,又叫時間數(shù)列。為了方便起見,動態(tài)數(shù)列經常以表格的形式展現(xiàn),如表4-4所示。動態(tài)數(shù)列有兩個基本要素:時間t和水平值a。時間t0t1t2t3指標數(shù)值(水平值)a0a1a2a3表4-4 動態(tài)數(shù)列的形式4.3.1 動態(tài)數(shù)列的速度指標動態(tài)數(shù)列常用的速度指標有發(fā)展速度、總發(fā)展速度、增長速度、平均發(fā)展速度和平均增長速度。1發(fā)展速度研究動態(tài)數(shù)列時,如果要將兩個不同時期的水平值進
55、行對比,那么分析研究時期的水平值叫報告期水平;對比基礎時期的水平值叫基期水平。例1:文件“動態(tài)數(shù)列分析.xlsx”的“發(fā)展速度1”工作表中列出某企業(yè)2010 2015年固定資產投資情況如圖4-61所示,請計算歷年的定基發(fā)展速度、環(huán)比發(fā)展速度。(1)計算定基發(fā)展速度(2)計算環(huán)比發(fā)展速度圖4-61 某企業(yè)20102015年固定資產投資情況2總發(fā)展速度總發(fā)展速度簡稱總速度。顧名思義,總發(fā)展速度就是一段時間以來總的發(fā)展速度,在數(shù)值上應等于最終的水平值除以最初的水平值,即 。例2:已知20092015年淘寶“雙11”銷量統(tǒng)計資料如圖4-63所示,請計算20092015年的總發(fā)展速度。數(shù)據文件為“動態(tài)數(shù)
56、列分析.xlsx”的“發(fā)展速度2”工作表。圖4-63 淘寶“雙11”銷量統(tǒng)計例3:已知某公司20062015年的發(fā)展速度如圖4-64所示,請計算10年內的總發(fā)展速度。數(shù)據文件為“動態(tài)數(shù)列分析.xlsx”的“發(fā)展速度3”工作表。圖4-64 某公司20062015年的發(fā)展速度該例可用公式“=product(B3:K3)”計算10年的總發(fā)展速度,如圖4-65所示。所以在例1中,2015年的定基發(fā)展速度H4就是總發(fā)展速度,當然也可以用公式“=product(D5:H5)”計算總發(fā)展速度,如圖4-66所示。圖4-65 用product函數(shù)計算總發(fā)展速度圖4-66 計算總發(fā)展速度3平均發(fā)展速度平均發(fā)展速度
57、 。數(shù)學上,我們把n個數(shù)的乘積開n次方根,叫作這n個數(shù)的幾何平均數(shù)。所以,平均發(fā)展速度=環(huán)比發(fā)展速度的幾何平均數(shù)。在Excel中,有一個函數(shù)可以計算n個數(shù)的幾何平均數(shù),就是geomean函數(shù),即平均發(fā)展速度=geomean(環(huán)比發(fā)展速度)。在Excel中,用公式“=(B5)(1/6)”或=power(B5,1/6)計算平均發(fā)展速度,如圖4-67和圖4-68所示。圖4-67 計算平均發(fā)展速度(一)圖4-68 計算平均發(fā)展速度(二)例3中的平均發(fā)展速度計算公式則應該用“=geomean(B3:K3)”,如圖4-69所示。圖4-69 計算平均發(fā)展速度(三)4增長速度增長速度= =發(fā)展速度-1。根據基
58、期的不同,增長速度也分定基、環(huán)比、同比3種。例4:2014年1月至2015年12月京東商城空氣凈化器的銷量統(tǒng)計資料(銷量前十大品牌TPO10)如圖4-70所示,請計算每個月的“發(fā)展速度”和“增長速度”。數(shù)據文件為“動態(tài)數(shù)列分析.xlsx”的“發(fā)展速度4”工作表。圖4-70 京東商城空氣凈化器的銷量統(tǒng)計資料圖4-71 京東商城空氣凈化器銷售量的速度指標例5:已知某企業(yè)的經濟效益連年增長,2013年是2012年的110%,2014年是2013年的120%,2015年是2014年的115%。計算3年來年平均增長速度是多少。數(shù)據文件為“動態(tài)數(shù)列分析.xlsx”的“平均增長速度1”工作表。例6:已知某公
59、司20112015年固定資產投資額環(huán)比增長速度資料表如圖4-72所示,請計算5年的平均增長速度。數(shù)據文件為“動態(tài)數(shù)列分析.xlsx”的“平均增長速度2”工作表。圖4-72 某公司20112015年固定資產投資額環(huán)比增長速度資料表正確解法是:先利用環(huán)比增長速度計算環(huán)比發(fā)展速度,再利用環(huán)比發(fā)展速度計算平均發(fā)展速度,再用平均發(fā)展速度減1即可,如圖4-73所示。圖4-73 計算環(huán)比增長速度4.3.2 同期平均法預測總體隨著季節(jié)的變動而引起的比較有規(guī)則的波動叫作季節(jié)變動。除了由季節(jié)變動引起的數(shù)據波動外,還有可能由月份引起的數(shù)據波動,對于這類數(shù)據的分析,我們常用同期平均法。同期平均法就是先根據動態(tài)數(shù)列求出
60、同期(季或月)平均數(shù),再計算各期的季節(jié)指數(shù),最后根據季節(jié)指數(shù)預測下一期的數(shù)據。具體的計算過程為:(1)先根據歷年(3年以上)資料求出同期(季或月)平均數(shù);(2)求季節(jié)指數(shù)= 100%;(3)計算各期的預測值=上年的平均水平各期的季節(jié)指數(shù)。例:某商場20122015年4年每月的空調銷售量資料如圖4-74所示,用同期平均法計算各月的季節(jié)指數(shù),并預測2016年每月的銷售量。數(shù)據文件為“動態(tài)數(shù)列分析.xlsx”中的“同期平均法”工作表。圖4-74 某商場空調銷售量資料4.3.3 移動平均趨勢剔除法預測如果動態(tài)數(shù)列的發(fā)展水平既有規(guī)律性的季節(jié)變化,又有明顯的長期趨勢,最好采用移動平均趨勢剔除法,排除不規(guī)則
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 垃圾分類管理制度范文
- 城市更新項目外墻腳手架實施方案
- VC風險投資基金合同
- 網絡設備采購及安裝合同
- 項目安全管理員職責樣本(2篇)
- 礦井防治水工作管理制度(2篇)
- 機動車翻斗車安全操作規(guī)程范文(2篇)
- 教科室管理制度例文(2篇)
- 行政單位財務職責分工范文(2篇)
- 2024年銀行柜員年終工作總結標準范文(2篇)
- 初中數(shù)學 單項式教學設計
- X62W萬能銑床電氣控制
- 常用普通螺紋加工的中徑和頂徑極限偏差快速查詢表
- 供應商管理的目標及戰(zhàn)略
- GB 190-2009 危險貨物包裝標志(高清版)
- 商品進銷存明細表
- 鄂爾多斯盆地煤礦分布圖2014
- 銷售人員心態(tài)培訓-銷售人員心態(tài)培訓
- 高中物理知識點講解-高中物理中常用的數(shù)學知識
- ACOG指南:妊娠期高血壓疾病指南(專家解讀)
- 高等數(shù)學D7_5可降階高階微分方程
評論
0/150
提交評論