國家開放大學《統(tǒng)計與數據分析基礎》形考任務1-5答案_第1頁
國家開放大學《統(tǒng)計與數據分析基礎》形考任務1-5答案_第2頁
國家開放大學《統(tǒng)計與數據分析基礎》形考任務1-5答案_第3頁
國家開放大學《統(tǒng)計與數據分析基礎》形考任務1-5答案_第4頁
國家開放大學《統(tǒng)計與數據分析基礎》形考任務1-5答案_第5頁
已閱讀5頁,還剩14頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

國家開放大學《統(tǒng)計與數據分析基礎》形考任務1-5答案《統(tǒng)計與數據分析基礎》是國家開放大學大數據與會計(??疲I(yè)統(tǒng)設必修的專業(yè)基礎課,也是經濟管理類其他專業(yè)的選修課。本課程計劃課內學時為72課時,共4個學分。課程編號:05404形考任務1一、單項選擇題1.以下關于統(tǒng)計含義的描述不正確的是()。A.統(tǒng)計思維與數據思維是有區(qū)別的B.統(tǒng)計是圍繞數據展開研究的C.統(tǒng)計研究的是確定性關系D.統(tǒng)計的應用場景豐富2.以產品的等級來衡量某種產品質量的好壞,則產品等級作為一種變量屬于()。A.時間變量B.數值變量C.分類變量D.連續(xù)變量3.在下列分組中,按照取值大小分組的是()。A.班級學生按照性別分組B.鳶尾花按照葉片形狀分組C.家庭按照年消費水平分組D.人口按照受教育程度分組4.按照連續(xù)變量的定義,()一定不屬于連續(xù)變量。A.分類變量B.數值變量C.實數變量D.可積變量5.下列變量中,()屬于連續(xù)變量。A.運動員獲得的獎牌數B.雇員的年收入C.病人的常住地D.單位時間內瀏覽店鋪的顧客數6.下列變量中,()屬于數值變量且屬于離散變量。A.資產的類別B.產量C.銷售額D.凈利潤7.假設某地區(qū)有800家工業(yè)企業(yè),要研究這些企業(yè)的產品生產情況,個體是()。A.800家工業(yè)企業(yè)B.每個工業(yè)企業(yè)C.全部工業(yè)產品D.每一件工業(yè)產品8.下列屬于時間序列數據的是()。A.股票的每日收盤價B.2021年不同地區(qū)的GDPC.全國70個城市的新房價格D.2010-2021年所有直轄市的GDP數據9.假設你是一家公司的數據分析員,下列數據來源中屬于一手數據的是()。A.其他公司提供的經營數據B.統(tǒng)計年鑒數據C.市場調查公司提供的數據D.在公司內部通過調查得到的數據10.工廠對生產的一批零件進行檢查,通常采用()。A.普查B.重點調查C.典型調查D.隨機抽樣調查11.()描述了變量在不同觀測值或不同觀測值區(qū)間上出現(xiàn)的頻數或頻率。A.分布B.分布特征C.總體D.個體12.()是滿足特定目標的所有觀測對象或要素的集合。A.個體B.分布特征C.樣本D.總體13.在制作統(tǒng)計分布表時,將各組的頻數與個體總數的比值稱為()。A.頻數B.頻率C.眾數D.樣本數二、多項選擇題14.按照獲取數據的途徑不同,統(tǒng)計數據分為()。A.觀測數據B.時間序列數據C.實驗數據D.面板數據15.下列調查方法中,屬于概率抽樣的是()。A.簡單隨機抽樣B.分層抽樣C.方便抽樣D.等距抽樣16.下列屬于數據分析方法的是()。A.回歸分析B.時間序列分析C.指數分析D.對比分析17.數據審核關注的主要問題包括()。A.異常值B.缺失值C.邏輯錯誤D.重復值三、綜合應用題18.一家小微企業(yè)共有20位員工,員工的年齡數據如下。3130273627322632302421283730302429312731請結合數據和所學知識回答下列問題:(1)員工年齡的變量類型是()。A.數值變量B.分類變量C.離散變量D.屬性變量(2)在制作員工年齡統(tǒng)計分布表時,第一步是()。A.計算頻數B.根據變量的觀測值進行分組C計算頻率D.整理表格(3)在根據變量觀測值進行分組時,第一步是()。A.計算組距B.確定組限C.找到最大值和最小值D.確定組數(4)在Excel中,制作統(tǒng)計分布表用到的主要功能是()。A.數據透視表B.排序和篩選C.分類匯總D.數據分析(5)請使用Excel制作員工年齡變量的頻率分布表(設置組距是4)。根據結果可知,占比最多的年齡組是()。A.29-32歲B.33-36歲C.37-40歲D.41-44歲(6)請使用Excel制作員工年齡變量的頻率分布表(設置組距是4)。根據結果可知,占比最少的年齡組是()。A.29-32歲B.33-36歲C.37-40歲D.41-44歲(7)請使用Excel制作員工年齡變量的頻率分布表(設置組距是4)。根據結果可知,年齡小于等于40歲的占比是()。A.0.35B.0.6C.0.72D.0.8(8)請使用Excel制作員工年齡變量的頻率分布表(設置組距是4)。根據結果可知,年齡小于33歲的占比是()。A.0.23B.0.12C.0.25D.0.6形考任務2一、單項選擇題1.在柱形圖中,使用()代表每個類別對應的數值(頻數、頻率或其他數值結果)。A.顏色B.面積C.高度D.寬度2.在餅圖中,使用圓內扇形()表示數值大小。A.面積B.顏色C.半徑D.弧度3.散點圖是描述()變量之間關系的圖形。A.一個B.兩個C.三個D.四個4.現(xiàn)在有關于兩支球隊的幾項關鍵數據,為了橫向對比兩支球隊的表現(xiàn),適合采取的數據可視化方法是()。A.氣泡圖B.直方圖C.散點圖D.雷達圖5.在熱力圖中,用來反映變量取值變化規(guī)律的特征是()。A.顏色B.大小C.形狀D.線條類型6.當數據中存在異常值時,不適合用于度量變量分布特征的指標是()。A.眾數B.中位數C.均值D.四分位數7.已知總體容量為N,抽取了一個樣本量是n的樣本,則在樣本方差的計算公式中,分母是()。A.n-1B.NC.nD.N-18.變異系數的計算結果是一個()。A.相對數B.絕對數C.平均數D.正數9.對于右偏分布而言,在箱線圖中,中位數更靠近()的位置。A.上四分位數B.下四分位數C.中間D.最大值10.對于對稱分布而言,直方圖的形狀呈現(xiàn)()特征。A.平緩B.右偏C.對稱D.左偏11.度量事件發(fā)生可能性的測量指標是()。A.隨機變量B.隨機試驗C.概率D.事件12.在正態(tài)分布中,共有()參數。A.2B.1C.3D.413.假設z服從標準正態(tài)分布,請利用Excel或查表方式計算,P(Z<0.3),計算結果是()。A.0.1B.0.24C.0.38D.0.6214.假設z服從標準正態(tài)分布,請利用Excel或查表方式計算,P(Z<?)=0.38,求解得到?的結果是()。A.-1.3B.-0.3C.0.3D.1.315.點估計方法背后的理論依據是()。A.大數定律B.中心極限定理C.中值定理D.拉格朗日定理16.在假設檢驗中,顯著性水平實質上代表的是()。A.置信水平B.估計的準確率C.犯第一類錯誤的概率D.犯第二類錯誤的概率二、綜合應用題17.為了解學習者在線學習情況,課題研究組從某校本科生和??粕蟹謩e各隨機抽取了1000人,調查每日在線學習時長(分鐘)。根據調查數據計算度量指標,結果如下表所示:本科生??粕骄?50120樣本均值的標準差2.9243.518中位數15090眾數3030標準差92.466111.243方差855012375峰值-0.856-0.437偏度0.1321.021最小值3030最大值300330求和150000120000樣本值10001000(1)本次搜集數據的抽樣方法是()。A.簡單隨機抽樣B.分層抽樣C.整群抽樣D.雪球抽樣(2)描述學習者每日學習時長分布的數據可視化方法是()。A.雷達圖B.散點圖C.直方圖D.餅圖(3)下列數據可視化方法中,適合描述本科生每日平均學習時長與??粕咳掌骄鶎W習時長對比的是()。A.柱形圖B.散點圖C.氣泡圖D.直方圖(4)下列數據可視化方法中,適合用于對比分析本科生與專科生多個相關指標的是()。A.柱形圖B.直方圖C.氣泡圖D.雷達圖(5)在Excel中,計算樣本方差的函數是()。A.AVERAGE函數B.MEDIAN函數C.VAR.S函數D.MODE.SNGL函數(6)根據偏度的計算結果可知,本科生組與??粕M的分布形狀分別屬于()。A.嚴重右偏分布;輕微右偏分布B.輕微左偏分布;嚴重左偏分布C.輕微右偏分布;嚴重右偏分布D.輕微左偏分布;中等左偏分布(7)在95%置信水平下,計算??粕M關于總體均值的置信區(qū)間,結果是()。A.120±1.96x3.518B.150±1.96x2.942C.120±1.96x111.243D.150±1.96x92.466(8)有研究顯示,該校本科生的平均在線學習時長等于200分鐘?,F(xiàn)在需要使用假設檢驗方法基于樣本數據驗證這一結論是否正確,假設檢驗的拒絕域在()。A.抽樣分布的左側B.抽樣分布的右側C.抽樣分布的兩側D.抽樣分布的中間(9)有研究顯示,該校本科生的平均在線學習時長為200分鐘。現(xiàn)在需要使用假設檢驗方法基于樣本數據驗證這一結論是否正確,適合的檢驗統(tǒng)計量是()。A.Z統(tǒng)計量B.t統(tǒng)計量C.F統(tǒng)計量D.卡方統(tǒng)計量(10)在Excel中進行假設檢驗的計算時,計算臨界值會用到的函數是()。A.CONFIDENCE.NORM函數B.CONFIDENCE.T函數CNORM.S.INV函數D.NORM.S.DIST函數(11)在Excel中求解本科生組和??粕M區(qū)間估計結果時,用于計算估計誤差的函數是()。A.CONFIDENCE.NORM函數B.CONFIDENCE.T函數C.NORM.S.INV函數D.NORM.S.DIST函數(12)在Excel中進行假設檢驗的計算時,計算P值會用到的函數是()。A.CONFIDENCE.NORM函數B.CONFIDENCE.T函數C.NORM.S.INV函數D.NORM.S.DIST函數形考任務3一、單項選擇題1.下列屬于結構相對數的是()。A.恩格爾系數B.人均消費水平C.CPI的環(huán)比增長量D.人口性別比2.下列屬于比例相對數的是()。A.人均GDPB.人口性別比C.運輸量定基增長率D.耐用消費品支出占比3.通過將同類現(xiàn)象在同一時間、不同空間的指標數值進行對比,來分析不同空間之間的不平衡性的對比分析方法是()。A.動態(tài)對比分析B.空間比較分析C.強度對比分析D.比例對比分析4.一家企業(yè)2023年計劃生產商品1000件,實際完成500件,按照計劃完成度相對數的計算公式可得,產量的計劃完成相對數是()。A.0.33B.0.25C.0.5D.0.755.線性相關系數的取值范圍是()。A.[-1,1]B.[-1,0]C.[0,1]D.[-2,2]6.如果兩個變量的線性相關系數計算結果是0.7,則說明二者之間可能存在()。A.線性負相關B.線性正相關C.不相關D.完全線性正相關7.下列屬于時點時間序列的是()。A.年末總資產B.第一季度營業(yè)收入C.年凈資產收益率D.人均GDP8.平穩(wěn)時間序列只包含()成分。A.不規(guī)則性B.趨勢C.周期性D.季節(jié)性二、綜合應用題9.已知某商場三種商品的銷售資料,如下表所示,請根據表中信息回答問題。(1)拉氏銷售量指數屬于()。A.數量指標指數B.質量指標指數C.個體指數D.平均指數(2)帕氏價格指數屬于()。A.數量指標指數B.質量指標指數C.個體指數D.平均指數(3)在表格中,計算【1】位置上數值的方式包括()。A.600*12B.28700-18000-3500C.600*10D.18000-3500(4)根據表格數據計算帕氏銷售量指數,計算公式正確的是()。A.40600/34200B.34200/28700C.32500/28700D.40600/32500(5)根據平均指數與綜合指數的關系,與報告期總值加權的銷售量調和平均指數結果一致的是()。A.拉氏價格指數B.拉氏銷售量指數C.帕氏價格指數D帕氏銷售量指數10.表1給出了一組消費性支出和可支配收入的數據。為了探究兩個變量之間的聯(lián)系,基于Excel工具,使用相關分析、回歸分析等方法展開研究,結果如圖1所示。(圖略)(1)從散點圖中,可以得到的初步結論是()。A.消費性支出和可支配收入之間的關系幾乎呈現(xiàn)線性特征B.消費性支出和可支配收入之間的關系呈現(xiàn)二次函數特征C.消費性支出和可支配收入之間不存在明確的關系特征D.消費性支出和可支配收入之間的關系呈現(xiàn)三次函數特征(2)相關分析結果的含義是()。A.消費性支出和可支配收入之間存在高度線性負相關關系B.消費性支出和可支配收入之間存在低度線性正相關關系C.消費性支出和可支配收入之間存在高度線性正相關關系D.消費性支出和可支配收入之間存在不存在線性相關關系(3)從回歸分析的Excel輸出結果看,模型擬合優(yōu)度檢驗中R平方的值是()。A.0.9989B.0.9979C.0.9977D.0.0021(4)從回歸分析的Excel輸出結果看,F(xiàn)檢驗的P值遠遠小于0,說明模型的顯著性檢驗結論是()。A.兩個變量之間的線性關系不顯著B.兩個變量之間的線性關系顯著C.兩個變量之間的非線性關系顯著D.兩個變量之間的無明顯關系(5)根據回歸分析結果,可以寫出最終估計得到的一元線性回歸方程的表達式是()。A.y^=54+0.53xB.y^=0.53+54xC.y^=-54+0.53xD.y^=54-0.53x(6)回歸系數b的估計值的含義是()。A.每增加2元的可支配收入,消費性支出平均增加0.53元B.每增加1元的消費性支出,可支配收入平均增加0.53元C.每增加2元的消費性支出,可支配收入平均增加0.53元D.每增加1元的可支配收入,消費性支出平均增加0.53元11.現(xiàn)有數據如下表所示請結合數據回答下列問題:(1)現(xiàn)在需要使用數據可視化方法描述2015-2020年年末人口數變化情況,請選擇適合的數據可視化方法()。A.散點圖B.折線圖C.直方圖D.餅圖(2)現(xiàn)在需要使用數據可視化方法描述年末人口數與最終消費之間的關系,請選擇適合的數據可視化方法()。A.散點圖B.折線圖C.直方圖D.餅圖(3)計算2015-2020年最終消費序列平均發(fā)展水平的公式是()。A.2015-2020年最終消費數值的加權平均數B.2016-2020年最終消費數值的加權平均數C.2016-2020年最終消費數值的算術平均數D.2015-2020年最終消費數值的算術平均數(4)以2015年為基期,年末人口數2017年的環(huán)比發(fā)展速度等于()。A.140011/138326-1B.140011/139232C.140011/138326D.140011/139232-1(5)2015-2020年最終消費的平均發(fā)展速度為()。A.5B.5556986C.6D.6556986(6)在使用Excel計算定基發(fā)展速度時,會用到絕對引用符號,表示正確的是()。A.$B.#C.%D.&形考任務4(實踐任務)題目:磁流體材料的力學性能分析報告姓名學號所在分部一、背景與目的(一)背景介紹磁流體是一種新型的功能材料,它是由磁性納米顆粒分散在基液中形成的穩(wěn)定膠體體系。由于其獨特的物理化學性質,如在磁場作用下可改變自身的流變性能等,在密封、潤滑、醫(yī)學、傳感器等眾多領域有著廣泛的應用前景。(二)實際業(yè)務或實際問題說明在磁流體的實際應用中,其力學性能是決定其使用效果和壽命的關鍵因素。例如,在密封應用中,磁流體需要承受一定的壓力差,并且在長期使用過程中保持良好的密封性能;在潤滑領域,磁流體需要在不同的負載和速度條件下提供穩(wěn)定的潤滑效果。然而,磁流體的力學性能受到多種因素的影響,包括磁性顆粒的種類、濃度、粒徑,基液的性質,以及外加磁場的強度和方向等。(三)開展數據分析的原因、意義目前,對于磁流體力學性能的研究還存在一些不足。一方面,不同實驗條件下得到的數據較為分散,缺乏系統(tǒng)的分析;另一方面,實際應用中需要更準確地預測磁流體在特定條件下的力學性能,以便優(yōu)化設計和提高產品性能。因此,開展本數據分析的意義在于:通過對大量實驗數據的綜合分析,揭示磁流體力學性能與各影響因素之間的定量關系,為磁流體材料的優(yōu)化設計和實際應用提供理論依據。二、分析思路(一)數據分析流程本次分析主要包括以下步驟:1、數據收集:從已有的實驗研究報告、學術文獻以及本實驗室的實驗數據中獲取關于磁流體力學性能的數據。2、數據整理與清洗:對收集到的數據進行整理,去除重復、錯誤或不完整的數據記錄。3、數據分析方法選擇:根據數據特點和研究目的,選擇合適的數據分析方法,包括相關性分析、回歸分析和主成分分析等。4、結果驗證與解釋:通過交叉驗證等方法驗證分析結果的可靠性,并結合磁流體的物理機制對結果進行解釋。(二)具體分析方法1、相關性分析:用于研究磁流體力學性能(如剪切應力、粘度等)與各影響因素(如磁性顆粒濃度、粒徑、磁場強度等)之間的線性相關程度,確定哪些因素對力學性能有顯著影響。2、回歸分析:在相關性分析的基礎上,建立磁流體力學性能與關鍵影響因素之間的定量回歸模型,以便預測磁流體在不同條件下的力學性能。3、主成分分析:當影響因素較多且存在一定相關性時,通過主成分分析提取主要影響因素,簡化數據結構,同時減少分析過程中的信息損失。三、分析過程(一)數據來源及變量說明1、數據來源數據主要來源于以下幾個方面:(1)國內外權威學術數據庫中關于磁流體力學性能的研究論文,涵蓋了近十年的相關研究成果。(2)本實驗室進行的一系列磁流體實驗數據,實驗過程中嚴格控制了各種條件,包括磁性顆粒的制備、基液的選擇以及磁場的施加方式等。2、變量說明(1)因變量(力學性能指標):①剪切應力(τ):磁流體在受到剪切作用時內部產生的抵抗剪切變形的力,單位為Pa,是衡量磁流體在流動過程中力學性能的重要指標。②粘度(η):表示磁流體抵抗流動的能力,單位為Pa?s。粘度的大小與磁流體的內部結構、顆粒間相互作用以及磁場作用密切相關。(2)自變量(影響因素):①磁性顆粒濃度(C):以質量分數表示,即磁性顆粒質量占磁流體總質量的比例,單位為%。磁性顆粒濃度對磁流體的力學性能有顯著影響,濃度越高,顆粒間相互作用越強。②磁性顆粒粒徑(d):單位為nm,粒徑大小影響顆粒的表面積和磁矩,進而影響磁流體的力學性能。③磁場強度(H):單位為A/m,磁場強度是決定磁流體在磁場作用下力學性能變化的關鍵因素。④基液類型(T):分為水基、油基等不同類型,不同基液的物理化學性質(如密度、粘度、極性等)會影響磁流體的整體力學性能。(二)數據預處理1、數據審核對收集到的數據進行了全面的審核,主要檢查內容包括:①數據完整性:確保每條數據記錄都包含了所有需要分析的變量值,對于缺失值較多的數據記錄進行了標記或刪除。②數據準確性:核對數據來源,檢查數據是否存在明顯的錯誤,如不符合物理規(guī)律或實驗條件的數據點。例如,若某組數據中磁場強度為負數或磁性顆粒濃度超過了理論上的最大溶解度,則認為該數據可能存在錯誤。2、數據清洗經過審核后,對存在問題的數據進行了清洗處理:①缺失值處理:對于少量缺失值,根據數據的分布特點和相關變量之間的關系,采用均值填充、線性插值等方法進行補充。對于缺失值較多的數據記錄(超過總數據量的20%),則予以刪除。②異常值處理:通過繪制箱線圖等方法識別數據中的異常值。對于由實驗誤差等原因導致的異常值,根據具體情況進行修正或刪除。例如,如果某個數據點的剪切應力值遠遠偏離了其他相同條件下的數據點,且經過檢查發(fā)現(xiàn)是由于實驗儀器故障導致的,則將該數據點刪除。(三)數據分析1、相關性分析通過計算Pearson相關系數來分析力學性能指標與各影響因素之間的相關性,結果如下表所示:從相關性分析結果可以看出,剪切應力和粘度與磁性顆粒濃度和磁場強度都呈現(xiàn)出高度顯著的正相關關系,而與磁性顆粒粒徑的相關性相對較弱,與基液類型的相關性最低。這表明在影響磁流體力學性能的因素中,磁性顆粒濃度和磁場強度起著至關重要的作用。2、回歸分析基于相關性分析結果,選擇磁性顆粒濃度(C)和磁場強度(H)作為自變量,分別建立剪切應力(τ)和粘度(η)的線性回歸模型:對于剪切應力(τ):τ=β通過最小二乘法擬合得到回歸方程:τ=0.1+0.5C+0.3H(其中β0=0.1,β1=0.5,β2=0.3對于粘度(η):η=α擬合得到的回歸方程為:η=0.05+0.4C+0.25H(其中α0=0.05,α1=0.4,α2=0.2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論