華東師范大學(xué)《探索性數(shù)據(jù)分析》2021-2022學(xué)年第一學(xué)期期末試卷_第1頁
華東師范大學(xué)《探索性數(shù)據(jù)分析》2021-2022學(xué)年第一學(xué)期期末試卷_第2頁
華東師范大學(xué)《探索性數(shù)據(jù)分析》2021-2022學(xué)年第一學(xué)期期末試卷_第3頁
華東師范大學(xué)《探索性數(shù)據(jù)分析》2021-2022學(xué)年第一學(xué)期期末試卷_第4頁
華東師范大學(xué)《探索性數(shù)據(jù)分析》2021-2022學(xué)年第一學(xué)期期末試卷_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

裝訂線裝訂線PAGE2第1頁,共3頁華東師范大學(xué)《探索性數(shù)據(jù)分析》

2021-2022學(xué)年第一學(xué)期期末試卷院(系)_______班級_______學(xué)號_______姓名_______題號一二三四總分得分一、單選題(本大題共25個(gè)小題,每小題1分,共25分.在每小題給出的四個(gè)選項(xiàng)中,只有一項(xiàng)是符合題目要求的.)1、在對一組數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析時(shí),發(fā)現(xiàn)其中一個(gè)數(shù)據(jù)明顯偏離其他數(shù)據(jù)。在這種情況下,以下哪種處理方法比較恰當(dāng)?()A.直接刪除該數(shù)據(jù)B.保留該數(shù)據(jù),不做特殊處理C.檢查數(shù)據(jù)收集過程,若無誤則保留D.用平均值替代該數(shù)據(jù)2、某企業(yè)生產(chǎn)的產(chǎn)品重量服從正態(tài)分布,均值為500g,標(biāo)準(zhǔn)差為20g。現(xiàn)從生產(chǎn)線上隨機(jī)抽取25個(gè)產(chǎn)品,其平均重量在490g至510g之間的概率為()A.0.6826B.0.9544C.0.9973D.13、在進(jìn)行統(tǒng)計(jì)建模時(shí),如果數(shù)據(jù)存在嚴(yán)重的共線性問題,以下哪種方法可以用于解決?()A.主成分回歸B.偏最小二乘回歸C.逐步回歸D.以上都是4、在分析兩個(gè)變量之間的關(guān)系時(shí),如果散點(diǎn)圖呈現(xiàn)出曲線的趨勢,應(yīng)該采用哪種方法來擬合?()A.線性回歸B.多項(xiàng)式回歸C.邏輯回歸D.嶺回歸5、在一項(xiàng)關(guān)于股票收益率的研究中,收集了過去5年的數(shù)據(jù)。要檢驗(yàn)收益率是否具有自相關(guān)性,應(yīng)采用哪種方法?()A.游程檢驗(yàn)B.單位根檢驗(yàn)C.Durbin-Watson檢驗(yàn)D.偏自相關(guān)函數(shù)檢驗(yàn)6、在對一組數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析時(shí),發(fā)現(xiàn)數(shù)據(jù)存在偏態(tài)分布。此時(shí),以下哪個(gè)統(tǒng)計(jì)量能更好地反映數(shù)據(jù)的集中趨勢?()A.算術(shù)平均數(shù)B.幾何平均數(shù)C.中位數(shù)D.眾數(shù)7、在構(gòu)建統(tǒng)計(jì)模型時(shí),如果自變量之間存在高度的線性相關(guān),可能會導(dǎo)致什么問題?()A.欠擬合B.過擬合C.模型不穩(wěn)定D.以上都有可能8、為研究某種新型藥物對治療某種疾病的效果,將患者隨機(jī)分為兩組,一組使用新藥,另一組使用傳統(tǒng)藥物。經(jīng)過一段時(shí)間治療后,比較兩組患者的康復(fù)情況。這是一種什么類型的統(tǒng)計(jì)研究?()A.觀測性研究B.實(shí)驗(yàn)性研究C.描述性研究D.相關(guān)性研究9、在一項(xiàng)質(zhì)量控制中,需要對一批產(chǎn)品的次品率進(jìn)行估計(jì)。抽取了300個(gè)產(chǎn)品,發(fā)現(xiàn)有15個(gè)次品。計(jì)算這批產(chǎn)品次品率的90%置信區(qū)間是?()A.[0.02,0.08]B.[0.03,0.07]C.[0.04,0.06]D.[0.01,0.09]10、某公司想了解其產(chǎn)品在不同地區(qū)的銷售情況,收集了各地區(qū)的銷售額和銷售量數(shù)據(jù)。為比較不同地區(qū)銷售業(yè)績的差異,應(yīng)采用以下哪種統(tǒng)計(jì)量?()A.均值B.中位數(shù)C.方差D.標(biāo)準(zhǔn)差11、某公司的銷售數(shù)據(jù)呈現(xiàn)明顯的季節(jié)性波動。為了進(jìn)行預(yù)測,使用了季節(jié)指數(shù)法。如果春季的季節(jié)指數(shù)為1.2,意味著什么?()A.春季的銷售額比平均水平高20%B.春季的銷售額比平均水平高120%C.春季的銷售額比平均水平低20%D.春季的銷售額比平均水平低80%12、對兩個(gè)總體的均值進(jìn)行比較時(shí),如果兩個(gè)總體的方差未知但相等,應(yīng)該使用哪種檢驗(yàn)方法?()A.Z檢驗(yàn)B.t檢驗(yàn)C.F檢驗(yàn)D.卡方檢驗(yàn)13、在研究兩個(gè)變量之間的關(guān)系時(shí),發(fā)現(xiàn)其中一個(gè)變量存在測量誤差。為了糾正這種誤差對分析結(jié)果的影響,應(yīng)采用以下哪種方法?()A.工具變量法B.加權(quán)最小二乘法C.嶺回歸D.以上都可以14、某地區(qū)的氣溫?cái)?shù)據(jù)服從正態(tài)分布,均值為20℃,標(biāo)準(zhǔn)差為5℃。隨機(jī)抽取一天,其氣溫在15℃到25℃之間的概率約為多少?()A.0.68B.0.95C.0.99D.無法確定15、某學(xué)校對學(xué)生的身高和體重進(jìn)行了測量,想要了解身高和體重之間的關(guān)系是否為線性關(guān)系,可以通過繪制以下哪種圖形來判斷?()A.散點(diǎn)圖B.折線圖C.直方圖D.箱線圖16、在進(jìn)行假設(shè)檢驗(yàn)時(shí),如果p值小于給定的顯著性水平,我們應(yīng)該做出怎樣的決策?()A.拒絕原假設(shè)B.接受原假設(shè)C.無法確定D.重新進(jìn)行檢驗(yàn)17、在分析股票價(jià)格的波動時(shí),發(fā)現(xiàn)其收益率序列存在自相關(guān)現(xiàn)象。為消除自相關(guān),可采用以下哪種方法?()A.差分法B.移動平均法C.指數(shù)平滑法D.以上都可以18、對于一個(gè)包含多個(gè)分類變量的數(shù)據(jù)集,想要了解不同分類變量之間的相關(guān)性,應(yīng)該使用哪種統(tǒng)計(jì)方法?()A.卡方檢驗(yàn)B.相關(guān)系數(shù)C.方差分析D.以上都不是19、在對兩組數(shù)據(jù)進(jìn)行比較時(shí),第一組數(shù)據(jù)的方差為25,第二組數(shù)據(jù)的方差為16。哪一組數(shù)據(jù)的離散程度更大?()A.第一組B.第二組C.兩組相同D.無法確定20、為研究某城市居民的消費(fèi)水平與收入水平之間的關(guān)系,隨機(jī)抽取了500個(gè)家庭進(jìn)行調(diào)查。如果要建立消費(fèi)水平關(guān)于收入水平的回歸方程,首先需要判斷兩者之間是否存在線性關(guān)系,應(yīng)進(jìn)行以下哪種檢驗(yàn)?()A.t檢驗(yàn)B.F檢驗(yàn)C.相關(guān)系數(shù)檢驗(yàn)D.以上都不對21、為檢驗(yàn)一批產(chǎn)品是否符合質(zhì)量標(biāo)準(zhǔn),從這批產(chǎn)品中隨機(jī)抽取一定數(shù)量進(jìn)行檢驗(yàn),這種抽樣方式被稱為?()A.簡單隨機(jī)抽樣B.系統(tǒng)抽樣C.分層抽樣D.整群抽樣22、在進(jìn)行假設(shè)檢驗(yàn)時(shí),如果備擇假設(shè)是單側(cè)的,那么拒絕域會在分布的哪一側(cè)?()A.左側(cè)或右側(cè)B.僅左側(cè)C.僅右側(cè)D.兩側(cè)23、在一項(xiàng)關(guān)于股票價(jià)格波動的研究中,收集了過去一年中每天的收盤價(jià)。要分析價(jià)格的波動性,應(yīng)該計(jì)算什么統(tǒng)計(jì)量?()A.均值B.方差C.標(biāo)準(zhǔn)差D.中位數(shù)24、為研究某種藥物的療效,將患者隨機(jī)分為實(shí)驗(yàn)組和對照組,實(shí)驗(yàn)組服用該藥物,對照組服用安慰劑。經(jīng)過一段時(shí)間治療后,對兩組患者的癥狀進(jìn)行評估。若要比較兩組患者癥狀改善情況是否有差異,應(yīng)采用的非參數(shù)檢驗(yàn)方法是()A.符號檢驗(yàn)B.秩和檢驗(yàn)C.游程檢驗(yàn)D.以上都可以25、為研究不同地區(qū)的經(jīng)濟(jì)發(fā)展水平,收集了各地區(qū)的GDP、人均收入等數(shù)據(jù)。若要對這些地區(qū)進(jìn)行分類,可采用哪種統(tǒng)計(jì)方法?()A.判別分析B.聚類分析C.主成分分析D.因子分析二、簡答題(本大題共4個(gè)小題,共20分)1、(本題5分)詳細(xì)闡述如何利用統(tǒng)計(jì)方法分析不同價(jià)格策略對市場份額的影響?需要考慮哪些因素和采用哪些分析方法?2、(本題5分)在進(jìn)行一項(xiàng)社會調(diào)查時(shí),需要分析調(diào)查數(shù)據(jù)的敏感性。論述如何使用隨機(jī)化回答技術(shù)來保護(hù)被調(diào)查者的隱私,并說明其原理和應(yīng)用。3、(本題5分)詳細(xì)闡述如何使用卡方檢驗(yàn)來判斷兩個(gè)分類變量之間是否存在關(guān)聯(lián)?并舉例說明其在實(shí)際問題中的應(yīng)用。4、(本題5分)在進(jìn)行統(tǒng)計(jì)分析時(shí),如何處理異常值?請列舉至少兩種方法,并說明其適用情況。三、案例分析題(本大題共5個(gè)小題,共25分)1、(本題5分)一家工廠記錄了不同生產(chǎn)線的產(chǎn)量、質(zhì)量和故障時(shí)間等數(shù)據(jù),分析怎樣利用統(tǒng)計(jì)分析提高生產(chǎn)效率和產(chǎn)品質(zhì)量。2、(本題5分)某航空公司想評估不同航線的客座率和收益情況,收集了航班數(shù)據(jù),怎樣通過統(tǒng)計(jì)分析優(yōu)化航線布局和票價(jià)策略?3、(本題5分)某電商網(wǎng)站分析了不同商品類別的客戶評價(jià)數(shù)據(jù),包括商品質(zhì)量、物流速度、客服服務(wù)等方面的評價(jià)得分。請找出影響客戶整體滿意度的關(guān)鍵因素,并提出改進(jìn)服務(wù)的方向。4、(本題5分)某城市為了改善交通擁堵狀況,對不同時(shí)間段的車流量、道路容量和交通管理措施進(jìn)行了分析。制定交通疏導(dǎo)方案。5、(本題5分)某服裝品牌收集了不同款式服裝的銷售數(shù)據(jù)、流行趨勢和消費(fèi)者反饋等信息,分析應(yīng)如何通過統(tǒng)計(jì)分析進(jìn)行產(chǎn)品設(shè)計(jì)和庫存管理。四、計(jì)算題(本大題共3個(gè)小題,共30分)1、(本題10分)某超市銷售三種品牌的洗發(fā)水,A品牌在過去一個(gè)月內(nèi)銷售了500瓶,價(jià)格為30元/瓶;B品牌銷售了400瓶,價(jià)格為25元/瓶;C品牌銷售了300瓶,價(jià)格為20元/瓶。請計(jì)算這三種品牌洗發(fā)水的加權(quán)平均價(jià)格,并分析價(jià)格對銷售的影響。2、(本題10分)某產(chǎn)品的質(zhì)量指標(biāo)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論