邯鄲職業(yè)技術(shù)學(xué)院《大數(shù)據(jù)分析的Python基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷_第1頁(yè)
邯鄲職業(yè)技術(shù)學(xué)院《大數(shù)據(jù)分析的Python基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷_第2頁(yè)
邯鄲職業(yè)技術(shù)學(xué)院《大數(shù)據(jù)分析的Python基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷_第3頁(yè)
邯鄲職業(yè)技術(shù)學(xué)院《大數(shù)據(jù)分析的Python基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷_第4頁(yè)
邯鄲職業(yè)技術(shù)學(xué)院《大數(shù)據(jù)分析的Python基礎(chǔ)》2023-2024學(xué)年第二學(xué)期期末試卷_第5頁(yè)
已閱讀5頁(yè),還剩1頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

學(xué)校________________班級(jí)____________姓名____________考場(chǎng)____________準(zhǔn)考證號(hào)學(xué)校________________班級(jí)____________姓名____________考場(chǎng)____________準(zhǔn)考證號(hào)…………密…………封…………線…………內(nèi)…………不…………要…………答…………題…………第1頁(yè),共3頁(yè)邯鄲職業(yè)技術(shù)學(xué)院《大數(shù)據(jù)分析的Python基礎(chǔ)》

2023-2024學(xué)年第二學(xué)期期末試卷題號(hào)一二三四總分得分一、單選題(本大題共30個(gè)小題,每小題1分,共30分.在每小題給出的四個(gè)選項(xiàng)中,只有一項(xiàng)是符合題目要求的.)1、已知兩個(gè)變量X和Y的協(xié)方差為20,X的標(biāo)準(zhǔn)差為4,Y的標(biāo)準(zhǔn)差為5,計(jì)算它們的相關(guān)系數(shù)約為多少?()A.0.5B.0.8C.1.0D.1.22、在對(duì)某城市的空氣質(zhì)量進(jìn)行監(jiān)測(cè)時(shí),記錄了每天的PM2.5濃度值。如果要分析PM2.5濃度的季節(jié)性變化,應(yīng)采用哪種統(tǒng)計(jì)圖形?()A.折線圖B.柱狀圖C.箱線圖D.餅圖3、在多元線性回歸分析中,如果自變量之間存在較強(qiáng)的多重共線性,可能會(huì)導(dǎo)致()A.回歸系數(shù)估計(jì)不準(zhǔn)確B.決定系數(shù)增大C.殘差平方和減小D.模型的擬合優(yōu)度提高4、一家市場(chǎng)調(diào)研公司收集了不同城市、不同年齡段消費(fèi)者對(duì)某品牌手機(jī)的滿意度數(shù)據(jù)。若要分析城市和年齡段這兩個(gè)因素對(duì)滿意度是否有交互作用,應(yīng)采用哪種統(tǒng)計(jì)分析方法?()A.簡(jiǎn)單線性回歸B.多重線性回歸C.協(xié)方差分析D.雙因素方差分析5、在對(duì)時(shí)間序列進(jìn)行預(yù)測(cè)時(shí),如果數(shù)據(jù)呈現(xiàn)出明顯的線性趨勢(shì),適合使用的預(yù)測(cè)方法是()A.移動(dòng)平均法B.指數(shù)平滑法C.線性回歸法D.季節(jié)指數(shù)法6、在研究身高與體重的關(guān)系時(shí),收集了50個(gè)人的數(shù)據(jù)。通過計(jì)算得到身高與體重的相關(guān)系數(shù)為0.7,決定系數(shù)為0.49。這意味著()A.身高可以解釋體重49%的變異B.體重可以解釋身高49%的變異C.身高與體重的關(guān)系不顯著D.身高與體重沒有關(guān)系7、在進(jìn)行統(tǒng)計(jì)分析時(shí),如果數(shù)據(jù)存在缺失值,以下哪種處理方法不太合適?()A.直接刪除含缺失值的觀測(cè)B.用均值或中位數(shù)填充C.用隨機(jī)值填充D.基于模型的插補(bǔ)8、某公司為研究產(chǎn)品銷售額與廣告投入之間的關(guān)系,收集了過去10年的相關(guān)數(shù)據(jù)。銷售額(單位:萬(wàn)元)分別為100、120、150、180、200、220、250、280、300、350,廣告投入(單位:萬(wàn)元)分別為20、25、30、35、40、45、50、55、60、70。若采用一元線性回歸分析,估計(jì)的回歸方程為()A.y=5x+50B.y=6x+40C.y=7x+30D.y=8x+209、某市場(chǎng)調(diào)研公司對(duì)消費(fèi)者的品牌忠誠(chéng)度進(jìn)行調(diào)查,結(jié)果用1-10分表示。若要分析不同性別消費(fèi)者的品牌忠誠(chéng)度是否有顯著差異,應(yīng)采用以下哪種參數(shù)檢驗(yàn)方法?()A.獨(dú)立樣本t檢驗(yàn)B.配對(duì)樣本t檢驗(yàn)C.單因素方差分析D.雙因素方差分析10、某電商平臺(tái)為了分析用戶的購(gòu)買行為,對(duì)大量用戶的購(gòu)買記錄進(jìn)行了分析。若要了解用戶購(gòu)買某一類商品的頻率分布情況,以下哪種統(tǒng)計(jì)圖表最為合適?()A.頻數(shù)分布表B.累積頻數(shù)分布表C.直方圖D.箱線圖11、在進(jìn)行方差分析時(shí),如果因素的不同水平之間差異顯著,進(jìn)一步進(jìn)行多重比較時(shí)常用的方法是()A.LSD法B.S-N-K法C.Tukey法D.以上都是12、為比較兩種教學(xué)方法的效果,分別對(duì)兩個(gè)班級(jí)進(jìn)行測(cè)試。甲班30人的平均成績(jī)?yōu)?5分,標(biāo)準(zhǔn)差為10分;乙班25人的平均成績(jī)?yōu)?0分,標(biāo)準(zhǔn)差為8分。要檢驗(yàn)兩個(gè)班級(jí)的平均成績(jī)是否有顯著差異,應(yīng)采用()A.單側(cè)t檢驗(yàn)B.雙側(cè)t檢驗(yàn)C.單側(cè)Z檢驗(yàn)D.雙側(cè)Z檢驗(yàn)13、已知某時(shí)間序列的自相關(guān)函數(shù)在滯后1期的值為0.8,滯后2期的值為0.5。這說明該時(shí)間序列具有什么特征?()A.短期相關(guān)性強(qiáng)B.長(zhǎng)期相關(guān)性強(qiáng)C.無(wú)相關(guān)性D.無(wú)法確定14、在對(duì)兩組數(shù)據(jù)進(jìn)行比較時(shí),第一組數(shù)據(jù)的方差為25,第二組數(shù)據(jù)的方差為16。哪一組數(shù)據(jù)的離散程度更大?()A.第一組B.第二組C.兩組相同D.無(wú)法確定15、在分析數(shù)據(jù)的分布形態(tài)時(shí),除了偏態(tài)系數(shù)和峰態(tài)系數(shù),還可以使用哪種圖形?()A.直方圖B.莖葉圖C.雷達(dá)圖D.以上都可以16、為研究某種新藥物的療效,將患者隨機(jī)分為兩組,一組使用新藥,另一組使用傳統(tǒng)藥物。經(jīng)過一段時(shí)間治療后,測(cè)量?jī)山M患者的康復(fù)時(shí)間。已知新藥組的樣本方差為100天2,傳統(tǒng)藥物組的樣本方差為120天2。若要比較兩組康復(fù)時(shí)間的離散程度,應(yīng)選用哪種指標(biāo)?()A.標(biāo)準(zhǔn)差B.方差C.變異系數(shù)D.極差17、某工廠為了提高產(chǎn)品質(zhì)量,對(duì)生產(chǎn)過程中的多個(gè)環(huán)節(jié)進(jìn)行了改進(jìn)。為評(píng)估改進(jìn)效果,收集了改進(jìn)前后的產(chǎn)品質(zhì)量數(shù)據(jù)。應(yīng)采用哪種統(tǒng)計(jì)方法來(lái)判斷改進(jìn)是否有效?()A.配對(duì)樣本t檢驗(yàn)B.獨(dú)立樣本t檢驗(yàn)C.方差分析D.卡方檢驗(yàn)18、在進(jìn)行假設(shè)檢驗(yàn)時(shí),如果樣本量增大,其他條件不變,會(huì)對(duì)檢驗(yàn)結(jié)果產(chǎn)生什么影響?()A.增大第一類錯(cuò)誤的概率B.增大第二類錯(cuò)誤的概率C.降低第一類錯(cuò)誤的概率D.對(duì)兩類錯(cuò)誤的概率都沒有影響19、對(duì)一組數(shù)據(jù)進(jìn)行分組,組距為5,第一組下限為10。如果數(shù)據(jù)中最小的值為8,那么應(yīng)該將其歸入哪一組?()A.第一組B.第二組C.第三組D.不歸入任何組20、在進(jìn)行假設(shè)檢驗(yàn)時(shí),如果p值小于給定的顯著性水平,我們應(yīng)該做出怎樣的決策?()A.拒絕原假設(shè)B.接受原假設(shè)C.無(wú)法確定D.重新進(jìn)行檢驗(yàn)21、在對(duì)兩個(gè)變量進(jìn)行回歸分析時(shí),得到的回歸方程為y=2x+3。如果x增加1個(gè)單位,y平均會(huì)增加多少?()A.2個(gè)單位B.3個(gè)單位C.5個(gè)單位D.不確定22、在對(duì)一組數(shù)據(jù)進(jìn)行描述性統(tǒng)計(jì)分析時(shí),發(fā)現(xiàn)數(shù)據(jù)存在偏態(tài)分布。此時(shí),以下哪個(gè)統(tǒng)計(jì)量能更好地反映數(shù)據(jù)的集中趨勢(shì)?()A.算術(shù)平均數(shù)B.幾何平均數(shù)C.中位數(shù)D.眾數(shù)23、在一個(gè)班級(jí)中,學(xué)生的數(shù)學(xué)成績(jī)和語(yǔ)文成績(jī)的相關(guān)系數(shù)為0.6。如果數(shù)學(xué)成績(jī)提高10分,語(yǔ)文成績(jī)大約會(huì)提高多少?()A.6分B.4分C.無(wú)法確定D.以上都不對(duì)24、在進(jìn)行多元線性回歸分析時(shí),如果某個(gè)自變量的t檢驗(yàn)不顯著,但整個(gè)模型的F檢驗(yàn)顯著,應(yīng)該如何處理這個(gè)自變量?()A.保留B.剔除C.無(wú)法確定D.以上都不對(duì)25、在對(duì)兩個(gè)變量進(jìn)行相關(guān)性分析時(shí),得到相關(guān)系數(shù)為0.8。這意味著這兩個(gè)變量之間存在怎樣的關(guān)系?()A.強(qiáng)正相關(guān)B.強(qiáng)負(fù)相關(guān)C.弱正相關(guān)D.弱負(fù)相關(guān)26、某地區(qū)的房?jī)r(jià)數(shù)據(jù)呈現(xiàn)右偏態(tài)分布,若要對(duì)其進(jìn)行描述性統(tǒng)計(jì),以下哪個(gè)指標(biāo)不太適合用來(lái)反映數(shù)據(jù)的集中趨勢(shì)?()A.均值B.中位數(shù)C.眾數(shù)D.以上都適合27、在一項(xiàng)關(guān)于消費(fèi)者對(duì)某品牌滿意度的調(diào)查中,共收集到1000份有效問卷。將滿意度分為非常滿意、滿意、一般、不滿意和非常不滿意五個(gè)等級(jí)。若要分析不同年齡段消費(fèi)者滿意度的差異,應(yīng)采用的統(tǒng)計(jì)方法是()A.簡(jiǎn)單相關(guān)分析B.多重比較C.方差分析D.回歸分析28、在一次統(tǒng)計(jì)調(diào)查中,需要從1000個(gè)個(gè)體中抽取100個(gè)作為樣本。若采用系統(tǒng)抽樣的方法,抽樣間隔應(yīng)為()A.5B.10C.20D.5029、在一項(xiàng)關(guān)于城市居民消費(fèi)習(xí)慣的調(diào)查中,隨機(jī)抽取了1000個(gè)家庭,記錄了他們每月在食品、服裝、娛樂等方面的支出。若要分析不同收入水平家庭在消費(fèi)結(jié)構(gòu)上的差異,以下哪種統(tǒng)計(jì)方法最為合適?()A.描述性統(tǒng)計(jì)B.推斷統(tǒng)計(jì)C.相關(guān)分析D.方差分析30、在一個(gè)數(shù)據(jù)集中,變量A和變量B的協(xié)方差為正,說明它們之間存在怎樣的關(guān)系?()A.正相關(guān)B.負(fù)相關(guān)C.無(wú)關(guān)D.不確定二、計(jì)算題(本大題共5個(gè)小題,共25分)1、(本題5分)對(duì)兩種不同品牌的汽車油耗進(jìn)行比較。隨機(jī)抽取品牌A的汽車36輛,平均油耗為8升/百公里;隨機(jī)抽取品牌B的汽車49輛,平均油耗為7.5升/百公里。已知兩種品牌汽車油耗的標(biāo)準(zhǔn)差分別為1升/百公里和0.8升/百公里。求兩種品牌汽車平均油耗之差的95%置信區(qū)間。2、(本題5分)某公司的銷售額在過去5年分別為100萬(wàn)元、120萬(wàn)元、150萬(wàn)元、180萬(wàn)元、200萬(wàn)元。請(qǐng)使用指數(shù)平滑法(平滑系數(shù)為0.6)預(yù)測(cè)下一年的銷售額,并計(jì)算預(yù)測(cè)誤差。3、(本題5分)某班級(jí)有50名學(xué)生,在一次數(shù)學(xué)考試中,成績(jī)的平均數(shù)為80分,標(biāo)準(zhǔn)差為10分?,F(xiàn)隨機(jī)抽取10名學(xué)生的試卷進(jìn)行分析,求這10名學(xué)生成績(jī)的平均數(shù)的抽樣分布及在概率為95%的情況下,抽樣平均成績(jī)的置信區(qū)間。4、(本題5分)某城市有500家醫(yī)院,病床數(shù)的平均數(shù)為200張,標(biāo)準(zhǔn)差為50張。隨機(jī)抽取50家醫(yī)院進(jìn)行調(diào)查,求樣本平均數(shù)的抽樣分布,并計(jì)算抽樣平均誤差。若已知總體服從正態(tài)分布,求這50家醫(yī)院的平均病床數(shù)在190張到210張之間的概率。5、(本題5分)某工廠生產(chǎn)一種電子產(chǎn)品,其性能指標(biāo)服從正態(tài)分布,平均性能指標(biāo)為80,標(biāo)準(zhǔn)差為10。從生產(chǎn)線上隨機(jī)抽取64個(gè)電子產(chǎn)品進(jìn)行檢測(cè),求這64個(gè)電子產(chǎn)品平均性能指標(biāo)的抽樣分布,并計(jì)算抽樣平均誤差。若規(guī)定產(chǎn)品性能指標(biāo)在78到82之間為合格,求樣本中合格產(chǎn)品的比例的抽樣分布及概率。三、簡(jiǎn)答題(本大題共5個(gè)小題,共25分)1、(本題5分)在進(jìn)行假設(shè)檢驗(yàn)時(shí),如何選擇合適的檢驗(yàn)統(tǒng)計(jì)量?需要考慮哪些因素?2、(本題5分)在進(jìn)行統(tǒng)計(jì)分析時(shí),如何評(píng)估模型的預(yù)測(cè)能力和穩(wěn)健性,并舉例說明常用的評(píng)估指標(biāo)和方法。3、(本題5分)詳細(xì)闡述如何利用統(tǒng)計(jì)方法分析不同營(yíng)銷策略組合對(duì)消費(fèi)者購(gòu)買意愿的影響?需要考慮哪些因素和采用哪些分析方法?4、(本題5分)解釋偏相關(guān)分析的概念和用途。以一個(gè)多變量的經(jīng)濟(jì)數(shù)據(jù)為例,說明如何進(jìn)行

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論