數(shù)理統(tǒng)計(jì)學(xué) 大作業(yè)_第1頁
數(shù)理統(tǒng)計(jì)學(xué) 大作業(yè)_第2頁
數(shù)理統(tǒng)計(jì)學(xué) 大作業(yè)_第3頁
數(shù)理統(tǒng)計(jì)學(xué) 大作業(yè)_第4頁
數(shù)理統(tǒng)計(jì)學(xué) 大作業(yè)_第5頁
已閱讀5頁,還剩11頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

數(shù)理統(tǒng)計(jì)學(xué)大作業(yè)學(xué)院計(jì)算機(jī)學(xué)院專業(yè)計(jì)算機(jī)應(yīng)用技術(shù)班級(jí)2012學(xué)號(hào)20120102027姓名張弛指導(dǎo)教師姜永負(fù)責(zé)教師沈陽航空航天大學(xué)2012年11月摘要數(shù)理統(tǒng)計(jì)學(xué)是研究有效地運(yùn)用數(shù)據(jù)收集與數(shù)據(jù)處理、多種模型與技術(shù)分析、社會(huì)調(diào)查與統(tǒng)計(jì)分析等,對(duì)科技前沿和國民經(jīng)濟(jì)重大問題和復(fù)雜問題,以及社會(huì)和政府中的大量問題,如何對(duì)數(shù)據(jù)進(jìn)行推理,以便對(duì)問題進(jìn)行推斷或預(yù)測(cè),從而對(duì)決策和行動(dòng)提供依據(jù)和建議的應(yīng)用廣泛的基礎(chǔ)性學(xué)科。數(shù)理統(tǒng)計(jì)學(xué)是從本世紀(jì)初開始發(fā)展起來的一門學(xué)科,它是以概率論的理論為基礎(chǔ),根據(jù)觀察得到的大量數(shù)據(jù)進(jìn)行整理、分析并對(duì)所研究的隨機(jī)現(xiàn)象的概率特征作出合理的估計(jì)和判斷的數(shù)學(xué)分支。雖然數(shù)理統(tǒng)計(jì)學(xué)是一門比較年青的學(xué)科,但隨著概率論的產(chǎn)生和應(yīng)用正在逐漸興起,現(xiàn)已廣泛地應(yīng)用于工農(nóng)業(yè)生產(chǎn)及科學(xué)技術(shù)之中,成為一門理論嚴(yán)謹(jǐn)、應(yīng)用廣泛、發(fā)展迅速、方法獨(dú)特的學(xué)科。在教育領(lǐng)域,考試是各級(jí)各類學(xué)校評(píng)定學(xué)業(yè)成績(jī),進(jìn)行教學(xué)評(píng)估,取得教學(xué)反饋信息的主要手段。因此,在世界上的許多國家都很重視對(duì)考試工作和考試方法的研究。由于需要對(duì)考試成績(jī)進(jìn)行定量分析,所以近三十年來,數(shù)理統(tǒng)計(jì)學(xué)的基本方法已成為教育評(píng)估的重要工具,并發(fā)揮著越來越重要的作用。下面,將從試卷的抽樣、分?jǐn)?shù)的整理及分?jǐn)?shù)的處理三個(gè)方面介紹數(shù)理統(tǒng)計(jì)在教育評(píng)估中的一些應(yīng)用。本文將數(shù)理統(tǒng)計(jì)應(yīng)用于考試成績(jī)的分析上將有助于學(xué)生和老師即使發(fā)現(xiàn)學(xué)習(xí)中遇到的問題,以及改進(jìn)自己的教學(xué)策略和學(xué)習(xí)方法。關(guān)鍵詞:數(shù)理統(tǒng)計(jì);教育;數(shù)據(jù);分析;MathematicalStatisticsSummaryMathematicalStatisticsisthestudyoftheeffectiveuseofthedatacollectionanddataprocessing,avarietyofmodelsandtechnicalanalysis,socialsurveysandstatisticalanalysisoffrontierscienceandtechnology,themajorissuesofthenationaleconomyandthecomplexityoftheproblem,aswellasalargenumberofproblemsinthesocietyandgovernment,andhowtoreasonthedata,inordertoextrapolateorpredicttheproblem,andthusprovideabasisfordecision-makingandactionandtheapplicationofawiderangeofbasicdisciplines.MathematicalStatisticsisadisciplinedevelopedfromthebeginningofthiscentury,itisbasedonthetheoryofprobabilitytheory-based,accordingtotheobservedlargeamountsofdatacollation,analysisandthestudyofrandomphenomenaprobabilitycharacteristicsmakeareasonableestimateandthejudgmentofthebranchofmathematics.Mathematicalstatisticsisarelativelyyoungdiscipline,butaregraduallyemergingasthegenerationandapplicationofprobabilitytheory,nowwidelyusedinindustrialandagriculturalproductionandscienceandtechnologyhasbecomeaprecisetheory,awiderangeofapplications,developmentquickly,auniquemethodofdiscipline.Inthefieldofeducation,theexamistheassessmentofacademicachievement,schoolsatalllevelsofteachingassessment,theprimarymeansofinstructionalfeedbackinformation.Therefore,manycountriesintheworldattachgreatimportancetothestudyofexaminationsandexaminationmethods.Quantitativeanalysisoftestscores,sothelastthreedecades,thebasicmethodsofmathematicalstatisticshasbecomeanimportanttoolforeducationassessment,andplaysanincreasinglyimportantrole.Below,fromthepapersofthesamplingfractionfinishingscoresdealwiththreeaspectsofintroductorymathematicalstatisticseducationassessment.MathematicalStatisticsineducationwillhelptheydiscovertheproblemsencounteredinthelearningofstudentsandteachersaswellastoimprovetheirownteachingstrategiesandlearningmethods.Keywords:MathematicalStatistics;education;data;analysis目錄一、采集樣本及數(shù)據(jù)整理 61.1、數(shù)據(jù)的收集方法及說明 61.2、數(shù)據(jù)整理:給出頻數(shù)、頻率分布表及說明 61.3、畫出直方圖和折線圖 7二、假定總體服從正態(tài)分布,給出μ,的估計(jì) 7三、參數(shù)區(qū)間估計(jì) 93.1、方差未知,求數(shù)學(xué)期望的置信區(qū)間 93.2、2、數(shù)學(xué)期望μ,均未知,求方差的置信區(qū)間 10四、參數(shù)的假設(shè)檢驗(yàn) 114.1. 樣本統(tǒng)計(jì)數(shù)據(jù)的t檢驗(yàn) 114.2樣本統(tǒng)計(jì)數(shù)據(jù)的檢驗(yàn) 114.3.樣本統(tǒng)計(jì)數(shù)據(jù)的F-檢驗(yàn) 12五、非參數(shù)假設(shè)檢驗(yàn)(擬合優(yōu)度檢驗(yàn)) 135.1,擬合優(yōu)度檢驗(yàn) 135.2、當(dāng)上述檢驗(yàn)被拒絕時(shí),請(qǐng)給出解釋理由 15六、結(jié)論 15參考文獻(xiàn) 16符號(hào)表數(shù)學(xué)期望X的數(shù)學(xué)期望標(biāo)準(zhǔn)差范德蒙式方差D(X)X的方差無窮大K階原點(diǎn)矩平均值X樣本顯著性水平f(x)密度函數(shù)F(x)分布函數(shù)求和運(yùn)算求偏導(dǎo)一、采集樣本及數(shù)據(jù)整理1.1、數(shù)據(jù)的收集方法及說明本作業(yè)所采用的數(shù)據(jù)是2009級(jí)通信班、電子班、網(wǎng)絡(luò)班、新聞班四個(gè)班的計(jì)算機(jī)網(wǎng)絡(luò)期末考試的成績(jī),由實(shí)驗(yàn)室的老師處獲得,一共收集到四個(gè)個(gè)班的共118人的期末考試成績(jī);網(wǎng)絡(luò)班32人,新聞班30人,電子班21人,通信班35人其中數(shù)據(jù)具體如下:847769737788668365747967678974856892808771806777767773885377506879818967765988708092797588487274738368876578888458742770787069807976757273706581818076526669777673657575798974888173778269748884828188906584969078899381858361718870797286801.2、數(shù)據(jù)整理:給出頻數(shù)、頻率分布表及說明分?jǐn)?shù)范圍(X)頻數(shù)(出現(xiàn)的人數(shù))區(qū)間內(nèi)的分?jǐn)?shù)段X<=60727-5960<X<=702461-7070<X<=804871-8080<X<=903581-90X>90491-96注:數(shù)據(jù)的篩選使用了excel2010的篩選工具,在某一范圍內(nèi)篩選出各段出現(xiàn)的次數(shù)1.3、畫出直方圖和折線圖圖一、數(shù)據(jù)段的直方圖圖二、數(shù)據(jù)分段的折線圖注:以上兩圖中的X坐標(biāo)都表示分?jǐn)?shù)段的范圍,Y坐標(biāo)表示人數(shù),其中折線圖使用先描點(diǎn)再畫線的方法生成的圖。二、假定總體服從正態(tài)分布,給出μ,的估計(jì)2.1、矩估計(jì)法矩估計(jì)法是一種相對(duì)簡(jiǎn)單的估計(jì)方法,其理論依據(jù)是辛欽大數(shù)定律:設(shè)隨機(jī)變量序列X1,X2,…,Xn,…獨(dú)立同分布,且數(shù)學(xué)期望E(Xi)=μ存在.則對(duì)任意的?>0,有

lim即當(dāng)n→∞時(shí),1nΣXi依概率收斂到因此當(dāng)樣本很大時(shí)(因?yàn)椴杉臉颖敬笥?00,因此可以看作是大樣本)Ak又因?yàn)闃颖痉恼龖B(tài)分布,故而,μ=X=61.5;的矩估計(jì)為A2=E(X2)=+μ2 =2110.32.2、極大似然估計(jì)由于該分布近似服從正態(tài)分布,而正態(tài)分布的函數(shù)表達(dá)式為:所以,的似然函數(shù)為取對(duì)數(shù)得令解得=61.5=318.52.3、若總體不是正態(tài)分布能給出相應(yīng)參數(shù)估計(jì)嗎?寫出探求方案假設(shè)總體不服從正態(tài)分布,那么假設(shè)總體服從P(λ)。解:由于X的概率函數(shù)為所以得似然函數(shù)為令解得所以λ得最大似然估計(jì)量為=61.5。三、參數(shù)區(qū)間估計(jì)3.1、方差未知,求數(shù)學(xué)期望的置信區(qū)間當(dāng)未知時(shí)用他的估計(jì)量,既是樣本的標(biāo)準(zhǔn)差代替此時(shí)不再服從標(biāo)準(zhǔn)正態(tài)分布。而是服從自由度為n-1的t-分布記為~t(n-1)查分位數(shù)給定置信水平1-α,使根據(jù)自由度n-1和1-α,從t-分布表查出分位數(shù)為式等價(jià)于所以μ的置信水平為1-α的置信區(qū)間為隨機(jī)抽取20個(gè)樣本,8477796771805068809268877870658173657782由=74.4,方差S=9.49,,如果取α=0.1(以后在不說明的情況下都取此值),則帶入值可得置信水平為0.9的區(qū)間為(71.6,77.2)。3.2、數(shù)學(xué)期望,均未知,求方差的置信區(qū)間選取的樣本函數(shù)服從分布,記為給定置信水平1-α使則解得的置信水平為1-α的隨機(jī)置信區(qū)間為假設(shè)抽取樣本20個(gè),如下:8477796771805068809268877870658173657782解得該樣本的的置信區(qū)間為。四、參數(shù)的假設(shè)檢驗(yàn)4.1. 樣本統(tǒng)計(jì)數(shù)據(jù)的t檢驗(yàn)由于總體服從分布N(61.5,),樣本的均值=74.7,樣本的標(biāo)準(zhǔn)差為s=9.49,當(dāng)在顯著性水平為0.05下,是否可以認(rèn)為每個(gè)人的成績(jī)都在70分以上?=1\*GB3①原假設(shè)和備擇假設(shè)(單邊檢驗(yàn))=2\*GB3②確定拒絕域給定顯著水平α=0.05使查分布表得臨界值為而=1.729則其拒絕域?yàn)椋ǎ?3\*GB3③檢驗(yàn)統(tǒng)計(jì)量為故帶入后得到t=0.2334;因此作出判斷不能認(rèn)為每個(gè)人的成績(jī)都在70分以上。4.2樣本統(tǒng)計(jì)數(shù)據(jù)的檢驗(yàn)=1\*GB3①原假設(shè)和備擇檢驗(yàn)=2\*GB3②選取檢驗(yàn)統(tǒng)計(jì)量當(dāng)原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量為=3\*GB3③確定拒絕域給定顯著性水平α=0.05使,故而求的其拒絕域?yàn)椋?0.144,+)(0,10.177);而因而可以認(rèn)為新抽取的樣本的標(biāo)準(zhǔn)差比原來的標(biāo)準(zhǔn)差沒有區(qū)別;4.3.樣本統(tǒng)計(jì)數(shù)據(jù)的F-檢驗(yàn)選取兩組數(shù)據(jù),數(shù)據(jù)如下:84776973778866836574796767897485689280依題意,是關(guān)于兩個(gè)正態(tài)總體的數(shù)學(xué)期望的假設(shè)檢驗(yàn)問題。因?yàn)?,是未知的,根?jù),的相等或不相等選擇區(qū)的檢驗(yàn)統(tǒng)計(jì)量精確服從t-分布或近似服從t-分布,因此搜先要對(duì)兩個(gè)總體的方差作檢驗(yàn)。原假設(shè)和備擇假設(shè)為當(dāng)假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量服從自由度為(9,8)的F分布給定顯著性水平使從F分布表查處臨界值=0.244,則拒絕域?yàn)椤8鶕?jù)數(shù)據(jù),計(jì)算得160.44,800;帶入檢驗(yàn)統(tǒng)計(jì)量,得F=0.2005,因此落在拒絕域中,因此可認(rèn)為②原結(jié)社和備擇假設(shè)為當(dāng)原假設(shè)為真時(shí),檢驗(yàn)統(tǒng)計(jì)量為且t服從自由度為10+9-2=17的t-分布給定顯著水平使,臨界值為,則拒絕域,=4.988t=-1.0035則沒有落在拒絕域內(nèi),因此可認(rèn)為還是有差異的五、非參數(shù)假設(shè)檢驗(yàn)(擬合優(yōu)度檢驗(yàn))5.1,擬合優(yōu)度檢驗(yàn)組號(hào)分?jǐn)?shù)區(qū)間頻數(shù)頻率170.05932240.20343470.39834350.2966550.04241181原假設(shè)和備擇假設(shè)為其中均為未知參數(shù),的最大似然估計(jì)為=61.5=318.5以表中數(shù)據(jù)為基礎(chǔ),,原假設(shè)為真時(shí),計(jì)算隨機(jī)變量X落在個(gè)區(qū)間的概率。等價(jià)檢驗(yàn)假設(shè)計(jì)算結(jié)果列入下表:組號(hào)分?jǐn)?shù)區(qū)間頻數(shù)170.468155.2442.127042240.216325.520.0905333470.17120.17835.653674350.089810.59656.20566550.03944.6490.026501118134.1給定顯著性水平,使則拒絕域?yàn)槎^察值為134.1,因而落在拒絕域內(nèi),否定原假設(shè),其不服從正態(tài)分布N(61.5,318.5).5.2、當(dāng)上述檢驗(yàn)被拒絕時(shí),請(qǐng)給出解釋理由-擬合優(yōu)度檢驗(yàn)對(duì)離散分布和連續(xù)分布都適用,但是區(qū)間的劃分是人為的,它是基于多項(xiàng)分布和樣本數(shù)據(jù)的擬合優(yōu)度檢驗(yàn),而不是原假設(shè)的分布對(duì)樣本數(shù)據(jù)的擬合優(yōu)度檢驗(yàn),其不是很優(yōu)勢(shì)的檢驗(yàn)方法因而其在一定的概率上拒絕正態(tài)性的原假設(shè),即使可能性比較小也是有可能發(fā)生的六、結(jié)論1.由于數(shù)理統(tǒng)計(jì)是一門實(shí)用性極強(qiáng)的學(xué)科,在學(xué)習(xí)中要緊扣它的實(shí)際背景,理解統(tǒng)計(jì)方法的直觀含義。了解數(shù)理統(tǒng)計(jì)能解決那些實(shí)際問題。對(duì)如何處理抽樣數(shù)據(jù),并根據(jù)處理的結(jié)果作出合理的統(tǒng)計(jì)推斷,該結(jié)論的可靠性有多少要有一個(gè)總體的思維框架,這樣,學(xué)起來就不會(huì)枯燥而且容易記憶。例如估計(jì)未知分布的數(shù)學(xué)期望,就要考慮到①如何尋求合適的估計(jì)量的途徑,②如何比較多個(gè)估計(jì)量的優(yōu)劣。這樣,針對(duì)①按不同的統(tǒng)計(jì)思想可推出矩估計(jì)和極大似然估計(jì),而針對(duì)②又可分為無偏估計(jì)、有效估計(jì)、相合估計(jì),因?yàn)椴煌墓烙?jì)名稱有著不同的含義,一個(gè)具體估計(jì)量可以滿足上面的每一個(gè),也可能不滿足。掌握了尋求估計(jì)的統(tǒng)計(jì)思想,具體尋求估計(jì)的步驟往往是“套路子”的,并不困難,然而如果沒有從根本上理解,僅死背套路子往往會(huì)出現(xiàn)各種錯(cuò)誤。?2.許多人在學(xué)習(xí)數(shù)理統(tǒng)計(jì)過程中往往抱怨公式太多,置信區(qū)間,假設(shè)檢驗(yàn)表格多而且記不住。事實(shí)上概括起來只有八個(gè)公式需要記憶,而且它們之間有著緊密聯(lián)系,并不難記,而區(qū)間估計(jì)和假設(shè)檢驗(yàn)中只是這八個(gè)公式的不同運(yùn)用而已,關(guān)鍵在于理解區(qū)間估計(jì)和假設(shè)檢驗(yàn)的統(tǒng)計(jì)意義,在理解基礎(chǔ)上靈活運(yùn)用這八個(gè)公式,完全沒有必要死記硬背。3.數(shù)理統(tǒng)計(jì)學(xué)的理論和方法,與人類活動(dòng)的各個(gè)領(lǐng)域在不同程度上都有關(guān)聯(lián)。因?yàn)楦鱾€(gè)領(lǐng)域內(nèi)的活動(dòng),都得在不同的程度上與數(shù)據(jù)打交道。都有如何收集和分析數(shù)據(jù)的問題,因此也就有數(shù)理統(tǒng)計(jì)學(xué)用武之地??梢耘e幾個(gè)例子來說明這一點(diǎn),如在工業(yè)中生產(chǎn)一種產(chǎn)品,首先有設(shè)計(jì)的問題,包括配方和工藝條件的選定,這要通過從大量可能的條件組合中,通過分析試驗(yàn)結(jié)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論