基于R語言的學(xué)生成績分析_第1頁
基于R語言的學(xué)生成績分析_第2頁
基于R語言的學(xué)生成績分析_第3頁
基于R語言的學(xué)生成績分析_第4頁
基于R語言的學(xué)生成績分析_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、基于5語言的學(xué)生成績分析摘 要:學(xué)生考試成績是檢驗(yàn)教師教學(xué)效果的重要指標(biāo),客觀準(zhǔn)確地分析學(xué)生成績是每一個(gè)教師的職 責(zé).依據(jù)R語言特點(diǎn)及數(shù)據(jù)處理過程,運(yùn)用R語言對(duì)沈陽市某小學(xué)四年級(jí)學(xué)生期末成績進(jìn)行描述性、相 關(guān)性和差異性分析,并根據(jù)教學(xué)實(shí)際需要將數(shù)據(jù)生成箱形圖和直方圖,由圖形分析考試成績是否兩級(jí)分 化,在某一成績段是否集中;同一學(xué)生不同科目的成績是否相關(guān),是否偏科等等.實(shí)踐表明,采用R語言 分析學(xué)生成績能夠顯示其隱藏的問題,為教師提高學(xué)生成績提供參考依據(jù),從而達(dá)到提高教學(xué)效果的目 的關(guān)鍵詞:R語言;成績分析;箱形圖;直方圖;星圖;pairs圖0引言學(xué)生成績作為檢驗(yàn)教師教學(xué)效果的產(chǎn)物,直接反映學(xué)生

2、對(duì)知識(shí)的掌握情況及教師的教學(xué)水 平.近些年,有關(guān)教學(xué)的探索更多關(guān)注于新的教學(xué)手段,針對(duì)教學(xué)效果的分析,尤其是有關(guān)分析 方法的研究較少.隨著人工智能和大數(shù)據(jù)時(shí)代的到來,為教師利用數(shù)據(jù)統(tǒng)計(jì)分析手段,從大量的 學(xué)生成績中提取重要數(shù)據(jù),發(fā)現(xiàn)成績中隱藏的問題,提高學(xué)生成績,提供了新的思路.本文中嘗 試引入R語言對(duì)學(xué)生成績進(jìn)行統(tǒng)計(jì)分析M ,為教學(xué)人員探索新的統(tǒng)計(jì)方法提供參考.R語言特點(diǎn)數(shù)據(jù)分析是指采用合適方法對(duì)從海量數(shù)據(jù)中收集的大量數(shù)據(jù)進(jìn)行分析、整理、歸納,抽取有 價(jià)值的信息的過程.R語言作為一種強(qiáng)大的編程語言,不僅可提供大量多樣的數(shù)據(jù)統(tǒng)計(jì)分析方 式,還可生成圖例,其主要特點(diǎn)有: 開源免費(fèi)的軟件可從官網(wǎng)下

3、載,安裝簡單快捷,而且其強(qiáng)大的R語言包均可根據(jù)需要 從網(wǎng)上下載,支持多操作系統(tǒng)環(huán)境;具有強(qiáng)大可自定義樣式的繪圖功能,可利用函數(shù)將統(tǒng)計(jì)分析的計(jì)算數(shù)據(jù)生成想要的圖, 并根據(jù)修改函數(shù)中的參數(shù),自定義圖樣式; 操作流程簡單,無需編寫大量代碼,用戶只要了解所需函數(shù)的參數(shù)意義,即可生成對(duì)應(yīng) 圖例.R語言數(shù)據(jù)處理數(shù)據(jù)源是R語言進(jìn)行統(tǒng)計(jì)分析的核心資源.考慮到大學(xué)課程成績存在一定主觀性,相比之下 小學(xué)期末考試更嚴(yán)格、更真實(shí),成績趨于客觀,因此本研究選擇沈陽市某小學(xué)四年級(jí)期末考試成績作為數(shù)據(jù)源進(jìn)行統(tǒng)計(jì)分析.2. 1 數(shù)據(jù)收集根據(jù)教學(xué)人員的需要,從眾多列成績中選取主要數(shù)據(jù)信息,包括序號(hào)(num)、姓名 (name)

4、、班級(jí)(class)、數(shù)學(xué)(math)、語文(chn)、英語(eng),將收集的數(shù)據(jù)存為.xls文件 或.csv文件.收集數(shù)據(jù)時(shí),出現(xiàn)的缺失值可刪除或按空缺值等方式處理.2. 2 數(shù)據(jù)讀入numnameclassmathchnengchr1劉芷瑞4. 32822. 5392趙羽菲4. 398951003姜欣彤4. 39887984宋虹霏4. 39887975施依含4. 39391976賈倩雯4. 39()91997局震4. 398919()8工習(xí)鑒4. 310()SO999李澤溪4. 39688931()李彥燕4. 3958795# .with105 more rows圖1 R語言生成學(xué)生成績

5、R語言支持.xls、. csv和.txt等多種文件類型導(dǎo)入.導(dǎo)入 文件前需要加載對(duì)應(yīng)的R語言包,編寫代碼時(shí)需將導(dǎo)入文件 賦值給變量,導(dǎo)入的變量類型以數(shù)據(jù)框形式存在.本文以導(dǎo)入. xls文件為例,利用R語言read _excel ()函數(shù)實(shí)現(xiàn)導(dǎo)入代碼 如下:library( read_excel)scoresV 6 read_excel(scoresdata. xlsx)導(dǎo)入后查看數(shù)據(jù),見圖1.數(shù)據(jù)共105行,查看變量內(nèi)容時(shí)R語言僅顯示10行,隱 藏95行.每列除顯示導(dǎo)入數(shù)據(jù)時(shí)填寫的列名外,還顯示屬性 類型,其中name為字符型,其余均為數(shù)據(jù)框.2. 3 數(shù)據(jù)提取讀入數(shù)據(jù)后,需對(duì)有用數(shù)據(jù)進(jìn)行提取

6、運(yùn)算.例如,在統(tǒng)計(jì) 分析成績時(shí),姓名、序號(hào)、班級(jí)等屬性不應(yīng)參加統(tǒng)計(jì)分析,但函數(shù)無這些屬性就無法進(jìn)行歸類統(tǒng)計(jì)分析,在眾多數(shù)據(jù)中提取所要數(shù)據(jù),可應(yīng)用R語言中c () 將所需數(shù)據(jù)連接在一起,通過如下代碼提取數(shù)據(jù):scores.data V6 scoresc(4 % 6)scores.data“scores &c (4% 6)表示提取scores變量中46列的數(shù)據(jù)賦值給變量scores. data.R語言成績分析與圖形繪制學(xué)生成績是反映教學(xué)成果的客觀數(shù)據(jù).目前,大多數(shù)學(xué)校采取Excel錄入、匯總、計(jì)算的方 式管理與分析學(xué)生成績,雖能計(jì)算出需要的最終數(shù)據(jù),但是缺乏對(duì)成績的客觀分析與直觀反映.針對(duì)這一問題

7、,本文提出了基于R語言的統(tǒng)計(jì)分析方法以提高教學(xué)效果&466.3. 1 各科成績描述)分析3. 1. 1 統(tǒng)計(jì)成績信息Min.:25. 00Min.:16. 00Min.:24. 00lsl Qu.:78. 501st. Qu. :62. 001st. Qu.:59. 00Median:89. 00Median:74. 00Median:91.00Mean:83. 77Mean:70. 04Mean:78.643rd Qu.:94. 003rd Qu. : 84. 003rd Qu.:96. 00Max.:100. 00Max.:95. 00Max.:100. 00mathchneng圖2 su

8、nmary函數(shù)生成學(xué)生成績傳統(tǒng)數(shù)據(jù)計(jì)算一般通過Excel表格分列對(duì)各科進(jìn) 行求和、求平均值、求最大值和最小值的分類計(jì)算, 工作略顯繁瑣.這里以沈陽某小學(xué)四年級(jí)成績?yōu)槔? 將43名學(xué)生成績導(dǎo)入R語言環(huán)境中,導(dǎo)入的數(shù)據(jù)變 量以數(shù)據(jù)框的形式存在.R語言可通過summary () 函數(shù)完成各科成績的初步計(jì)算,實(shí)現(xiàn)代碼如下summary (scores c (4 % 6)生成的計(jì)算數(shù)據(jù)見圖 2.通過生成數(shù)據(jù)可直觀看到,在整個(gè)四年級(jí)數(shù)學(xué)、語文和英語(科考試成績中,除最大值、最 小值和平均值外,還計(jì)算出科目成績的中間值(Median)、1/4位數(shù)(1st Qu.)和3/4位數(shù)(3stQu.),為分析、了解學(xué)

9、生整體情況提供了便捷的數(shù)據(jù)計(jì)算服務(wù),提高了教學(xué)決策的準(zhǔn)確性. 3.1.2繪制成績箱形圖為更加直觀地向決策者提供數(shù)據(jù)依據(jù),R語言boxplot ()函數(shù)可根據(jù)導(dǎo)入的成績數(shù)據(jù)生成 箱形圖,即根據(jù)數(shù)據(jù)的分布情況生成統(tǒng)計(jì)圖.上述通過summary ()函數(shù)計(jì)算出各科成績的重要 屬性值,生成的箱形圖如圖3所示,實(shí)現(xiàn)運(yùn)行代碼如下:boxplot (math class, data = scoris)boxp l ot (ing class, data=scores)boxplot (chn class, data=scores)箱形圖將計(jì)算得到的描述性統(tǒng)計(jì)量進(jìn)行更直觀地展示.圖3中分別顯示各班級(jí)數(shù)學(xué)、語文

10、、 英語成績與班級(jí)的信息:長方形外部的上下兩條橫線分別表示該班級(jí)的最高分和最低分,長方形 的上下邊框分別表示該班級(jí)成績的1/4位數(shù)(1st Qu.)和3/4位數(shù)(3st Qu.),長方形內(nèi)部黑橫 線表示該班級(jí)成績的中間數(shù),圖形中的空心白圓點(diǎn)表示異常數(shù)據(jù).除箱形圖規(guī)定的線形和圖形含 義外,還可從圖形中看到隱藏的信息,例如長方形的面積大小決定該班級(jí)本科目成績是否在某成 績段集中,如果面積過大表示成績涉及范圍較大.3. 1. 3繪制成績直方圖hist (math, freq = FALSE)lines (density (math) , col=blum)rug (jitter (math)R語言的

11、強(qiáng)大不僅體現(xiàn)在便捷的數(shù)據(jù)計(jì)算,還體現(xiàn)在可依據(jù)頻數(shù)生成可視的直方圖逍.根據(jù) 導(dǎo)入的數(shù)學(xué)、語文和英語成績,利用R語言的hist ()函數(shù)、lmes ()函數(shù)和rug ()函數(shù)生成 整體成績直方圖,如圖4所示,運(yùn)行代碼如下:(a)數(shù)學(xué)成績整體點(diǎn).方圖(b)語文成績整體直方圖(c)英語成績整體點(diǎn).方圖圖4數(shù)學(xué)、語文、英語成績分布直方圖通過成績直方圖可直觀看出,橫坐標(biāo)為成績段,縱坐標(biāo)為密度,各科成績圖形及密度曲線由分?jǐn)?shù)段人數(shù)決定.數(shù)學(xué)成績除個(gè)別學(xué)生,大部分均已及格,并且在及格人數(shù)中很多學(xué)生的成績集中在85分以上,90分以上偏多;語文成績雖呈正態(tài)分布趨勢(shì),但是存在一些成績不及格的學(xué)生,大 部分學(xué)生在659

12、0分之間,80分以上偏多;英語成績分布呈現(xiàn)兩極化,成績不及格和90分以 上的均偏多,6080分之間學(xué)生較少.3. 2 成績相關(guān)性分析成績是檢驗(yàn)教學(xué)成果的重要指標(biāo).有效利用技術(shù)手段從大量的成績中發(fā)現(xiàn)科目之間的關(guān)聯(lián)! 挖掘隱藏信息,是提升成績、提高教學(xué)效果的重要方式. 數(shù)據(jù)中發(fā)現(xiàn)科目之間的相關(guān)性,為決策者提供分析依據(jù).cor (scores ,subjects) 生成的相關(guān)性數(shù)據(jù)見圖5.通常認(rèn)為,數(shù)學(xué)成績好的小學(xué)生語文和英語的成績 都不會(huì)很差.通過R語言各科成績的相關(guān)性分析看出, 數(shù)學(xué)與語文、數(shù)學(xué)與英語的相關(guān)系數(shù)均超過了 0. 6,根 據(jù)統(tǒng)計(jì)學(xué)的規(guī)定,相關(guān)系數(shù)區(qū)域0.60.8屬于有很強(qiáng) 的相關(guān)性,

13、說明在該年級(jí)中數(shù)學(xué)學(xué)得好的學(xué)生,其數(shù)學(xué) 成績與語文成績、英語成績存在一定的相關(guān)性.通過R 語言生成的成績相關(guān)性如圖6所示,運(yùn)行代碼如下:pairs (scores ,subjects )3. 3 成績差異分析利用starts ()函數(shù)可根據(jù)學(xué)生的成績生成星圖,教學(xué)人員通過星圖可直觀了解學(xué)生是否偏 科、是否優(yōu)秀.本文中生成的星圖如圖7所示,運(yùn)行代碼如下:利用R語言cor ()函數(shù),可從導(dǎo)入的 運(yùn)行代碼如下:chn mathengchn 1.0000000 0. 7221382math 0.7221382 1.0000000eng 0.5870535 0. 6940769 圖50. 58705350. 69407691. 0000000cor函數(shù)計(jì)算學(xué)生績相關(guān)性分析stars ( scores)星圖一般表示多個(gè)相互獨(dú)立的變量個(gè)體,每個(gè)連接角與中心點(diǎn)的軸線越長,數(shù)值就越大,生 成的星圖就越大,各科成績分別對(duì)著數(shù)據(jù)的維度.圖7中,第一排第二個(gè)學(xué)生、第二排第二個(gè)學(xué)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論