基于數(shù)字化設(shè)備的中小學(xué)生科學(xué)素養(yǎng)評測設(shè)計

上傳人：@*** IP屬地：浙江上傳時間：2022-07-31 格式：DOCX 頁數(shù)：14 大小：1.13MB 積分：15 舉報 版權(quán)申訴

基于數(shù)字化設(shè)備的中小學(xué)生科學(xué)素養(yǎng)評測設(shè)計_第2頁

基于數(shù)字化設(shè)備的中小學(xué)生科學(xué)素養(yǎng)評測設(shè)計_第3頁

基于數(shù)字化設(shè)備的中小學(xué)生科學(xué)素養(yǎng)評測設(shè)計_第4頁

基于數(shù)字化設(shè)備的中小學(xué)生科學(xué)素養(yǎng)評測設(shè)計_第5頁

已閱讀5頁，還剩9頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、基于數(shù)字化設(shè)備的中小學(xué)生科學(xué)素養(yǎng)評測設(shè)計科學(xué)素養(yǎng)是當(dāng)前科學(xué)教育領(lǐng)域關(guān)注的重點概念，它既是學(xué)生自身成長的需要，又是國家社會對人的素質(zhì)要求。義務(wù)教育科學(xué)課程標(biāo)準(zhǔn)（2022年版）倡導(dǎo)提升學(xué)生科學(xué)素養(yǎng)，這進(jìn)一步凸顯了科學(xué)教育的重要地位。設(shè)計適合義務(wù)教育階段的科學(xué)素養(yǎng)評測方案具有推動科學(xué)教育發(fā)展的現(xiàn)實意義。紙筆評測無法實現(xiàn)對探究實踐等要素的評價，而數(shù)字化設(shè)備以其定量直觀、實時準(zhǔn)確的優(yōu)勢，逐漸進(jìn)入科學(xué)教育工作者的視野。筆者認(rèn)為在評測中運用計算機和數(shù)字化設(shè)備，將虛擬情境和真實情境結(jié)合，能使學(xué)生的探究更接近科學(xué)本質(zhì)，為科學(xué)素養(yǎng)評測工作提供極大的助力。一、國際科學(xué)素養(yǎng)評測現(xiàn)狀隨著社會與科技的發(fā)展，眾多組織和學(xué)

2、者從不同的層次和角度對科學(xué)素養(yǎng)的定義進(jìn)行歸納與完善。筆者綜合國內(nèi)外學(xué)者和我國課程標(biāo)準(zhǔn)對科學(xué)素養(yǎng)內(nèi)涵的定義，兼顧評測實施的可操作性，在本文中主要關(guān)注學(xué)生能否借助科學(xué)知識和科學(xué)過程來了解自然的奧秘，能否應(yīng)用科學(xué)素養(yǎng)來從事各種科學(xué)研究。為了了解學(xué)生科學(xué)素養(yǎng)情況，眾多組織和研究者進(jìn)行了評測方案的研發(fā)。目前有三項大規(guī)模樣本的科學(xué)素養(yǎng)評測在國際上具有廣泛的影響，它們分別是國際學(xué)生評估項目（The Program for International Student Assessment，PISA）、美國國家教育進(jìn)步評價（National Assessment of Educational Progress，

3、NAEP）和國際數(shù)學(xué)與科學(xué)趨勢研究項目（The Trends in International Mathematics and Science Study，TIMSS）。早期項目的形式主要是紙筆測試，隨著信息技術(shù)的發(fā)展，研究者逐步開發(fā)了基于信息和通信技術(shù)（Information and Communication Technology，ICT）的單元評估。2009年，NAEP率先嘗試基于計算機情境評測，加入了計算機交互任務(wù)（Interactive Computer Task）和動手操作任務(wù)（Hands-on Task)，創(chuàng)設(shè)虛擬的任務(wù)情境，評估學(xué)生的問題解決能力，并于2019年完成從紙筆測試到

4、基于數(shù)字的評估的過渡。PISA于2012年引入了基于計算機的評估平臺，用于問題解決、數(shù)學(xué)和數(shù)字化閱讀三個方面的測試。隨著評估框架的更新調(diào)整，新項目的開發(fā)均是基于計算機平臺。雖然紙筆評估至今仍然是一種選擇，但大多數(shù)國家都選擇在計算機平臺上實施和交付整個評估。TIMSS在2019年也進(jìn)入了計算機評估系統(tǒng)研發(fā)的初始階段，最新的TIMSS 2023手冊表明該項目將于2023年完成升級。僅使用計算機平臺創(chuàng)設(shè)虛擬情境難以全面評測學(xué)生的科學(xué)素養(yǎng)，開發(fā)者還應(yīng)該考慮科學(xué)探究的真實性和可操作性。為此，研究團(tuán)隊構(gòu)建相應(yīng)的探究實驗平臺，并將數(shù)字化設(shè)備引入評測體系，以便學(xué)生在真實情境中自主探究，在實踐中評估操作水平，從

5、而填補科學(xué)素養(yǎng)評測的缺口。二、基于數(shù)字化設(shè)備的科學(xué)素養(yǎng)評測方案義務(wù)教育科學(xué)課程標(biāo)準(zhǔn)（2022年版）在“評價建議”中倡導(dǎo)教師采用非紙筆測試的方式，重點評價學(xué)生的科學(xué)探究能力、技術(shù)與工程實踐能力、創(chuàng)新解決實際問題的能力等。因此，數(shù)字化設(shè)備進(jìn)入科學(xué)素養(yǎng)評測非常符合新課標(biāo)的精神。以下，筆者結(jié)合東南大學(xué)百研工坊科學(xué)教育團(tuán)隊開發(fā)的評測方案，論述數(shù)字化設(shè)備與學(xué)生科學(xué)素養(yǎng)評測深度融合的方式。（一）數(shù)字化設(shè)備在科學(xué)素養(yǎng)評測中的應(yīng)用數(shù)字化設(shè)備是一種建立在測量技術(shù)上的檢測裝置，能將模擬信號轉(zhuǎn)換成數(shù)字信號輸出。筆者所述數(shù)字化設(shè)備指的是將信息技術(shù)、網(wǎng)絡(luò)技術(shù)和傳感器技術(shù)等相結(jié)合的一系列工具（如圖1），即為完成評測而采用的

6、傳感器、數(shù)據(jù)采集器、計算機和配套應(yīng)用軟件。圖1數(shù)字化設(shè)備運行模式其工作原理如下：傳感器將采集的信息轉(zhuǎn)化成電信號，數(shù)據(jù)采集器將電信號轉(zhuǎn)換成數(shù)字信號反饋給計算機軟件，最終通過數(shù)字化信息系統(tǒng)實驗室（Digital Information System Laboratory，DISLab）系統(tǒng)將實驗結(jié)果以可視化圖形呈現(xiàn)。借此，學(xué)生可以快速采集實驗數(shù)據(jù)、監(jiān)控信號量的實時變化數(shù)據(jù)，完成監(jiān)測、統(tǒng)計、繪圖和分析工作。數(shù)字化設(shè)備具有定量、直觀、實時、準(zhǔn)確等特點，是改進(jìn)傳統(tǒng)實驗耗時長、器材多、步驟繁、不精確等缺點的重要手段。教師使用數(shù)字化設(shè)備可以有效提高學(xué)生的數(shù)據(jù)處理、模型建構(gòu)、科學(xué)推理等能力。數(shù)字化設(shè)備在義務(wù)教

7、育階段科學(xué)教學(xué)中應(yīng)用廣泛（見表1）。表1數(shù)字化設(shè)備及其適用的科學(xué)實驗（二）科學(xué)素養(yǎng)評測理論模型1.ECD概念評估框架百研工坊的科學(xué)素養(yǎng)評測方案是依據(jù)ECD（Evidence-Centered Design）模型設(shè)計的。ECD模型是由梅斯雷弗（Robert J. Mislevy）等人開發(fā)的系統(tǒng)性評價設(shè)計的模式，經(jīng)過多年的研究與發(fā)展，該模型被廣泛用于PISA、NAEP等國際評測項目。ECD模型有五個層次的測試開發(fā)：領(lǐng)域分析、領(lǐng)域建模、概念評價框架、評估預(yù)實驗、評估交付。其中，概念評價框架通常有五個子模式：學(xué)生模式、證據(jù)模式、任務(wù)模式、組合模式和呈現(xiàn)模式（如圖2）。學(xué)生模式涵蓋了學(xué)生應(yīng)掌握的知識，相

8、當(dāng)于評測目標(biāo)與內(nèi)容，即“我們能測量什么”；證據(jù)模式指所選的實驗范式，相當(dāng)于評測手段和方式，即“我們?nèi)绾螠y量”；任務(wù)模式指具體情境的選擇，即“任務(wù)的框架和情境是什么”；組合模式則表明了前三種模式是如何相互結(jié)合的；呈現(xiàn)模式指的是評價實際采用的具體方式，如紙筆、實驗操作、計算機交互等。這些子模式協(xié)同構(gòu)建了一個科學(xué)完整的評價框架。圖2ECD概念評價框架在評測方案中，靜態(tài)評估和計算機交互任務(wù)都在計算機上呈現(xiàn)，而動手實操任務(wù)借助的是數(shù)字化設(shè)備搭建的實驗平臺。研究團(tuán)隊參考NAEP中富技術(shù)環(huán)境（Technology-Rich Environments，TRE）下關(guān)于問題解決的研究方法，應(yīng)用學(xué)生模式和證據(jù)模式設(shè)

9、計了基于數(shù)字化設(shè)備的科學(xué)素養(yǎng)評測目標(biāo)（見表2）。學(xué)生模式下的評估目標(biāo)由科學(xué)探究能力（又分為知識探索能力、綜合推理能力）與信息技術(shù)能力組成。證據(jù)模式下的評估目標(biāo)則是針對不同情境、不同方案進(jìn)行不同的細(xì)節(jié)劃分，如分為知識點掌握、實驗探究步驟、應(yīng)用技術(shù)手段等內(nèi)容，其中特別增加了對數(shù)字化設(shè)備操作的考核要求，由主試者評分。表2基于數(shù)字化設(shè)備的科學(xué)素養(yǎng)評測目標(biāo)2.項目反應(yīng)理論Rasch模型研究團(tuán)隊設(shè)計新方案的另一個重要的理論基礎(chǔ)是項目反應(yīng)理論（Item Response Theory, IRT)。它是當(dāng)前評測項目中的常用理論，彌補了經(jīng)典測量理論的項目依賴性與樣本依賴性等不足，其科學(xué)性主要體現(xiàn)在：被試者的能力

10、評估值與評測的具體內(nèi)容無關(guān)，即不考慮測量誤差時，從不同難度和內(nèi)容的評測項目中所得到的能力評估值是相同的。此外，被試者的能力分布也不影響項目參數(shù)，這對于評測方案的質(zhì)量檢驗和結(jié)果分析非常有價值。Rasch模型是丹麥學(xué)者喬治拉希（Georg Rasch）基于IRT提出來的一種潛在特質(zhì)模型，它是一個單參數(shù)IRT模型。Rasch模型的優(yōu)勢在于：（1）項目參數(shù)具有不變性，即進(jìn)行Rasch分析時不需要較大的樣本量；（2）特征參數(shù)具有不變性，即特征參數(shù)的估計與測量項目是沒有關(guān)系的，回避了經(jīng)典測量理論中項目依賴的問題；（3）可以分析多級評分項目，例如主觀題的評分。Rasch模型是一個理想化的數(shù)學(xué)模型，它的運用需

11、要滿足兩個前提條件：一是對于任何被試個體，在難度低的題目上的表現(xiàn)要好于在難度高的題目上的表現(xiàn)；二是對于任何題目，能力水平高的個體要比能力水平低的個體有更大可能回答正確。Rasch模型公式如下：其中，Pni表示被試n正確回答問題i的可能性，Bn表示被試的能力，Di表示問題i的難度。筆者分析時，將被試者的原始成績轉(zhuǎn)換為logit分?jǐn)?shù)（即線性數(shù)據(jù)，例如4級記分法：回答不正確記0分，答對30%60%記1分，60%以上記2分，完全正確記3分），將被試者的能力水平和題目難度放在同一水平標(biāo)尺上進(jìn)行直觀準(zhǔn)確的比較，從而客觀地對評測方案檢驗分析。3.Logistic模型Logistic模型也可作為測評方案的質(zhì)量

12、檢驗工具，用于估計評測方案中各題的區(qū)分度、難度系數(shù)、猜測系數(shù)。20世紀(jì)50年代美國學(xué)者伯恩鮑姆（Birnbaum）在正態(tài)肩型曲線模型基礎(chǔ)上提出了Logistic模型，適用于記分為對或錯的二級記分試題。Logistic模型表達(dá)式如下：其中為能力參數(shù)，a為區(qū)分度，b為難度系數(shù)，c為猜測系數(shù)（不會隨著能力水平而變化），D為常數(shù)，取D=1.7，當(dāng)c=0時可得到二參數(shù)模型，當(dāng)c=0且a=1時可得到單參數(shù)模型。圖3為三參數(shù)模型的項目特征曲線，縱坐標(biāo)代表被試正確作答該題的概率，拐點的值為項目難度參數(shù)，拐點處的斜率表示項目的區(qū)分度a。圖3三參數(shù)Logistic模型的項目特征曲線模型的優(yōu)選一定要基于一定的理論依

13、據(jù)與實踐研究。研究者需要對預(yù)實驗數(shù)據(jù)進(jìn)行模型擬合度測試，選擇更適宜的Logistic參數(shù)模型進(jìn)行參數(shù)估計，從而完成評測方案的質(zhì)量驗證。（三）平臺功能與方案實施1.評測平臺筆者基于信息通信技術(shù)和傳感器技術(shù)構(gòu)建了科學(xué)素養(yǎng)評測平臺，包括評測試題模塊（如圖4）、實驗評分模塊（如圖5）以及系統(tǒng)管理模塊（如圖6）。評測試題模塊為被試者呈現(xiàn)試題信息和操作要求；實驗評分模塊可實現(xiàn)對部分靜態(tài)評估題自動評分，其他題型如簡答題、實驗操作題由主試者賦分；系統(tǒng)管理模塊具有用戶管理、數(shù)據(jù)查詢、數(shù)據(jù)存儲的功能，主要優(yōu)勢在于主試者不用即時評分，后臺實時生成數(shù)據(jù)報表，協(xié)助后期數(shù)據(jù)挖掘工作。三大模塊協(xié)調(diào)銜接，為后續(xù)評測奠定了扎實

14、的基礎(chǔ)。圖4評測試題模塊頁面圖5實驗評分模塊頁面圖6系統(tǒng)管理模塊頁面2.評測內(nèi)容與維度評測內(nèi)容的設(shè)計非常關(guān)鍵。研究團(tuán)隊依據(jù)義務(wù)教育科學(xué)課程標(biāo)準(zhǔn)（2022年版），參考國際科學(xué)素養(yǎng)評測項目框架和命題思路，使評測內(nèi)容與相應(yīng)年齡段學(xué)生的認(rèn)知發(fā)展水平相適應(yīng)，從個人、社會和全球視角審視，聚焦現(xiàn)實世界中自然資源、環(huán)境等方面的問題，如清潔能源、溫室效應(yīng)等。此外，科學(xué)素養(yǎng)評測的四個維度（PISA2015科學(xué)素養(yǎng)評估框架：能力、知識、態(tài)度、情景）在方案中都有體現(xiàn)：在情境上參考了PISA任務(wù)背景的分類維度（區(qū)域/國家/全球?qū)用?，自然資源/物理/科技前沿等），科學(xué)態(tài)度則是以發(fā)放人口學(xué)調(diào)研問卷的形式收集，科學(xué)知識和科學(xué)

15、能力兩個維度在試題的主體部分進(jìn)行考評，呈現(xiàn)方式包括靜態(tài)評估題（如選擇題、簡答題）、計算機交互任務(wù)、實際操作任務(wù)等。3.實施過程筆者將計算機任務(wù)情境與學(xué)生操作相結(jié)合進(jìn)行評測，讓被試者根據(jù)頁面呈現(xiàn)的試題信息作答。對于實驗操作題，被試者需要選取器材，組建裝置進(jìn)行實驗。傳感器將數(shù)據(jù)實時傳輸?shù)接嬎銠C的配套應(yīng)用軟件上，由被試者處理分析。在這一過程中，主試者使用標(biāo)準(zhǔn)引導(dǎo)語引導(dǎo)被試者作答，并根據(jù)評分細(xì)則對實驗操作項打分。與紙筆測試和單純的機試相比，數(shù)字化評測效果更佳，能全面地衡量學(xué)生知識的掌握和探究實踐能力的發(fā)展水平，實現(xiàn)對學(xué)生科學(xué)素養(yǎng)的綜合考評。（四）評測數(shù)據(jù)的分析與處理信效度分析是評測方案開發(fā)的重要一環(huán)，

16、評測方案必須經(jīng)歷多次理論論證和實踐評估并加以改進(jìn)才能完成交付?？茖W(xué)可靠的方案將為ICT評估的發(fā)展和數(shù)字化科學(xué)素養(yǎng)評測系統(tǒng)的完善提供有力的支持。1.評測數(shù)據(jù)的預(yù)處理數(shù)據(jù)預(yù)處理的步驟包括缺失值填補和數(shù)據(jù)篩選。為了盡可能利用測試數(shù)據(jù)，教師可使用SPSS軟件中的EM填補法或平均值填補法完成數(shù)據(jù)缺失值的填補，后續(xù)對評測總分進(jìn)行樣本Z分?jǐn)?shù)的計算，將異常數(shù)據(jù)值剔除。2.信效度分析筆者完成數(shù)據(jù)預(yù)處理后，使用SPSS軟件進(jìn)行正態(tài)性檢驗、信度分析與相關(guān)性分析，從而檢驗方案的信效度。首先，筆者根據(jù)樣本量選擇W檢驗或D檢驗，確定PISA效標(biāo)卷總分和評測方案總分是否符合正態(tài)分布；然后，對方案總體及各因子使用克隆巴赫系數(shù)

17、信度估計方法，判斷內(nèi)部一致性與穩(wěn)定性的情況；最后，檢驗PISA效標(biāo)卷與評測方案的外部相關(guān)性，確定評測方案是否具有較好的效標(biāo)關(guān)聯(lián)效度。3.Rasch模型數(shù)據(jù)分析除上述方法外，結(jié)合Rasch模型進(jìn)行試題要素分析也是驗證評測方案科學(xué)性的方式之一。在數(shù)據(jù)預(yù)處理后，筆者使用Winsteps軟件對方案進(jìn)行整體質(zhì)量檢驗，根據(jù)擬合指標(biāo)判斷題目的擬合情況；然后，實施單維性檢驗，根據(jù)標(biāo)準(zhǔn)殘差圖判斷方案是否考評了被試者同一潛在特質(zhì)；根據(jù)懷特圖中數(shù)據(jù)點的分布情況，檢驗題目難度與被試者能力的匹配程度；最后，運用項目擬合、氣泡圖等進(jìn)一步分析，對難度不合理、擬合度較差的題目予以修改保留或舍棄。筆者以某地區(qū)六年級學(xué)生的科學(xué)素

18、養(yǎng)評測數(shù)據(jù)的氣泡圖為例進(jìn)行簡要分析（如圖7），氣泡與題目一一對應(yīng)，氣泡直徑代表該題的標(biāo)準(zhǔn)差，縱坐標(biāo)代表題目難度，橫坐標(biāo)代表Outfit MNSQ（即擬合度檢驗的未加權(quán)均方擬合統(tǒng)計量），該值在0.51.5則表示題目滿足擬合要求。從圖7中可以清晰地判斷出，該評測方案大部分題目都在合理的區(qū)間內(nèi)，但第5、6兩題超出可接受的范圍，與模型預(yù)期不太擬合。此外，第13、14題的氣泡半徑明顯大于其他各題，說明在檢驗被試者能力水平時誤差較大，需要查閱題目對其進(jìn)行修改或刪除。圖7氣泡圖4. Logistic模型數(shù)據(jù)分析教師評測試題質(zhì)量還可以采用項目反應(yīng)理論Logistic模型，該模型適用于二級評分試題。筆者首先檢驗數(shù)據(jù)是否符合單維性假設(shè)，方法有定義分析法、探索性因子分析法等，假設(shè)成立則可以進(jìn)行參數(shù)估計；通過擬合度檢驗選擇更合適的Logistic模型進(jìn)行參數(shù)估計，繪制出項目特征曲線，考慮修改或刪除不符合項目曲線規(guī)律的題目；然后通過信息函數(shù)曲線判斷該方案所適合的學(xué)生的能力水平；最后對能力值進(jìn)行估計，優(yōu)化評測題目（如個別題目的表述、答案設(shè)置等）從而使方案更加完善。以某評測方案的項目特征曲線為例，筆者調(diào)

人人文庫> 全部分類> 應(yīng)用文書 > 研究報告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

基于數(shù)字化設(shè)備的中小學(xué)生科學(xué)素養(yǎng)評測設(shè)計

文檔簡介

溫馨提示

最新文檔

評論

基于數(shù)字化設(shè)備的中小學(xué)生科學(xué)素養(yǎng)評測設(shè)計

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔