試卷的合理均衡分配和評判反評判體系的構建_第1頁
試卷的合理均衡分配和評判反評判體系的構建_第2頁
試卷的合理均衡分配和評判反評判體系的構建_第3頁
試卷的合理均衡分配和評判反評判體系的構建_第4頁
試卷的合理均衡分配和評判反評判體系的構建_第5頁
已閱讀5頁,還剩18頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、試卷的合理均衡分配與評判和反評判指標體系的構建摘要 本文就試卷評閱的幾個方面作了對比分析,在試卷分配方面利用0-1規(guī)劃的分層多目標規(guī)劃解決了試卷的合理分配問題;在對分數(shù)的統(tǒng)計排名方面,建立基于關聯(lián)度分析的試卷綜合排名,并對評委評分的評分準確性進行排名,建立評委的評卷水平對試卷排名的反饋體系。比較發(fā)現(xiàn),以上方法均優(yōu)于傳統(tǒng)的試卷評閱方式。對于問題一,本文根據(jù)題中抽象出的約束條件建立基于0-1整數(shù)分層多目標規(guī)劃,實現(xiàn)了試卷分配的均衡分散型好的目標。在每份試卷有4位評委評閱的情況下,任意兩份試卷間的相同評委數(shù)和同一學校的試卷的分散性同時實現(xiàn)了較好(結果詳見表3和表4)。對于問題二,本文基于最大相關度理

2、論,將不完全打分矩陣轉化為完全打分矩陣,消除了傳統(tǒng)閱卷形式中因評委評分尺度不同造成的排名失真;同時在消除并列排名的問題;最后證明了本文的模型在對評委出現(xiàn)誤判的情況下,具有較強的糾錯能力(結果詳見表8和5.2.4)。對于問題三,本文基于問題二中構建的完全打分矩陣引入偏差度,建立識別評委作用的反饋控制,給出了對評委打分排名的反評判指標體系;對問題二中引入的案例二求解,得到帶反饋值的試卷排名(結果詳見表11和表13)。對于問題四,本文引入實際案例三,根據(jù)各個完全評分子模塊的穩(wěn)定性,引入修正系數(shù)。每個子模塊的初始分數(shù)與各模塊對應的修正系數(shù)即建立起具有相同評分標準的打分系統(tǒng),實現(xiàn)全部試卷的真是排名;同樣

3、的根據(jù)評委打分的偏差度,得到了評委的排名(結果詳見表16和表17)。關鍵字:0-1規(guī)劃 多目標規(guī)劃 相關度 偏差度 修正系數(shù)一、 問題重述在大學生數(shù)學建模競賽A題的評卷工作中,M個評委(M個評委來自不同的學校)要完成N份試卷的打分,競賽試卷來自K個學校,第j個學校有競賽試卷份,為節(jié)省人力,每份試卷只要由其中p( p M K N )個評委進行打分就行.1 根據(jù)回避原則,要求評委不能閱自己學校的試卷,請給出試卷合理的均衡分配方案的數(shù)學模型,使各評委閱卷工作量均衡;試卷分配均衡分散。(這里試卷分配均衡分散有下面兩個因素要考慮,見后。)給出試卷合理的均衡分配方案的計算機程序,要求用MATLAB或C語言

4、編寫。輸入?yún)?shù)為p ,M , K ,N ,輸出為各評委分別閱卷的號碼,就下列實例給出問題的答案。實例:某省有競賽試卷368份,16個評委閱卷,40所學校,p取3-5自己設定,如下表1: 表16956554910987654321頻數(shù)111121222336872傳統(tǒng)的評閱方式是:每份試卷只要由34個評委進行打分,(若取4個評委,則去掉一個最低分)按剩下的有效分求和,按分數(shù)排名決定名次。試給出你認為更好的試卷排名的評判指標體系,要說明比傳統(tǒng)的評閱方式好在哪里。3給出對評委打分排名的反評判指標體系。該方法要求對每個評委的水平(公平性)給出評價。4有文獻資料證明:對于完全評分矩陣(即全體評委評閱全部

5、試卷),無論評委評分尺度如何,總可以給出試卷的最好真實排名和反評判問題的評委排名。基于這一思想,全部試卷分配時按矩陣(a)類似情形分成35個完全評分子塊(兩省聯(lián)合閱卷能做到試卷合理的均衡分配方案),每一子塊當然能決定該子塊試卷的最好真實排名和反評判問題的評委排名,問題是由這些結果如何決定全部試卷的最好真實排名和反評判問題的評委排名?二、 基本假設1、 各評委都是獨立的給出試卷的分數(shù),不存在評委之間的討論;2、 評委對每份試卷評判除了誤判的情況,不存在刻意的提高或壓低分數(shù);3、 試卷存在真實的、令絕大多數(shù)評委信服的排名;4、 試卷分配在每一個模塊中的試卷質量是均勻的;5、 學校之間存在水平的差異

6、,每個學校中的學生也存在水平差異,但是平均來說學校間的水平差異更明顯;三、 符號說明符號含義參與評卷的評委個數(shù)上交試卷的總數(shù)參賽學校的個數(shù)評閱每份試卷的評委的個數(shù)第個評委是否評閱試卷任兩份試卷具有相同的評委的評委數(shù)的集合第個評委對第份試卷的評分/第份試卷的得分/修正得分/反饋得分生成的完全打分表中的第個評委對第份試卷的評分任意兩評委間評分關聯(lián)度矩陣第個評委對第份試卷的打分與準確分的偏差第個評委的打分的準確性權重第個評分子模塊第個子模塊的修正系數(shù)第個評委的打分偏差度四、 問題的分析4.1問題一本題要求完成試卷的分配任務,建立分配的數(shù)學模型并對給出的實例進行解答。因為試卷的數(shù)量比較大,如果按照常規(guī)

7、的評分方式即每一個評委都評閱所有的參賽試卷,則工作量特別大,難以在短時間內實現(xiàn)。所以現(xiàn)在需要建立一種新的分配模式,既要反映評卷的公平性又要減少工作量。在這種分配模式中要遵循3個原則:回避原則,多人評閱原則,均衡原則,2個評價指標:均衡分散指標1,均衡分散指標2。以以上3個必須遵守的原則為約束條件,2個評價指標為目標建立多目標規(guī)劃。 因為題中沒有給出個評委的出處,但在生活習慣中評委的產生經常是隨機的,即為評卷的公平性起見,在比賽之初便形成人組成的試卷評委庫,他們分別來自個學校。評卷開始時由評委會從人的評委庫中隨機的抽出名專家擔任評委。4.2問題二傳統(tǒng)的試卷評閱方式因為本身是不完全評分矩陣,由于部

8、分評委的評分尺度的把握不同,會造成最終的累加分數(shù)不能真實的反應試卷的真實排名。而如果評閱方式是完全評分矩陣的形式,則可以避免因為部分評委評分尺度的不同而造成的排名失真問題。但是由于工作量的制約難以實現(xiàn)所有評委的完全打分,所以可以利用現(xiàn)有的不完全評分矩陣,尋找評分尺度關聯(lián)度最大的評委,利用評委的打分來補全評委打分的缺損,進而建立補全的完全評分矩陣,實現(xiàn)準確的排名。另外,傳統(tǒng)的評閱方式即使是采用完全評分矩陣,能夠克服評委評分尺度造成的排名失真。但是其簡單的疊加積分方式:會出現(xiàn)并列排名的情況,通過構造的補全完全評分矩陣和多次迭代計算可以消除并列排名現(xiàn)象。4.3問題三 在問題二中重新建立了試卷的評閱模

9、型,討論的主要是對評委打出的不完全打分表的處理方式,以期通過評委的打分真實的反應試卷的真實水平,最后的排名能與實際中客觀存在的試卷的水平排名盡量吻合。但是實際中評委的評卷水平也是有差距的,水平高的評委打出的分數(shù)與該試卷的客觀真實的分數(shù)偏離比較小,這種評委打出的分數(shù)準確度也高;而有些評委則水平較低,打出的分數(shù)與實際偏離比較大,其打出的分數(shù)準確度也比較低。在確定評委評卷水平的時候我們引入了評委評分的準確性矩陣,用來衡量評委對每份論文評分的偏差程度。在確定了各評委的評卷水平以后,則可根據(jù)各評委的評卷水平確定出各評委的打分準確度,據(jù)此再將作為每個評委的打分權值反饋到試卷評閱工作中,對個試卷的分數(shù)重新計

10、算,即可確定新的各試卷的得分和排名。 本題中依然使用問題二中引入的案例。4.4問題四 問題四中建立了一個新的分卷評卷的體系,將一個大的評卷規(guī)模分成若干個小的規(guī)模,評委組也分成若干組,評委組和試卷組則形成了子模塊。在每個模塊內部實現(xiàn)完全打分,此時每個模塊都能給出試卷的最好真實排名和反評判問題的評委排名。但是和間的評委打分卻存在尺度偏差問題,這種偏差我們可以用模塊平均分之間的差異來衡量,并據(jù)此差異引入對各模塊的修正系數(shù),以此來消除模塊間的差異問題。 根據(jù)得到的模塊的修正系數(shù),則可以在整個評卷系統(tǒng)內以較一致的標準對各試卷進行評分和排名;對評委的評卷水平進行評估。 本題中引入了案例三。五、 模型的建立

11、與求解5.1問題一5.1.1模型的準備各因素的統(tǒng)一編號因為所給的學校、試卷、評委等都是有一定聯(lián)系的,為了更好的反應其中的關系便于統(tǒng)一使用,需要對3者進行統(tǒng)一的編號。1) 學校編號按上交試卷份數(shù)的多少排序,如上交份數(shù)最多的學校為01號,依次類推,直至號;2) 試卷編號試卷號碼編排分為兩個步驟:一、試卷評閱委員會給個學校分號段;二、各學校根據(jù)評委會分得的號段給各個參賽隊編號,再將具體編號信息反饋給評委會。如評委會將0169號段分給01號學校,01號學校在將自己學校的69份試卷從0169編號,并將具體信息反饋給評委會。3) 評委編號評委編號都與其出自的學校編號一致,即來自01號學校的評委編號為01號

12、。目標與約束條件的解釋根據(jù)題中信息提取出了2個目標和3個約束條件,現(xiàn)對其解釋如下:1) 目標1均衡分散原則1:任意兩份試卷出現(xiàn)的相同評委越少越好。2) 目標2均衡分散原則2:分配在每一個評委手中的試卷質量最好是好、中、差分布較為均勻。雖然沒有直接給出分試卷的質量等級,但是各個學校的水平是有差距的,可以以學校的平均質量來衡量分試卷的質量,如果01學校的水平高,則認為01學校的試卷質量普遍好于其他學校。所以在分配試卷時只要實現(xiàn)每個學校的試卷被均衡分配到各評委(自己學校的評委不能參評)即可認為每個評委手中的試卷質量是均勻的。3) 約束1回避原則:評委不能評閱自己學校的試卷。即01號評委不能評閱01號

13、試卷。4) 約束2多人評閱原則:為了體現(xiàn)評閱的公正性,每份試卷都需要被多位評委評閱。即每份試卷被評閱的次數(shù)等于參與評閱的評委人數(shù)。根據(jù)同種所給為取值為35。5) 約束3均衡原則:各評委工作量要均衡,即每位評委評閱的試卷份數(shù)要形同。結合約束2知:每個評委需要評閱的試卷份數(shù)為:當p分別取3,4,5時每位評委評閱的試卷份數(shù)的期望值為:評閱次數(shù)345期望值69921155.1.2模型的建立建立矩陣 行分別對應位評委,列分別為份被閱試卷。為矩陣中的元素,表示第i個評委是否評閱第j份試卷,在此引入0-1規(guī)劃:則對應的目標和幾個約束條件可表示為: 1) 目標1均衡分散原則1:任意兩份試卷出現(xiàn)的相同評委越少越

14、好。令 其中且則對任一組給定的,令,則是由個數(shù)組成的集合,則目標1的數(shù)學表示式為:其中且2) 目標2均衡分散原則2:各校試卷被盡可能均衡分到各評閱評委手中。第k個學校的試卷分數(shù)為,則該校試卷被均衡送到各評委手中的期望分數(shù)為,第i個評委評閱的第k校的試卷分數(shù)為,則目標2的數(shù)學形式為: 其中3) 約束1回避原則:自己學校評委不閱自己學校試卷。引入變量,其定義為:表示第i個評委編號與矩陣的行號數(shù)的對應關系,采用“隨機機制”產生評委,則需要通過變換得到,建立相應的變換關系。則約束1的數(shù)學表示為:,其中4) 約束2多人評閱原則:每一份試卷都要被個評委評閱。因為矩陣中的列表示試卷被位評委評閱的信息,所以約

15、束2的數(shù)學表示為:,5) 約束3均衡原則:每位評委評閱試卷總數(shù)相同。矩陣中的行表示評委評閱份試卷的信息,則約束3數(shù)學表示為:,總的模型: 因為根據(jù)題中所給意思,均勻分散原則的兩個目標存在一定的層次關系,所以建立分層多目標優(yōu)化模型,將做為第一層優(yōu)化目標,為第二層優(yōu)化目標。則建立的模型為: 5.1.3模型的求解 對于具體的題中所給的實例可知,不妨取,則的期望值為92。此時該實例的模型為:利用隨機數(shù)產生原理,從評委庫中隨機生成16位評委,16位評委出自得學校情況如下表2 所示:表2 評委出自的學校評委12345678910111213141516出自學校24251422921181112151916

16、172085則用MATLAB軟件對模型進行求解可以得到每位評委所需要評閱的試卷代號(見附錄1),對結果進行整理我們得到了每位評委所評閱的各學校的試卷的總數(shù),如下表3 所示:表3 評委評閱的各校試卷總數(shù) 評委學校123456789101112131415161181717171621182322131416181814142151414131713161413141613141561731414141314151419131361211172011412121312189151315111414791012521343551311340406322332412141324373222311314

17、224222822222123141222049222203112623122110122213112141223011123112201151223112121212110400222313113101322113121114210202001130122315121101122021012316121111013200303117111121012102010218111111011113100219111110102201131020101111010011201121111000110211021022120000010201121123111000111110111124012001

18、100120200225100211000012120126-4056486541351098396從上表中可以看出,分配情況比較好的滿足了“均衡分散原則1”,如學校1,2,3的試卷基本上均衡的分配在個評委手中。另外對“均衡分散原則2”進行檢驗時,我們發(fā)現(xiàn)任意兩個評委所評閱的試卷中最多的有3分相同,占總數(shù)的不到5%,很好的滿足了“均衡分散原則2”,具體結果見下表 :表4 均衡分散原則2的檢驗相同評委數(shù) 01234任意兩列的組合對20949293581404531760所占比例31%43.5&20.80%4.70%05.2問題二5.2.1案例的引入引入如下案例,共有試卷21份,5位評委,其中每份

19、試卷均由4位評委評閱,打分按照5分制進行,按照傳統(tǒng)的評閱方式得分如下表所示,其中表示第位評委沒有評閱試卷。表5 21份試卷的評委的殘缺打分表試卷評委1評委2評委3評委4評委5試卷評委1評委2評委3評委4評委5A012.52.52.502.5A1232.52.520A02054.554.5A13303.533A032.502.532A1403.5333A043.533.53.50A1504.544.53.5A052.52.5021.5A1633.502.52.5A062.501.52.53A172.502.52.52A0702222.5A1803.5442.5A083.54.504.54A190

20、43.544.5A0930222A202.533.503A1032.532.50A2103.5333A112.50222.5則這21份試卷按照傳統(tǒng)的試卷評閱方式:其中 ,且這21份試卷的排名情況為如下表所示:表6 21分試卷的得分與排名情況試卷號A02A15A08A19A18A04A21A14A13A20A16總得分1916.516.5161413.512.512.512.51211.5排名1224567791011試卷號A10A12A03A01A17A06A11A09A07A05總得分111010109.59.5998.58.5排名12131313161618182020從上表中可以發(fā)現(xiàn),按

21、照這種傳統(tǒng)的評閱方式相同排名的試卷比較多,但是實際情況下,因為各份試卷存在絕對排名,且試卷水平存在顯著性差異,所以這種評閱方式并不能很好的反應個試卷的水平。5.2.2模型的建立以上問題的出現(xiàn)完全是因為采用非完全打分機制出現(xiàn)的,所以該模型在于尋求一種途徑將現(xiàn)有的殘缺的打分矩陣通過計算機計算而非重新打分轉化成完全打分矩陣。雖然各個評委的評委尺度不同,但是某兩個評委和之間的評分尺度比較接近,則兩者對同一份試卷的評分具有某種關系。若評委對試卷的評分為,而評委沒有對試卷進行評閱,但是通過兩評委之間的評分關系,可以建立映射關系:。通過對殘缺矩陣的分析,可以找到任意兩評委之間的映射關系,則可以求的完全打分矩

22、陣,其映射關系可以表示為:則最終的數(shù)學模型為: 其中可由映射關系求得表示第份試卷的得分;和分別為完全打分矩陣和殘缺打分矩陣的元素,均表示第個評委對第份試卷的打分。5.2.3模型的求解1)任意兩評委間關聯(lián)度計算對殘缺打分表 用夾角余弦法對任意兩評委的打分進行關聯(lián)度分析,得到一個的相關度矩陣,其元素即表示評委與評委之間的相關度。由關聯(lián)度矩陣可以看出,則第1位評委與第5位評委的的打分相關度最大即第1位和第5位評委的打分尺度最接近,可以用第5為評委的打分來映射第1位評委的打分。例如試卷A02評委1沒有評閱,評委5的打分為4.5分,則通過映射可以知道評委1對試卷A02的打分,其中為比例系數(shù),可由評委1和

23、評委5的打分平均值確定。2)映射關系的確立用評委的打分來映射評委的打分,需要遵循以下原則: 若評委對他所閱的全部論文尺度緊(松),他所未看的論文殘缺數(shù)據(jù)的補缺也應尺度緊(松)。評委與評委的相關度大,則評委與評委的給分相似,評委對他所未看的論文殘缺數(shù)據(jù)的補缺應該用評委的給分按比例計算出??紤]到用相關度大的進行殘缺數(shù)據(jù)的補缺,會因為評委的誤判而引起評委的誤判,故應先由總分按比例計算出補缺的數(shù)據(jù),再由 ,算出補缺的數(shù)據(jù)進行加權平均,由這個數(shù)據(jù)進行殘缺數(shù)據(jù)的補缺。設由總分按比例計算出來的分數(shù)為,由相關度大的評委按比例計算出的分數(shù)為,兩者按等比例線性疊加則得到第位評委對第份試卷的打分,即相應的映射關系為

24、:2)生成完全打分矩陣并重新排名根據(jù)上面的映射關系則可以計算殘缺打分矩陣中缺失的元素,則補全后的完全打分表如下表7 所示:表7 補全后的完全打分表試卷評委1評委2評委3評委4評委5試卷評委1評委2評委3評委4評委5A012.52.52.52.5232.5A1232.52.522.385A024.74154.554.5A1333.2033.533A032.52.3992.532A142.9873.5333A043.533.53.53.126A153.8144.544.53.5A052.52.52.06121.5A1633.52.7792.52.5A062.52.2451.52.53A172.52

25、.1742.52.52A072.1732222.5A183.3843.5442.5A083.54.54.4484.54A193.57243.544.5A0932.108222A202.533.52.1343A1032.532.52.565A212.6793.5333A112.52.045222.5說明:表8 中帶下劃線的即是補全后的分值。 則根據(jù)補全后的完全打分表計算的各試卷排名情況為下表8 所示:表8 補全后的各試卷排名試卷號A02A08A15A19A18A04A13A14A21A16A20新得分23.74120.94820.31419.57217.38416.62615.70315.487

26、15.17914.27914.134新排名1234567891011舊排名1224569771110試卷號A10A01A03A12A06A17A09A11A07A05新得分13.56512.52312.39912.38511.74511.67411.10811.04510.67310.561新排名12131415161718192021舊排名12131313161618182020從表8 中的新舊兩次排名的對比可以發(fā)現(xiàn),本文中提供的評卷模型較舊有的模型很好的改進了并列排名的現(xiàn)象,與實際中的試卷的具有的真實的排名更接近。5.2.4模型的優(yōu)點 本文中提供的評卷排名模型不僅具有上述所說的消除并列排名

27、、減小評委評分尺度的差異對試卷排名造成的影響,最大的優(yōu)點在于其具體優(yōu)良的錯誤糾正能力,即如果某位評委對試卷的評分出現(xiàn)嚴重錯誤,被嚴重的多評或嚴重的少評分,那么按照傳統(tǒng)的評卷模式試卷的排名將會出現(xiàn)巨大的跳動,嚴重偏離試卷的真實排名。但是采用本文中提供的方法,即使出現(xiàn)嚴重的錯誤,在對殘缺矩陣進行補全時有雙重的措施避免(關聯(lián)度分析和 )這種錯誤對整個系統(tǒng)排名的影響。所以的嚴重錯誤對整個系統(tǒng)的排名幾乎沒有影響。例如,在實例2中的A04號試卷評委2的評分為3分,如果被評委2誤評為5分,則在傳統(tǒng)評卷模型中誤判后得分為15.5分,排名為第4名,對比情況見表9 :表9 傳統(tǒng)評卷模式誤判后得分排名的對比A04試

28、卷先前得分13.5A04試卷先前排名6A04試卷誤判后得分15.5A04試卷誤判后排名4而在本文的評卷模型中,出現(xiàn)上述誤判后的得分和排名情況基本不受影響,具體見表10 :表10 本文的評卷模型下誤判后得分排名對比A04試卷先前得分16.626A04試卷先前排名6A04試卷誤判后得分17.025A04試卷誤判后排名65.3問題三5.3.1模型的建立在問題二中我們已經得到了完全打分矩陣,其中的元素表示第個評委對第份試卷的評分。在此,我們將完全評分矩陣轉置成, , 其中表示第個評委對份試卷的評分。因為評委對每份試卷的評分與該試卷的實際分數(shù)都會存在一定的偏差,因此,我們可以用每份試卷的每個分數(shù)與這份試

29、卷的準確的水平之間的距離來表這種偏差,即用表示評委評分的準確性矩陣,其中, ,。顯然,如果越大,則越小,表明評委的給分與試卷的實際水平相差較大,評委的評卷水平較低;反之越大,則評委的給分與試卷的實際水平的相符程度越高,評委的評卷水平越高。如果,則取得最大值1。 令,則,則其中的值即可表示第個評委的評分準確性,值越小則該評委的評分準確性越低,值越大則該評委的評分準確性越高。 知道了每位評委的評分準確性向量,將其歸一化為,則可以作為第個評委的打分的準確性權重,將5個評委的打分與此權重之積進行線性求和,則得到帶有評委評分準確性反饋的試卷得分與排名,其數(shù)學模型表示為:,其中,5.3.2模型的求解 求評

30、委準確度并對其排名 通過MATLAB求解,得到了各個評委的評分準確性向量和各評委的評卷水平的排名,具體值見下表 :表11 各評委的評分準確性及排名評委評委1評委2評委3評委4評委5評分準確性19.29 19.67 19.41 19.36 18.58 評卷水平排名41235通過表11 我們可以發(fā)現(xiàn)評委2的評卷水平最高,評委5的評卷水平最低。這一結論與從評委打分的相關度矩陣得到直觀的印證, 因為評委5與另外4個評委的打分相關性都比較小,說明其打分隨機性比較大,出現(xiàn)誤判的幾率比較大,評卷水平比較低,而評委2則正好相反。試卷分數(shù)的反饋求解及排名我們已經知道了各評委的打分準確性向量,將其歸一化即得到了各

31、評委打分的準確性權重向量,其結果見下表:表12 各評委打分的準確性權重評委評委1評委2評委3評委4評委5評分準確性權重0.200 0.204 0.202 0.201 0.193 將此權重向量代入模型公式求解即得到帶有評委打分準確性反饋的試卷分數(shù)和排名,其結果見下表:表13 帶有反饋的試卷得分與排名試卷編號A02A08A15A19A18A04A13A14A21A16A20反饋得分4.7514.1934.0693.9103.4853.3263.1423.1003.0382.8612.827排名1234567891011試卷編號A10A01A03A12A06A17A09A11A07A05反饋得分2.

32、7132.5052.4832.4772.3432.3372.2222.2062.1312.118排名121314151617A1920215.4問題四5.4.1案例三的引入在案例三中,共有20份試卷,12位評委。將試卷和評委分成4個完全評分子模塊,,每個子模塊由5份試卷和3位評委組成。每個模塊中的全部評委都評閱全部試卷,則可以確定每個模塊中每份試卷的真實排名。下表 給出了子模塊的分組情況和各模塊內部的評分情況,空缺表示該評委不能評閱此試卷。表14 案例三評委1評委2評委3評委4評委5評委6評委7評委8評委9評委10評委11評委12A01758A02657A03876A04568A05656A0

33、6789A07766A08878A09655A10767A11778A12665A13677A14786A15889A16987A17787A18667A19758A20878依然用表示第個評委對第份試卷的打分,如果第個評委沒有評閱第份試卷,則。5.4.2模型的建立 試卷排名模型每個子模塊是完全評分的,其排名是準確的,在各子模塊之間引入修正系數(shù)的概念,每個完全評分子矩陣的分數(shù)乘上該子模塊對應的修正系數(shù)則得到所有子模塊在共同評分尺度下的得分,據(jù)此可以得到每份試卷的真實排名。設第子模塊的平均分為,則修正系數(shù),其中。得到修正系數(shù)后,進而則可以得到各評委的修正之后的打分,其中,。則第份試卷的最終得分數(shù)

34、學模型為:,其中評委排名模型對各子模塊內的評委打分的準確性排名比較容易實現(xiàn),可以使用問題三中所述的方法。但是將所有子模塊間的評委進行綜合排名,依然需要建立統(tǒng)一的評判標準,此時依然通過修正系數(shù)構建這樣的標準。對評委打分準確性的評判我們通過構建偏差度的概念來衡量,即評委所打分數(shù)與改試卷的實際分數(shù)的偏離程度。評委打分我們已經通過修正系數(shù)法建立的統(tǒng)一打分標準得到;試卷的實際得分可以通過各子模塊的完全評分矩陣得到,即第份試卷的實際得分為。則第評委打分的偏差度的數(shù)學模型為:,若時則不考慮,其中越大表明該評委打分的偏差度越大,評卷水平越低。5.4.3模型的求解利用計算各子模塊修正系數(shù)的計算公式,用MATLA

35、B計算得到各子模塊的修正系數(shù)如下表15 所示:表15 各子模塊的修正系數(shù)模塊打分總分總平均分各模塊試卷數(shù)各模塊總分各模塊均分修正系數(shù)14106.835956.331.07924106.8351026.81.04434106.8351046.930.98644106.8351087.20.949將各模塊的修正系數(shù)代入中求得統(tǒng)一評分標準下的各評委的修正打分,代入模型即可得到統(tǒng)一評分標準下的各試卷得分和排名,結果如下表 所示:表16 修正后的個試卷得分和排名試卷編號A15A06A08A16A03A20A11A01A17A14修正后得分8.2138.0327.7017.5927.5537.2797.2

36、277.1976.9566.902修正后排名12345678910試卷編號A04A10A13A02A07A19A05A18A12A09修正后得分6.836.6976.5776.4746.3556.336.1186.0075.5915.351修正后排名11121314151617181920因為采用了統(tǒng)一的評分準則,所以對20份試卷的排名實現(xiàn)了較大的公平化,排除了因部分模塊的評委打分比較嚴而導致的本模塊在全體排名中偏低的影響。從整體排名來看,各模塊中的單獨排名順序在整體的排名中依然保持不變,例如模塊1中五分試卷在模塊中的排名順序:A03,A01,A04,A02,A05,在整體試卷的排名中這種順序

37、保持不變,這一點符合實際情況。同樣可以得到各評委的打分偏差度與評卷水平的排名,結果如下表17 所示:表17 評委打分偏差度與評卷水平排名排名評委偏差度170.756251.123101.301481.404541.904692.3767123.102863.1369113.4021013.4931125.0451237.762 從對評委水平的排名來看,子模塊1的評委水平最低,這也符合實際,因為從案例三的打分表14 來看,子模塊1的評委打分的相關性最低,打分的隨機性比較大,所以其評委的排名比較低。六、 模型的評價和改進本文的問題涉及到了評卷系統(tǒng)的整個環(huán)節(jié),具體流程如下圖1所示:圖1 試卷評閱流程

38、問題一完成了試卷的分配,問題二和三則是在問題一得基礎上進行試卷的評卷統(tǒng)計、結果分析和分析結果的反饋并進行統(tǒng)計方法的調整;問題四則是在一種新的試卷分配方式下的評閱方案。6.1問題一 評價:問題一建立了多目標規(guī)劃模型,將均衡分散的兩個原則作為兩個目標評價因素,其他準則作為嚴格約束的條件,模型以一般形式表達,適用性廣且修改升級方便。引入0-1變量,表示方便簡潔,對較大規(guī)模的問題也能通過計算機快速解答。 改進:因為題中并沒有給出兩個目標的重要程度關系,所以采用了分層的方式,這也造成了計算機搜索結果可能并非最優(yōu)解,對于更實際的情況,如果明確知道目標的重要程度關系或者還能增加約束條件,則將能夠給出更好的解

39、。 本文中的評委的產生式通過構建評委庫并從中隨機產生,但是實際中評委產生的方法有很多,比如從交試卷最多的學校中產生。如果在評卷之初通過建立不同的評委產生機制進行模型的求解,找到最合適的評委產生機制,進而在制定具體的評委產生方案,是閱卷工作更公平公正。6.2問題二和問題三評價:在傳統(tǒng)的評卷系統(tǒng)中,由于是評委的評分是不完全評分矩陣,所以評委的評分尺度和誤判都將對試卷的排名產生較大的影響。問題二通過建立的基于關聯(lián)度分析的映射體系將不完全評分矩陣轉化成完全評分矩陣,消除了評委的評分尺度的不同對試卷排名的影響;同時也證明了在新模型下一個評委的誤判對試卷的排名幾乎沒有影響。模型的準確性和實用性比較強。問題

40、三在問題二的基礎上實現(xiàn)了對評委的打分準確性的排名,進而將這一排名做為反饋因子反饋到試卷的分數(shù)上,對試卷重新建立更科學的排名。改進:在將問題三中的對評委打分準確性的因素作為反饋因子反饋回試卷分數(shù)統(tǒng)計時,只迭代一次可能效果并不太好,可以進行多次迭代,知道達到比較理想的結果,具體可以通過概率檢驗實現(xiàn)。 基于對評委打分的關聯(lián)度分析矩陣可以實現(xiàn)對評委誤判的報警提示,如果評委與其他任何評委的關聯(lián)度都比較低的時候,說明該評委打分存在誤判,發(fā)出報警提示。6.1問題四評價:修正系數(shù)的模型在保持個完全評分子模塊穩(wěn)定性的同時,將不同子模塊間的所有試卷進行科學真實的綜合排名,方法簡單易行。但其是建立在各模塊分配的試卷

41、質量是好、中、差均勻的假設之上。改進:偏差度模型是對評委的反評價模型。根據(jù)試卷得分的總體結果,基于分數(shù)偏差建立識別個評委作用的反饋機制,以提高選擇評委的質量。因為對評委的評價也是建立在統(tǒng)一的準則之上,所以可以對評委的評卷水平進行公正的評價。七、 參考文獻1 易昆男. 殘缺數(shù)據(jù)的論文名次及評委水平的評判與逆判. 湘潭大學自然科學學報. 2005年.2 武建虎,賀佳,賀憲民,等. 多變量缺失數(shù)據(jù)的不同處理方法及分析結果比較. 第二軍醫(yī)大學學報. 2004年3 李建民,李慧民. 扣件式鋼管腳手架框架模型的計算長度修正系數(shù)法. 鐵道建筑. 2005年4 王正林,劉明. 精通MATLAB7. 電子工業(yè)出

42、版社. 2008年.八、 附錄附錄1:評委 12345678910111213141516試卷編號試卷編號試卷編號試卷編號11836533612216142734219375437183631481061155320385538424814179188157124213956394359151915201021913522405740447101623172111251324623415841451811202627281228142672442595346191223313229163016298264360544720132441403317311930927446155482123314245362232223410284562564922243248493925342547112946635750362633585044333527551230476458513727346459463537485613314865595342283569605038415460143

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論