




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 關(guān)于某競(jìng)賽網(wǎng)評(píng)結(jié)果的建模與分析摘 要本文建立了某競(jìng)賽網(wǎng)評(píng)結(jié)果的數(shù)學(xué)模型,分析了網(wǎng)評(píng)成績(jī)與最終成績(jī)的關(guān)系,提出了評(píng)價(jià)評(píng)委的相關(guān)指標(biāo)體系,考察了各競(jìng)賽試題間評(píng)委的差異性。對(duì)于問題1,要求給出網(wǎng)評(píng)成績(jī)與最終成績(jī)的相關(guān)性。注意到網(wǎng)評(píng)成績(jī)中每份論文有四個(gè)評(píng)委的具體分?jǐn)?shù),而最終成績(jī)只有該試卷的獲獎(jiǎng)等級(jí)。為了使得網(wǎng)評(píng)成績(jī)和最終成績(jī)具有可比性,我們首先將每份試卷的網(wǎng)評(píng)成績(jī)的標(biāo)準(zhǔn)分求平均值,并根據(jù)網(wǎng)評(píng)成績(jī)的平均標(biāo)準(zhǔn)分進(jìn)行排序;然后根據(jù)獲獎(jiǎng)的比例將網(wǎng)評(píng)成績(jī)轉(zhuǎn)換成獲獎(jiǎng)的等級(jí);最后將網(wǎng)評(píng)成績(jī)的獲獎(jiǎng)等級(jí)與最終獲獎(jiǎng)等級(jí)進(jìn)行比對(duì),計(jì)算出網(wǎng)評(píng)成績(jī)和最終成績(jī)的絕對(duì)差值,并構(gòu)造一個(gè)吻合度指標(biāo)和差異性指標(biāo)對(duì)網(wǎng)評(píng)成績(jī)與最終成績(jī)的相
2、關(guān)性進(jìn)行度量,另外計(jì)算了person相關(guān)系數(shù)、spearman相關(guān)系數(shù)以及kendall tau-b相關(guān)系數(shù)等統(tǒng)計(jì)學(xué)指標(biāo),從另外一方面來度量網(wǎng)評(píng)成績(jī)與最終成績(jī)的相關(guān)度。對(duì)于問題2,要求給出評(píng)價(jià)評(píng)委基本素質(zhì)的指標(biāo)體系。由于我們可用的數(shù)據(jù)僅為各評(píng)委所評(píng)試卷的分?jǐn)?shù)以及該試卷的最終成績(jī),為了度量該評(píng)委的基本素質(zhì),我們從三方面提出評(píng)價(jià)評(píng)委的指標(biāo)體系:評(píng)委評(píng)分的寬嚴(yán)度;評(píng)委所評(píng)試卷與他人評(píng)卷的評(píng)分偏離度;該評(píng)委所評(píng)試卷的網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)的差異度。由于標(biāo)準(zhǔn)分的折算已經(jīng)對(duì)評(píng)委評(píng)分寬嚴(yán)度進(jìn)行了修改,因此我們提出三個(gè)指標(biāo)來評(píng)價(jià)評(píng)委的評(píng)卷質(zhì)量:評(píng)委評(píng)分偏離度,評(píng)委吻合度指數(shù)和評(píng)委差異度指數(shù)。對(duì)于問題3,我們根據(jù)問
3、題2的三個(gè)評(píng)價(jià)指標(biāo)建立數(shù)學(xué)模型,利用附件中的評(píng)審數(shù)據(jù)計(jì)算每個(gè)評(píng)委的評(píng)分偏離度,評(píng)委吻合度指數(shù)和評(píng)委差異度指數(shù)等三個(gè)指標(biāo)值。根據(jù)這三個(gè)指標(biāo)值對(duì)評(píng)委進(jìn)行排序,并根據(jù)排序結(jié)果進(jìn)行聚類分析,并評(píng)選出優(yōu)秀評(píng)委。對(duì)于問題4,為了分析不同題目之間評(píng)委的整體表現(xiàn)的差異程度,我們根據(jù)評(píng)價(jià)評(píng)委的指標(biāo)值進(jìn)行方差分析,從方差分析的結(jié)果分析出現(xiàn)差異的主要原因。對(duì)于問題5,由于現(xiàn)有方案的終評(píng)成績(jī)是網(wǎng)評(píng)成績(jī)與集中評(píng)審成績(jī)的加權(quán)平均,其權(quán)重為,我們提出一般的網(wǎng)評(píng)和集中評(píng)審分?jǐn)?shù)的加權(quán)平均公式,并分析了網(wǎng)評(píng)成績(jī)的權(quán)重系數(shù)對(duì)終評(píng)成績(jī)的影響。最后建立了最優(yōu)權(quán)重系數(shù)的貝葉斯模型,討論了最優(yōu)權(quán)重的確定方法,并給出了相關(guān)結(jié)論。最后,我們對(duì)
4、全文進(jìn)行了總結(jié)。關(guān)鍵詞:網(wǎng)評(píng)成績(jī),差異度指數(shù),吻合度指數(shù),評(píng)分偏離度,方差分析。 目 錄一、問題重述與分析1二、模型的假設(shè)與符號(hào)說明3三、模型的建立及求解43.1 問題一模型建立與求解43.2 度量評(píng)委基本素質(zhì)指標(biāo)體系的建立93.3 問題三的模型建立與求解113.4 問題四模型建立與求解153.5 問題五的數(shù)學(xué)模型19四、模型的推廣及優(yōu)缺點(diǎn)分析23參考文獻(xiàn)24附錄25一、問題重述與分析某競(jìng)賽的評(píng)閱過程分兩階段進(jìn)行,分別稱為網(wǎng)評(píng)階段與集中評(píng)審階段。在網(wǎng)評(píng)階段,競(jìng)賽論文被隨機(jī)平均分配給每位評(píng)委,每份競(jìng)賽論文由四位評(píng)委評(píng)閱,每位評(píng)委以“百分制”記分,通過標(biāo)準(zhǔn)分計(jì)算公式將評(píng)委的“原始分”轉(zhuǎn)換成“標(biāo)準(zhǔn)分
5、”,按照標(biāo)準(zhǔn)分總分排序,前55%的論文進(jìn)入集中評(píng)審。集中評(píng)審階段每份論文由三位評(píng)委按“百分制”獨(dú)立評(píng)審,所有評(píng)委評(píng)審結(jié)束后,換算成標(biāo)準(zhǔn)分,最后將每份論文的三個(gè)標(biāo)準(zhǔn)分與網(wǎng)評(píng)中該論文的平均標(biāo)準(zhǔn)分一起求平均分,即為該論文的最終成績(jī)。請(qǐng)完成以下建模任務(wù):1. 競(jìng)賽組織者希望知道網(wǎng)評(píng)成績(jī)與最終成績(jī)的相關(guān)性,請(qǐng)根據(jù)附件中的評(píng)審結(jié)果,給出相應(yīng)的結(jié)論,并對(duì)網(wǎng)評(píng)結(jié)果作出評(píng)價(jià)。2. 從不同角度出發(fā),對(duì)競(jìng)賽評(píng)委有不同的基本素質(zhì)要求,請(qǐng)給出合理的度量評(píng)委基本素質(zhì)的指標(biāo)體系。3. 建立評(píng)價(jià)評(píng)委基本素質(zhì)的數(shù)學(xué)模型,并將其運(yùn)用于附件中的評(píng)審數(shù)據(jù),給出相應(yīng)的結(jié)論。4. 附件中abcde表示不同題目,試分析不同題目的評(píng)委的整體
6、表現(xiàn)之間是否存在顯著差異?如果存在,分析出現(xiàn)差異的可能原因。5. 試分析將網(wǎng)評(píng)成績(jī)加入總成績(jī)的利弊,并對(duì)如何更有效地利用網(wǎng)評(píng)成績(jī)給出相應(yīng)的建模結(jié)論。對(duì)于問題1,要求給出網(wǎng)評(píng)成績(jī)與最終成績(jī)的相關(guān)性,注意到網(wǎng)評(píng)成績(jī)中每份試卷有四個(gè)評(píng)委的具體分?jǐn)?shù),而最終成績(jī)只有該試卷的獲獎(jiǎng)等級(jí)。為了使得網(wǎng)評(píng)成績(jī)和最終成績(jī)具有可比性,我們首先將每份試卷的網(wǎng)評(píng)成績(jī)的標(biāo)準(zhǔn)分求平均值,并根據(jù)網(wǎng)評(píng)成績(jī)的平均標(biāo)準(zhǔn)分進(jìn)行排序;然后根據(jù)獲獎(jiǎng)的比例將網(wǎng)評(píng)成績(jī)轉(zhuǎn)換成網(wǎng)評(píng)獲獎(jiǎng)的等級(jí);最后將網(wǎng)評(píng)成績(jī)的獲獎(jiǎng)等級(jí)與最終獲獎(jiǎng)等級(jí)進(jìn)行比對(duì),計(jì)算出網(wǎng)評(píng)成績(jī)和最終成績(jī)的絕對(duì)差值,并構(gòu)造一個(gè)吻合度指標(biāo)和差異性指標(biāo)對(duì)網(wǎng)評(píng)成績(jī)與最終成績(jī)的相關(guān)性進(jìn)行度量。此
7、外我們計(jì)算了網(wǎng)評(píng)成績(jī)和最終成績(jī)的person相關(guān)系數(shù)、spearman相關(guān)系數(shù)以及kendall tau-b等級(jí)相關(guān)系數(shù),從另外一方面來度量網(wǎng)評(píng)成績(jī)與最終成績(jī)的相關(guān)度。有關(guān)相關(guān)系數(shù)的定義,可參考文獻(xiàn)1。對(duì)于問題2,要求給出評(píng)價(jià)評(píng)委基本素質(zhì)的指標(biāo)體系。由于我們可用的數(shù)據(jù)僅為各評(píng)委在網(wǎng)評(píng)階段對(duì)每份試卷所評(píng)的具體分?jǐn)?shù)以及該試卷的最終成績(jī),為了度量該評(píng)委的基本素質(zhì),我們從三個(gè)方面提出評(píng)價(jià)評(píng)委的指標(biāo)體系:(1)評(píng)委評(píng)分的寬嚴(yán)度,度量每位評(píng)委的對(duì)論文的評(píng)閱時(shí)偏松還是偏嚴(yán),有關(guān)評(píng)卷寬嚴(yán)度的度量可參考文獻(xiàn)2;(2)評(píng)委所評(píng)試卷與他人評(píng)卷的差異??紤]每個(gè)評(píng)委所評(píng)的所有試卷,由于每份試卷在網(wǎng)評(píng)階段是有四個(gè)評(píng)委評(píng)分
8、,因此該評(píng)委所評(píng)試卷與其他三位評(píng)委所評(píng)試卷的分?jǐn)?shù)差異大小反映了該評(píng)委的評(píng)卷質(zhì)量;(3)該評(píng)委所評(píng)試卷的網(wǎng)評(píng)成績(jī)的獲獎(jiǎng)等級(jí)與終評(píng)成績(jī)的獲獎(jiǎng)等級(jí)的差異也反應(yīng)了該評(píng)委評(píng)閱試卷的質(zhì)量。這里又包括兩個(gè)指標(biāo):吻合度指數(shù)和差異度指數(shù)。吻合度指數(shù)是指該評(píng)委所評(píng)試卷的網(wǎng)評(píng)獲獎(jiǎng)等級(jí)與最終獲獎(jiǎng)等級(jí)相吻合的所占其所評(píng)試卷的比例。但由于該評(píng)委所評(píng)試卷的網(wǎng)評(píng)成績(jī)和終評(píng)成績(jī)可能相差不同的等級(jí),因此差異度指標(biāo)反映了該評(píng)委的總體得分。由于標(biāo)準(zhǔn)分的折算已經(jīng)對(duì)評(píng)委評(píng)分寬嚴(yán)度進(jìn)行了修改,因此我們提出三個(gè)指標(biāo)來評(píng)價(jià)評(píng)委的評(píng)卷質(zhì)量:評(píng)委評(píng)分偏離度,評(píng)委吻合度指數(shù)和評(píng)委差異度指數(shù)。對(duì)于問題3,我們根據(jù)問題2的評(píng)價(jià)指標(biāo)體系建立數(shù)學(xué)模型,利用
9、附件中的評(píng)審數(shù)據(jù)計(jì)算每個(gè)評(píng)委的評(píng)分偏離度,吻合度指數(shù)和差異度指數(shù)三個(gè)指標(biāo)值。根據(jù)這三個(gè)指標(biāo)值對(duì)評(píng)委進(jìn)行排序,并根據(jù)排序結(jié)果進(jìn)行聚類分析,并評(píng)選出優(yōu)秀評(píng)委。有關(guān)模型的建立,我們可參考文獻(xiàn)3-5。對(duì)于問題4,為了分析不同題目之間評(píng)委的整體表現(xiàn)的差異程度,我們根據(jù)評(píng)價(jià)評(píng)委的指標(biāo)值進(jìn)行方差分析,從方差分析的結(jié)果分析出現(xiàn)差異的主要原因。我們可用spss統(tǒng)計(jì)軟件進(jìn)行方差分析,有關(guān)軟件的運(yùn)用可參考文獻(xiàn)6。對(duì)于問題5,為了度量網(wǎng)評(píng)成績(jī)加入總成績(jī)的利弊,根據(jù)現(xiàn)有評(píng)分方案,計(jì)算網(wǎng)評(píng)成績(jī)?cè)谧罱K成績(jī)中所占的作用,另外,我們可提出一般的網(wǎng)評(píng)和集中評(píng)審分?jǐn)?shù)的加權(quán)平均公式,建立最優(yōu)權(quán)重系數(shù)的數(shù)學(xué)模型,從而給出相關(guān)結(jié)論。二、
10、模型的假設(shè)與符號(hào)說明為了對(duì)網(wǎng)評(píng)成績(jī)建立更合理的數(shù)學(xué)模型,我們提出下面的假設(shè)。假設(shè)1:每個(gè)評(píng)委所評(píng)分?jǐn)?shù)都是自身基本素質(zhì)的體現(xiàn);假設(shè)2:集中評(píng)審的評(píng)委都是優(yōu)秀評(píng)委,所評(píng)分?jǐn)?shù)是考生真實(shí)分?jǐn)?shù)的反映;假設(shè)3:標(biāo)準(zhǔn)分折算公式是科學(xué)合理的;假設(shè)4:每道題的評(píng)價(jià)難度基本相等;假設(shè)5:所有評(píng)委評(píng)分都是獨(dú)立進(jìn)行的,即各評(píng)委評(píng)出的論文分?jǐn)?shù)是相互獨(dú)立的。為了書寫的方便,我們引入下面的記號(hào):符號(hào)符號(hào)說明總的論文份數(shù)總的評(píng)委位數(shù)第位評(píng)委對(duì)第份論文的網(wǎng)評(píng)原始分第位評(píng)委對(duì)第份論文的網(wǎng)評(píng)標(biāo)準(zhǔn)分第位評(píng)委網(wǎng)評(píng)的論文份數(shù)第份論文的網(wǎng)評(píng)平均標(biāo)準(zhǔn)分 第份論文的最終標(biāo)準(zhǔn)分 第份論文的集中評(píng)審的平均標(biāo)準(zhǔn)分 論文的網(wǎng)評(píng)標(biāo)準(zhǔn)分在最終成績(jī)中考慮的
11、權(quán)重因子三、模型的建立及求解3.1 問題一模型建立與求解為了分析網(wǎng)評(píng)成績(jī)與最終成績(jī)的相關(guān)性,使兩者具有可比性,我們首先要對(duì)最終成績(jī)進(jìn)行量化,并對(duì)網(wǎng)評(píng)原始分進(jìn)行數(shù)據(jù)處理。對(duì)最終成績(jī)進(jìn)行量化處理如下:由于網(wǎng)評(píng)成績(jī)是每位評(píng)委的具體分值,而終評(píng)成績(jī)是獲獎(jiǎng)等級(jí),為了使網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)進(jìn)行比較,我們的思想是將網(wǎng)評(píng)的平均標(biāo)準(zhǔn)分也換算成獲獎(jiǎng)等級(jí)。然后根據(jù)網(wǎng)評(píng)等級(jí)和終評(píng)等級(jí)進(jìn)行比對(duì),差異小則表明網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)相關(guān)度高;反之則說明網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)相關(guān)度低。具體的步驟分為以下幾步。()將網(wǎng)評(píng)原始分換算成標(biāo)準(zhǔn)分。設(shè)表示第位評(píng)委所評(píng)試卷份數(shù),而為總試卷數(shù),則第位評(píng)委所評(píng)份試卷的原始分求出相應(yīng)的均值和標(biāo)準(zhǔn)差分別為
12、:, (1)其中為第位評(píng)委對(duì)第份論文的網(wǎng)評(píng)原始分,這里。()根據(jù)標(biāo)準(zhǔn)分計(jì)算公式,得到第位評(píng)委對(duì)第份論文的評(píng)審標(biāo)準(zhǔn)分為.(2)()由于每份論文僅有4位評(píng)委對(duì)其評(píng)閱,因此中僅有4個(gè)數(shù)不為零,根據(jù)每個(gè)網(wǎng)評(píng)成績(jī)的標(biāo)準(zhǔn)分,可得到第份論文的網(wǎng)評(píng)平均標(biāo)準(zhǔn)分為。(3)()根據(jù)附件中每份論文的最終成績(jī),可得到各題獲獎(jiǎng)各獎(jiǎng)項(xiàng)的獲獎(jiǎng)比例及獲獎(jiǎng)份數(shù),如表3.1-表3.5:表3.1 a題獲獎(jiǎng)比例與試卷數(shù)a題獲獎(jiǎng)等級(jí)一等獎(jiǎng)二等獎(jiǎng)三等獎(jiǎng)不獲獎(jiǎng)獲獎(jiǎng)比例4.225%16.34%21.69%57.745%獲獎(jiǎng)試卷數(shù)155877205表3.2 b題獲獎(jiǎng)比例與試卷數(shù)b題獲獎(jiǎng)等級(jí)一等獎(jiǎng)二等獎(jiǎng)三等獎(jiǎng)不獲獎(jiǎng)獲獎(jiǎng)比例2.0498%17.78
13、91%22.4012%57.7599%獲獎(jiǎng)試卷數(shù)28243306789表3.3 c題獲獎(jiǎng)比例與試卷數(shù)c題獲獎(jiǎng)等級(jí)一等獎(jiǎng)二等獎(jiǎng)三等獎(jiǎng)不獲獎(jiǎng)獲獎(jiǎng)比例3.6885%18.0318%21.3115%56.9682%獲獎(jiǎng)試卷數(shù)1888104278表3.4 d題獲獎(jiǎng)比例與試卷數(shù)d題獲獎(jiǎng)等級(jí)一等獎(jiǎng)二等獎(jiǎng)三等獎(jiǎng)不獲獎(jiǎng)獲獎(jiǎng)比例1.9895%17.9637%23.0544%43.0076%獲獎(jiǎng)試卷數(shù)34307394974表3.5 e題獲獎(jiǎng)比例與試卷數(shù)e題獲獎(jiǎng)等級(jí)一等獎(jiǎng)二等獎(jiǎng)三等獎(jiǎng)不獲獎(jiǎng)獲獎(jiǎng)比例2.5052%17.9541%22.3382%42.7975%獲獎(jiǎng)試卷數(shù)24172213549()根據(jù)網(wǎng)評(píng)成績(jī)平均標(biāo)準(zhǔn)分可
14、對(duì)試卷進(jìn)行排序,并根據(jù)該題的獲獎(jiǎng)比例確定網(wǎng)評(píng)成績(jī)的獲獎(jiǎng)情況,得到網(wǎng)評(píng)成績(jī)的向量,其中 ()根據(jù)網(wǎng)評(píng)成績(jī)向量和終評(píng)成績(jī)向量進(jìn)行比對(duì),若與吻合度高,則說明網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)相關(guān)度高,否則說明網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)相關(guān)度低。為了更加客觀全面地度量網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)的相關(guān)性,我們分別定義了吻合度指數(shù)和差異度指數(shù),統(tǒng)計(jì)學(xué)相關(guān)性指標(biāo):person相關(guān)系數(shù)、spearman相關(guān)系數(shù)以及kendall tau-b相關(guān)系數(shù)等,并分別就五道題的網(wǎng)評(píng)數(shù)據(jù)進(jìn)行計(jì)算。(1)吻合度指數(shù)與差異度指數(shù)為了度量網(wǎng)評(píng)成績(jī)與最終成績(jī)的相關(guān)性,我們需要對(duì)網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)進(jìn)行比對(duì)。對(duì)每道題的網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī),定義向量:,則向量中分量的
15、數(shù)值表示網(wǎng)評(píng)成績(jī)和終評(píng)成績(jī)的差異值,可能取值為0,1,2,3,其中表示第份試卷的網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)的等級(jí)差值。統(tǒng)計(jì)中0,1,2,3的個(gè)數(shù)和比例,得到下面的結(jié)果:表3.6 網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)的絕對(duì)差值所占比例等級(jí)差值絕對(duì)吻合相差一級(jí)相差二級(jí)相差三級(jí)a題比例0.67330.30420.02250b題比例0.74380.24160.01460c題比例0.70290.25210.04300.0020d題比例0.42360.34640.21120.0187e題比例0.74740.23900.01360根據(jù)上面表格中的比例,做出a題網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)的吻合度比例的餅圖如下:圖3.1 a題網(wǎng)評(píng)與終評(píng)吻合度分
16、析圖類似地,畫出其他各題的吻合度比例圖如下:圖3.2 各題網(wǎng)評(píng)與終評(píng)吻合度分析圖從上面的餅圖可以看出,藍(lán)色區(qū)域表示絕對(duì)吻合占有最大的比例,說明網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)具有較強(qiáng)的相關(guān)性。記表示的分量中0的個(gè)數(shù),定義吻合度指數(shù)和差異度指數(shù)分別為:,以及= (4)顯然,越大反映網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)相關(guān)度越大,且;而越大則反映網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)的相關(guān)性越低。另外,值僅反映了網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)的一致性,而沒有度量網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)的差異度;但差異度指數(shù)正好補(bǔ)充了這一缺點(diǎn),不僅反映了網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)的不一致性,而且在數(shù)值上度量了網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)的差異度。我們分別計(jì)算各題的吻合度指數(shù)和差異度指數(shù)得到下面的表3.
17、7:表3.7各題的吻合度指數(shù)和差異度指數(shù)題目a題b題c題d題e題吻合度指數(shù)67.33%74.38%70.29%42.36%74.74%差異度指數(shù)34.93%27.09%34.43%82.50%26.62%根據(jù)吻合度指數(shù),我們得到各題的網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)的排序?yàn)椋篹題b 題c題a題d題。即e題的網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)的相關(guān)性是最高的,d題的網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)相關(guān)度最低。根據(jù)差異度指數(shù)對(duì)各題的網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)的排序?yàn)椋篹題b 題c題a題d題。即e題的網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)的相關(guān)性是最高的,d題的網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)相關(guān)度最低。與根據(jù)吻合度指數(shù)得到的相關(guān)性結(jié)果相同。(2)統(tǒng)計(jì)學(xué)相關(guān)性指標(biāo)為了從統(tǒng)計(jì)學(xué)上度量網(wǎng)
18、評(píng)成績(jī)與終評(píng)成績(jī)的相關(guān)性,我們定義一些相關(guān)性統(tǒng)計(jì)指標(biāo):person相關(guān)系數(shù)、spearman以及kendall tau-b等級(jí)相關(guān)系數(shù)。person相關(guān)系數(shù)是度量?jī)蓚€(gè)向量線性相關(guān)程度的指標(biāo),定義為:,(5)其中。person相關(guān)系數(shù)的取值在-1和1之間,度量了向量和的相關(guān)性,當(dāng)為正且越大則表明網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)相關(guān)度越高;而越小并近似為零時(shí),說明網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)相關(guān)度很低;當(dāng)為負(fù)數(shù)越大,說明網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)呈現(xiàn)負(fù)相關(guān)。若把向量和的分量進(jìn)行排序后得到秩向量,并根據(jù)秩向量定義相關(guān)系數(shù),這種相關(guān)系數(shù)稱為spearman相關(guān)系數(shù),定義為:,(6)其中分別為的秩。因?yàn)閟pearman相關(guān)系數(shù)是根據(jù)秩
19、定義的,因此不受量綱的影響。 另外,我們定義kendall tau等級(jí)相關(guān)系數(shù)為,(7)其中為次序一致的個(gè)數(shù)。根據(jù)上述三種相關(guān)系數(shù)的定義,我們得到a、b、c、d、e題的結(jié)果如下表:.表3.8 不同方法下的相關(guān)性檢驗(yàn)結(jié)果題目pearsonspearmankendall tau-ba0.75390.75200.6939b0.78830.80700.7524c0.71960.76210.7001d0.03730.03140.0284e0.8004081410.7586由表3.8可看出網(wǎng)評(píng)成績(jī)與最終成績(jī)呈正相關(guān),且a題、b題、c題和e題的相關(guān)系數(shù)都大于0.5,說明兩者有較強(qiáng)的相關(guān)性,其中b題的相關(guān)度最
20、大。而d題的相關(guān)度最小。3.2 度量評(píng)委基本素質(zhì)指標(biāo)體系的建立本小節(jié)我們將建立評(píng)價(jià)評(píng)委的指標(biāo)體系。由于我們可用的數(shù)據(jù)僅為各評(píng)委所評(píng)論文的分?jǐn)?shù)以及該試卷的最終成績(jī),為了度量評(píng)委的基本素質(zhì),我們從兩方面提出評(píng)價(jià)評(píng)委的指標(biāo)體系:評(píng)委所評(píng)試卷與他人評(píng)卷的差異,提出評(píng)閱寬嚴(yán)度指標(biāo)和評(píng)分偏離度指標(biāo)。該評(píng)委所評(píng)試卷的網(wǎng)評(píng)成績(jī)的獲獎(jiǎng)等級(jí)與終評(píng)成績(jī)的差異,提出評(píng)委吻合度指數(shù)及評(píng)委差異度指數(shù)。(1)評(píng)閱標(biāo)準(zhǔn)的寬嚴(yán)度集中趨勢(shì)和離散趨勢(shì)是數(shù)據(jù)分布的兩個(gè)基本特征。集中趨勢(shì)反映了一組數(shù)據(jù)的中心位置,即一組數(shù)據(jù)的代表值。在專家網(wǎng)評(píng)過程中,集中趨勢(shì)反映的是評(píng)委對(duì)評(píng)分標(biāo)準(zhǔn)把握的寬嚴(yán)程度,即總的說來,其對(duì)論文的評(píng)定是偏松還是偏嚴(yán)
21、,但對(duì)寬嚴(yán)問題,我們首先要找到一個(gè)參照點(diǎn),然后把評(píng)委的評(píng)分與這個(gè)參照點(diǎn)比較,才可能確定其寬嚴(yán)程度。這里我們采取區(qū)間估計(jì)和假設(shè)檢驗(yàn)的思想,若將所有評(píng)委對(duì)第份論文的評(píng)分看為一個(gè)總體,可假設(shè)該總體是服從正態(tài)分布的,且均值為該論文的實(shí)際成績(jī)。此時(shí)某個(gè)評(píng)委對(duì)該論文的評(píng)定成績(jī)可看為個(gè)體。若該個(gè)體與總體均值相差很大,則認(rèn)為該評(píng)委對(duì)論文的評(píng)定不是很準(zhǔn)確。因此,給定一個(gè)標(biāo)準(zhǔn),若,則表示該評(píng)委對(duì)論文的評(píng)審過寬;若,則表示該評(píng)委對(duì)論文的評(píng)審過嚴(yán),且越小代表該評(píng)委對(duì)論文的評(píng)審結(jié)果越準(zhǔn)確。定義為評(píng)委對(duì)第份論文網(wǎng)評(píng)結(jié)果的偏差。由于每位評(píng)委不只評(píng)一份論文,因此可用其平均偏差來度量評(píng)委的寬嚴(yán)度。因此給定標(biāo)準(zhǔn),若,則認(rèn)為評(píng)委偏
22、松;若,則表示評(píng)委偏嚴(yán);若,則表示評(píng)委評(píng)閱寬嚴(yán)度適中。由于未知,我們?nèi)粲贸ピu(píng)委的其他三位評(píng)委的平均分來估計(jì),令,其中表示除去評(píng)委的其他三位評(píng)委的平均分。因此,若,則可認(rèn)為評(píng)委相對(duì)其他評(píng)委偏松,若,則表示評(píng)委相對(duì)其他評(píng)委偏嚴(yán),若,則表示評(píng)委評(píng)閱寬嚴(yán)度適中。(2)評(píng)委評(píng)分偏離度根據(jù)評(píng)閱標(biāo)準(zhǔn)寬嚴(yán)的分析,絕對(duì)值度量了第個(gè)評(píng)委相對(duì)其他評(píng)委評(píng)分的偏離度。定義稱為評(píng)委的平均偏離度。該數(shù)值度量評(píng)委與其他評(píng)委評(píng)閱的差異。的值越小,表示評(píng)委相對(duì)其他評(píng)委的離差越小,可作為一個(gè)度量評(píng)委基本素質(zhì)的指標(biāo)體系。(3)評(píng)委吻合度指數(shù)根據(jù)問題1吻合度的定義,我們可對(duì)每位評(píng)委定義其評(píng)定吻合度,即可定義第位評(píng)委的吻合度指數(shù)為該評(píng)
23、委評(píng)閱的所有論文的網(wǎng)評(píng)成績(jī)與最終成績(jī)完全吻合的論文份數(shù)在其評(píng)閱的所有論文中所占的比例??勺鳛樵u(píng)價(jià)每位評(píng)委基本素質(zhì)的一個(gè)指標(biāo)體系,某評(píng)委的吻合度指數(shù)越高,代表其評(píng)分更準(zhǔn)確。(4)評(píng)委差異度指數(shù)同樣地,根據(jù)問題1差異度指數(shù)的定義,我們可分別對(duì)每位評(píng)委定義其差異度指數(shù),即為該評(píng)委評(píng)閱的所有論文的網(wǎng)評(píng)成績(jī)與最終成績(jī)之差的絕對(duì)值的平均值。也可作為度量評(píng)委基本素質(zhì)的一個(gè)指標(biāo)體系。3.3 問題三的模型建立與求解根據(jù)上一節(jié)我們對(duì)評(píng)價(jià)評(píng)委基本素質(zhì)的指標(biāo)體系的分析可知,評(píng)閱標(biāo)準(zhǔn)的寬嚴(yán)指標(biāo)值并不能反映該評(píng)委的綜合素質(zhì),并且對(duì)原始分的標(biāo)準(zhǔn)化后基本能消除寬嚴(yán)度對(duì)論文評(píng)審的影響。下面我們根據(jù)評(píng)委評(píng)分偏離度、評(píng)委吻合度指數(shù)
24、和評(píng)委差異度指數(shù)等三個(gè)指標(biāo)建立三個(gè)數(shù)學(xué)模型,來度量各評(píng)委的基本素質(zhì),并運(yùn)用于附件中的評(píng)審數(shù)據(jù)。(1) 評(píng)委評(píng)分偏離度指數(shù)如上面所分析的,我們可對(duì)第位評(píng)委建立評(píng)分偏離度模型:(8)其中表示除去評(píng)委的其他三位評(píng)委的平均分。越小,表示評(píng)委相對(duì)其他評(píng)委的差異越小。(2)評(píng)委吻合度指數(shù)根據(jù)問題1建立的模型及問題2建立的評(píng)價(jià)評(píng)委基本素質(zhì)的指標(biāo)體系我們可對(duì)每位評(píng)委分別建立其吻合度指數(shù)模型:,(9)其中為第位評(píng)委參加評(píng)閱的所有份論文中,網(wǎng)評(píng)成績(jī)與最終成績(jī)差值為零的個(gè)數(shù)。值越大,表示第位評(píng)委的網(wǎng)評(píng)成績(jī)更準(zhǔn)確。(3)評(píng)委差異度同樣引用問題1的記號(hào),向量,其中表示第份試卷的網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)的等級(jí)差值,可能取值為0
25、,1,2,3。我們定義差異度指數(shù)模型為:。(10)越小,表明第位評(píng)委的網(wǎng)評(píng)成績(jī)?cè)接行?,即與所評(píng)論文的真實(shí)水平更接近。根據(jù)上述三個(gè)評(píng)價(jià)評(píng)委基本素質(zhì)的數(shù)學(xué)模型,我們首先對(duì)a題計(jì)算每位評(píng)委的各評(píng)價(jià)指標(biāo)值并進(jìn)行排名,得到結(jié)果如下表3.9。表3.9 a題評(píng)委基本素質(zhì)指標(biāo)值及排名名次評(píng)委評(píng)委評(píng)委1a033.8278a060.7379a140.28432a063.8579a140.7255a130.28433a144.0571a130.7157a060.3014a074.0727a010.7129a030.31075a124.2725a020.71a010.31686a134.5206a090.6961a0
26、20.337a094.7778a040.69a090.33338a084.9844a030.6893a040.349a045.0244a100.6634a100.366310a025.2674a080.6569a080.372511a115.4333a070.65a070.3812a015.4468a120.6238a120.386113a056.7566a110.6078a110.411814a107.7309a050.5446a050.4752從上表中可以看出,從評(píng)委評(píng)分偏離度來看,最優(yōu)閱卷評(píng)委的前三名是a03,a06和a14,而從評(píng)委吻合度指標(biāo)排名的前三名則是a06,a14和a13,從評(píng)
27、委差異度排名的前三名則為a14,a13和a06。因此選取不同的指標(biāo)對(duì)評(píng)委的評(píng)價(jià)得出的結(jié)論是不同的。若綜合考慮評(píng)委評(píng)分偏離度、評(píng)委吻合度和評(píng)委差異度三個(gè)指標(biāo)對(duì)評(píng)委用spss軟件進(jìn)行聚類分析,則可以得到下面的聚類圖3.3。圖3.3 a題評(píng)委聚類樹狀圖根據(jù)上面聚類圖,可將a題評(píng)委分為四類:優(yōu)秀,良好,中等和較差,結(jié)果如下表。表3.10 a題評(píng)委綜合三個(gè)指標(biāo)的聚類結(jié)果聚類等級(jí)優(yōu)秀良好中等較差評(píng)委序號(hào)a06,a14,a13,a01a02,a09,a04,a03,a08,a07,a12,a11a10a05同理,分別計(jì)算b題、c題、d題、e題的各指標(biāo)值并進(jìn)行排名(結(jié)果見附錄1),然后綜合三個(gè)指標(biāo)對(duì)評(píng)委的基本
28、素質(zhì)進(jìn)行聚類(聚類圖見附錄2),能夠篩選出優(yōu)秀評(píng)委,結(jié)果如下:表3.11 bcde題評(píng)委綜合三個(gè)指標(biāo)的聚類結(jié)果聚類等級(jí)優(yōu)秀良好中等較差b題評(píng)委序號(hào)b19,b29,b30,b38,b42,b46,b54b03,b08,b11,b12,b13,b15,b22,b25,b26,b27,b28,b31,b37,b40,b45,b49,b50,b51,b52,b53b01,b02,b04,b05,b06,b07,b09,b10,b14,b16,b17,b18,b20,b21,b23,b24,b32,b33,b34,b35,b36,b39,b41,b43,b44,b47,b48,b55c題評(píng)委序號(hào)c12,
29、c14,c17,c02,c09c11,c13,c15,c20,c03,c04c01,c10,c18,c05,c06,c07,c08c16,c19d題評(píng)委序號(hào)d01,d06,d07,d12,d19,d33,d35,d41,d44,d45,d46,d51d03,d05,d10,d16,d24,d26,d29,d36,d37,d40,d42,d49,d54,d55,d57,d63,d64,d68d02,d04,d08,d09,d11,d13,d20,d21,d22,d25,d27,d28,d31,d32,d34,d38,d39,d43,d47,d48,d50,d52,d53,d56,d58,d59,
30、d60,d62,d65,d66,d69d14,d15,d17,d18,d23,d30,d61,d67e題評(píng)委序號(hào)e07,e09,e18,e19,e20,e21,e30,e38e01,e02,e03,e22,e23,e26,e27,e32e04,e05,e06,e10,e11,e12,e13,e15,e16,e17,e24,e28,e29,e31,e35,e36,e37e08,e14,e25,e33,e34根據(jù)上面的聚類結(jié)果,我們?nèi)菀椎玫礁黝}評(píng)委的素質(zhì)表現(xiàn),并對(duì)評(píng)委的表現(xiàn)進(jìn)行評(píng)價(jià)或者評(píng)選優(yōu)秀評(píng)委。3.4 問題四模型建立與求解本節(jié)主要解決五個(gè)不同題目的評(píng)委的整體表現(xiàn)之間是否存在顯著性差異,我們可根
31、據(jù)問題3中各評(píng)委的評(píng)價(jià)指標(biāo)得分運(yùn)用方差分析的方法進(jìn)行判斷。有關(guān)方差分析的方法可參考文獻(xiàn)7。由于進(jìn)行方差分析要滿足一些基本假定,即正態(tài)性、方差齊性、獨(dú)立性假設(shè),由于各評(píng)委評(píng)分是相互獨(dú)立的,因此獨(dú)立性假設(shè)滿足。下面我們首先對(duì)指標(biāo)得分進(jìn)行正態(tài)性及方差齊性檢驗(yàn)。以評(píng)委的評(píng)分偏離度為例,我們將abcde看成五個(gè)總體,每個(gè)總體中若干個(gè)評(píng)委的評(píng)分偏離度看成總體的獨(dú)立同分布樣本,設(shè)不同題目的樣本容量分別為,樣本分別為,表示第題第位評(píng)委的評(píng)分偏離度。首先運(yùn)用matlab軟件對(duì)五個(gè)題目的評(píng)委評(píng)分偏離度畫出相應(yīng)的qq-plot(分位數(shù)-分位數(shù)圖),如圖3.4,其中不同的圖形標(biāo)記代表不同題目對(duì)應(yīng)的qq-plot。圖3
32、.4 評(píng)委評(píng)分偏離度的正態(tài)性檢驗(yàn)qq-plot從上面的qq-plot可以看出,這五個(gè)題目的評(píng)分偏離度的qq-plot都近似為直線,因此可以假設(shè)這些總體的評(píng)分偏離度都服從正態(tài)分布。同樣的,可畫出評(píng)委的吻合度指數(shù)及差異度指數(shù)的qq-plot,如圖3.5-3.6,由圖可看出不同題目下,這兩個(gè)指標(biāo)的qq-plot都近似為直線,因此,也可以假設(shè)這些總體的吻合度指數(shù)及差異度指數(shù)都服從正態(tài)分布。且由吻合度指數(shù)的qq-plot可看出d題的吻合度指數(shù)明顯大于其他題目的。圖3.5 評(píng)委吻合度指數(shù)的正態(tài)性檢驗(yàn)qq-plot圖3.6 評(píng)委差異度指數(shù)的正態(tài)性檢驗(yàn)qq-plot下面進(jìn)行方差齊性檢驗(yàn)。同樣以偏離度為例,設(shè)第
33、個(gè)題目(總體)的評(píng)分偏離度服從正態(tài)分布。為了對(duì)五個(gè)總體的均值進(jìn)行方差分析,我們首先做下面的方差齊性檢驗(yàn): vs 方差齊性檢驗(yàn)有多種方法,最常用的是bartlett檢驗(yàn),檢驗(yàn)統(tǒng)計(jì)量為,(11)其中,為因子水平數(shù),為第題目的樣本方差,為自由度,為組內(nèi)偏差平方和,表達(dá)式為。對(duì)給定的顯著性水平,我們做上述檢驗(yàn),結(jié)果如表3.12:表3.12 各評(píng)價(jià)指標(biāo)的方差齊性檢驗(yàn)結(jié)果統(tǒng)計(jì)量df1df2顯著性偏離度1.4284191.226吻合度1.7404191.143差異度4.8404191.011因此該檢驗(yàn)的為0.226,顯然大于0.05,根據(jù)假設(shè)檢驗(yàn)的思想,則接收原假設(shè),即可認(rèn)為這五個(gè)總體的方差相等。同樣的,對(duì)
34、另外兩個(gè)指標(biāo)得分做方差齊性檢驗(yàn),得到結(jié)果如表3.12,認(rèn)為這五個(gè)總體的吻合度得分及差異度得分的方差均相等。設(shè)第個(gè)題目(總體)的評(píng)分偏離度服從正態(tài)分布。即各個(gè)總體的評(píng)分偏離度具有相同的方差。為了說明不同題目(總體)在評(píng)分偏離度上的表現(xiàn),則我們的目標(biāo)是檢驗(yàn)下面的假設(shè): vs 從統(tǒng)計(jì)學(xué)上看,將這五個(gè)題目的總體看成評(píng)委評(píng)分偏離度的五個(gè)水平,因此為了檢驗(yàn),實(shí)際上就是對(duì)這五個(gè)總體做方差分析。根據(jù)樣本數(shù)據(jù),運(yùn)用spss對(duì)上述假設(shè)做方差分析,得到方差分析表如下:表3.13評(píng)委評(píng)分各指標(biāo)的方差分析結(jié)果平方和df均方f顯著性偏離度組間28.50847.12714.016.000組內(nèi)97.121191.508總數(shù)1
35、25.630195吻合度組間4.30341.076575.886.000組內(nèi).357191.002總數(shù)4.660195差異度組間12.96143.240860.826.000組內(nèi).719191.004總數(shù)13.680195由上表可看出值均為零,因此拒絕原假設(shè)。即認(rèn)為不同題目的評(píng)委在評(píng)分偏離度、吻合度、差異度上的表現(xiàn)均存在顯著性差異。為了分析題目?jī)蓛芍g的差異,我們進(jìn)行多重比較,即做下面的假設(shè)檢驗(yàn): 由于不同題目的樣本容量不同,我們采用重復(fù)數(shù)不等情況的s法,這是scheffe在1953年提出的多重比較法。若給定顯著性水平,令,.當(dāng)時(shí),拒絕原假設(shè),即認(rèn)為題目與題目的評(píng)委之間存在顯著性差異,否則保留
36、原假設(shè),認(rèn)為兩題的評(píng)委之間不存在顯著性差異。我們運(yùn)用spss對(duì)不同題目?jī)蓛芍g進(jìn)行檢驗(yàn),得到結(jié)果如表3.14。表3.14各題目之間偏離度方差分析表題目f值p值題目f值p值ab13.430.000bd1.370.244ac.078.782be.955.331ad18.764.000cd39.211.000ae15.094.000ce36.152.000bc30.613.000de.003.960由表可得出,從偏離度角度分析,ab、ad、ae、bc、cd、ce題目的評(píng)委整體表現(xiàn)存在顯著性差異,ac、bd、be、de題目的評(píng)委之間不存在顯著性差異。因此,我們可判斷ac題目評(píng)委之間不存在顯著性差異,b
37、de題目的評(píng)委之間不存在顯著性差異。由此分析可能產(chǎn)生顯著性差異的原因,可以從兩個(gè)方面考慮:一方面是客觀環(huán)境的因素,即評(píng)閱ac題目的評(píng)委與評(píng)閱bde題目的評(píng)委在不同的環(huán)境下評(píng)閱。另一方面,注意到不同的題目的難度不同,在評(píng)閱時(shí)可能引起的評(píng)委之間的分歧也不同。均方很小的題目表明評(píng)委在評(píng)閱時(shí)產(chǎn)生的分歧比較小,而均方較大的題目表明題目的難易程度有較大差別,導(dǎo)致評(píng)委在評(píng)閱試卷時(shí)產(chǎn)生的分歧較大,也說明題目的題型傾向于更加靈活。類似地,我們可以對(duì)五個(gè)題目?jī)蓛芍g的評(píng)委吻合度和評(píng)委差異度做方差分析,得到結(jié)果分別如表3.15及表3.16,分析兩種結(jié)果均與從偏離度角度分析的結(jié)果相同。表3.15 各題目之間吻合度方差
38、分析表題目f值p值題目f值p值ab24.142.000bd.991.301ac3.840.059be.169.682ad341.556.000cd672.379.000ae35.095.000ce23.622.000bc13.560.000de.725.547表3.16 各題目之間差異度方差分析表題目f值p值題目f值p值ab24.815.000bd.916.361ac.002.963be.225.637ad475.693.000cd643.595.000ae38.429.000ce44.857.000bc32.254.000de.292.6113.5.問題五的數(shù)學(xué)模型問題5中要求分析網(wǎng)評(píng)成績(jī)加
39、入總成績(jī)的利弊,并對(duì)如何更有效地利用網(wǎng)評(píng)成績(jī)給出相應(yīng)的結(jié)論。在目前的方案中,集中評(píng)審階段每份論文由三位評(píng)委按“百分制”獨(dú)立評(píng)審,把每位評(píng)委的給出的分?jǐn)?shù)全部換算成標(biāo)準(zhǔn)分,然后將每份論文的三個(gè)標(biāo)準(zhǔn)分與網(wǎng)評(píng)中該論文的平均標(biāo)準(zhǔn)分加在一起,求得的平均分就作為該論文的最終成績(jī)。設(shè)第份論文的最終標(biāo)準(zhǔn)成績(jī)?yōu)?,集中評(píng)審的成績(jī)標(biāo)準(zhǔn)分為,則現(xiàn)在方案的最終成績(jī)可用下面的公式來表述:其中 分別表示第份論文在集中評(píng)審階段由三位評(píng)委給出成績(jī)換算得到的標(biāo)準(zhǔn)分, 表示第份論文在集中評(píng)審階段由三位評(píng)委給出成績(jī)的平均標(biāo)準(zhǔn)分。根據(jù)上式,最終成績(jī)實(shí)際上是網(wǎng)評(píng)平均成績(jī)和終評(píng)平均成績(jī)的加權(quán)平均,且網(wǎng)評(píng)平均標(biāo)準(zhǔn)分在最終成績(jī)中所占的權(quán)重因子為
40、 。為了進(jìn)一步分析將網(wǎng)評(píng)成績(jī)?cè)谧罱K成績(jī)中所起的作用,定義最終成績(jī)?yōu)? 其中權(quán)重因子的取值范圍為 。從上面公式中可以看出,當(dāng)增大時(shí),意味著第份論文的網(wǎng)評(píng)平均標(biāo)準(zhǔn)分對(duì)總成績(jī)的影響會(huì)增大,反之,當(dāng)減小時(shí),意味著第份論文的網(wǎng)評(píng)平均標(biāo)準(zhǔn)分對(duì)總成績(jī)的影響會(huì)減小。特別地,當(dāng)時(shí),說明網(wǎng)評(píng)成績(jī)不加入總成績(jī),第份論文的最終成績(jī)只由集中評(píng)審階段的三位評(píng)委的平均標(biāo)準(zhǔn)分決定。當(dāng) 時(shí),只考慮第份論文的網(wǎng)評(píng)平均標(biāo)準(zhǔn)分,不考慮集中評(píng)審階段的平均標(biāo)準(zhǔn)分。顯然,的選取對(duì)終評(píng)成績(jī)具有很大的影響。那么,如何選取最優(yōu)的權(quán)重因子呢?的選取又跟那些因素有關(guān)?下面我們建立權(quán)重因子的貝葉斯模型,探討網(wǎng)評(píng)成績(jī)對(duì)終評(píng)成績(jī)的影響。假設(shè)某份論文的真實(shí)
41、成績(jī)?yōu)?,由于論文成?jī)的異質(zhì)性(參考文獻(xiàn)3),假設(shè)本身也是隨機(jī)變量,服從正態(tài)分布。一般地,假設(shè)在網(wǎng)評(píng)階段有位評(píng)委對(duì)該論文進(jìn)行評(píng)分,則在給定條件下,第個(gè)評(píng)委對(duì)該論文所評(píng)的網(wǎng)評(píng)標(biāo)準(zhǔn)分相互獨(dú)立并服從,;而在集中評(píng)審時(shí)有位評(píng)委對(duì)論文進(jìn)行評(píng)分,且假設(shè)其評(píng)分標(biāo)準(zhǔn)成績(jī)相互獨(dú)立且服從,。假設(shè)網(wǎng)評(píng)成績(jī)?cè)诮K評(píng)成績(jī)中所占比例為,即終評(píng)成績(jī)?yōu)?,其中?即是的一個(gè)加權(quán)估計(jì)。我們求解下面的最優(yōu)化問題.定理1:在上面的模型中,網(wǎng)評(píng)成績(jī)?cè)诮K評(píng)成績(jī)中所占的最優(yōu)比例為.(12)因此論文真實(shí)分?jǐn)?shù)的最優(yōu)估計(jì)為.(13)證明:令,對(duì)關(guān)于求導(dǎo)并令導(dǎo)數(shù)為零,可解出最優(yōu)權(quán)重為.根據(jù)條件期望公式有,以及.因此可得.證畢。從定理1可以看出,影響權(quán)
42、重因子的因素包括:(a)每份論文的網(wǎng)評(píng)評(píng)委個(gè)數(shù);(b)每份論文的集中評(píng)審評(píng)委個(gè)數(shù);(c)網(wǎng)評(píng)評(píng)委的方差;(d)集中評(píng)審評(píng)委的方差;(e)試卷分?jǐn)?shù)本身的方差。根據(jù)的表達(dá)式,我們得到下面的結(jié)論。推論1:網(wǎng)評(píng)成績(jī)的權(quán)重因子可以表達(dá)為是的增函數(shù),即網(wǎng)評(píng)的評(píng)委個(gè)數(shù)越多,則網(wǎng)評(píng)成績(jī)所占的比重越大。這是符合實(shí)際情況的。因?yàn)榫W(wǎng)評(píng)的評(píng)委越多,則評(píng)審出來的成績(jī)就更加真實(shí),具有代表性。推論2:網(wǎng)評(píng)成績(jī)的權(quán)重因子是網(wǎng)評(píng)專家的評(píng)分方差的減函數(shù),是集中評(píng)審專家的評(píng)分方差的增函數(shù)。顯然,方差在某種意義上代表了評(píng)審專家的評(píng)閱水平,方差越小表示該評(píng)委專家的評(píng)分越準(zhǔn)確。因此網(wǎng)評(píng)專家的水平越高則應(yīng)對(duì)網(wǎng)評(píng)成績(jī)賦予更大的權(quán)重,反之集中
43、評(píng)審專家的水平越高則應(yīng)對(duì)網(wǎng)評(píng)成績(jī)賦予更小的權(quán)重。 推論3:網(wǎng)評(píng)成績(jī)的權(quán)重因子是試卷分?jǐn)?shù)本身方差的增函數(shù)。根據(jù)定理1和以上三個(gè)推論,我們可以根據(jù)具體的情況設(shè)計(jì)最優(yōu)的權(quán)重因子,使得最終的成績(jī)?cè)u(píng)價(jià)更加合理。當(dāng)然,由于中的方差,和是未知的,若有集中評(píng)審的數(shù)據(jù),則可根據(jù)貝葉斯統(tǒng)計(jì)的方法對(duì)這些參數(shù)進(jìn)行估計(jì)??蓞⒖嘉墨I(xiàn)8-9。四、模型的推廣及優(yōu)缺點(diǎn)分析本文對(duì)某競(jìng)賽網(wǎng)評(píng)的結(jié)果建立了數(shù)學(xué)模型,并討論了網(wǎng)評(píng)成績(jī)與終評(píng)成績(jī)的相關(guān)度,根據(jù)評(píng)審數(shù)據(jù)分析了網(wǎng)評(píng)的評(píng)委專家的綜合素質(zhì),最后給出了分析了網(wǎng)評(píng)成績(jī)加入總成績(jī)的利弊,利用貝葉斯統(tǒng)計(jì)的方法建立了網(wǎng)評(píng)成績(jī)?cè)诳偝煽?jī)中的最優(yōu)權(quán)重模型,得到了最優(yōu)權(quán)重的確定方法。本模型可推廣到
44、人才選拔、公司招聘、公務(wù)員錄用等相關(guān)領(lǐng)域。本模型不僅給出了競(jìng)賽論文的網(wǎng)評(píng)成績(jī)的定性分析,更重要的是從數(shù)學(xué)上建立了模型,定量分析了網(wǎng)評(píng)成績(jī)與最終成績(jī)的相關(guān)度,定量分析了評(píng)委的綜合素質(zhì)情況,還建立了網(wǎng)評(píng)成績(jī)的最優(yōu)占比模型,在實(shí)際中直接運(yùn)用。然而,本題沒有給出論文的集中評(píng)審數(shù)據(jù),使得無法估計(jì)出最優(yōu)權(quán)重中的方差參數(shù),僅僅能分析得到影響網(wǎng)評(píng)成績(jī)的最優(yōu)權(quán)重的因素。參考文獻(xiàn)1 何曉群.多元統(tǒng)計(jì)分析(第二版)m.北京:中國(guó)人民大學(xué)出版社,2008.9.2 趙海燕,芮男.雙評(píng)作文題網(wǎng)上閱卷評(píng)卷教師評(píng)卷水平評(píng)價(jià)維度的確定j.評(píng)價(jià)與測(cè)量,2009(02):12-17.3 姚澤清,鄭旭東,趙穎.全國(guó)大學(xué)生數(shù)學(xué)建模競(jìng)賽
45、題與優(yōu)秀論文評(píng)析m.北京:國(guó)防工業(yè)出版社,2012.4 方道元,韋明俊.數(shù)學(xué)建模:方法導(dǎo)引與案例分析m.浙江大學(xué)出版社2011.5 姜啟源,謝金星,葉俊.數(shù)學(xué)模型(第4版)m.高等教育出版社,2011.6 汪曉銀,鄒庭榮,周保平.數(shù)學(xué)軟件與數(shù)學(xué)實(shí)驗(yàn)(第二版)m,北京:科學(xué)出版式,2012.8.7 周紀(jì)薌,茆詩(shī)松.質(zhì)量管理統(tǒng)計(jì)方法(第二版)m.中國(guó)統(tǒng)計(jì)出版社,2008.10.8 鄭駿.貝葉斯(bayes)學(xué)派的統(tǒng)計(jì)思想j. 數(shù)學(xué)通報(bào). 1994(07):36-38.9 王洪春.貝葉斯公式與貝葉斯統(tǒng)計(jì)j. 重慶科技學(xué)院學(xué)報(bào)(自然科學(xué)版). 2010,12(03):203-205.附錄附錄1:bcd
46、e四題的評(píng)委基本素質(zhì)指標(biāo)值及排名b題評(píng)委基本素質(zhì)指標(biāo)值及排名名次評(píng)委評(píng)委評(píng)委名次評(píng)委評(píng)委評(píng)委1b552.5867b450.86b450.1429b454.0369b330.74b210.272b093.2309b220.8416b220.168330b234.1425b470.74b070.27183b243.2457b260.8317b260.168331b514.1721b160.7353b160.27454b173.3048b400.8317b400.168332b314.1724b300.7353b300.28435b443.3888b130.8218b130.19833b084.18
47、92b480.7327b350.28716b413.3896b520.8b520.234b274.2314b070.7282b470.297b023.4701b150.7941b280.205935b344.3292b090.7255b140.298b203.5131b280.7941b150.215736b054.3424b340.7228b340.2979b363.5381b120.79b120.2237b504.3471b350.7228b060.310b073.5559b080.78b080.2238b134.3721b060.72b090.303911b483.5766b190.78
48、b190.2339b224.4188b140.72b170.303912b333.5886b420.78b420.2340b164.432b360.72b180.303913b323.6454b010.7723b290.230841b154.4346b170.7157b480.306914b253.6507b020.7723b020.237642b354.5633b180.7157b360.3115b143.6689b430.77b550.237643b114.5892b390.7129b320.3116b043.7672b290.7692b430.2444b264.6421b200.7059
49、b200.313717b533.774b240.7677b100.245145b464.7277b110.703b390.316818b183.7747b100.7647b010.247546b124.7605b270.703b270.316819b013.8195b460.7647b380.247547b034.8016b490.703b110.326720b283.8568b380.7624b240.252548b495.0935b320.7b510.3321b473.8628b550.7624b230.257449b375.0989b510.69b490.336622b213.8908b540.7549b040.257450b425.1799b030.6832b030.336623b103.9078b230.7525b050.257451b195.2049b370.6765b310.346524b393.9308b210.75b440.2652b385.2235b310.6733b530.346525b063.9693b440.75b330.2653b545.4769b250.6634b250.356426b433.9716b410.7451b460.264754b305.554b530.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 湖北省云學(xué)聯(lián)盟2024-2025學(xué)年高一下學(xué)期3月月考物理試題(原卷版+解析版)
- 不完全市場(chǎng)下發(fā)展中國(guó)家的農(nóng)村市場(chǎng)講義
- 《登泰山記》讀析
- 2025年黨章黨史國(guó)史國(guó)情知識(shí)競(jìng)賽題庫(kù)及答案(共200題)
- 盆底肌訓(xùn)練與盆底電刺激在產(chǎn)婦產(chǎn)后盆底肌力康復(fù)治療中的應(yīng)用價(jià)值探討
- 《國(guó)際市場(chǎng)營(yíng)銷》課件-第9章 國(guó)際市場(chǎng)促銷策略
- 《電子商務(wù)基礎(chǔ)》課件-話題3 電子商務(wù)運(yùn)用
- 橄欖球俱樂部簡(jiǎn)裝合同樣本
- 保險(xiǎn)業(yè)務(wù)代理居間協(xié)議
- 電子商務(wù)平臺(tái)訂單管理表
- (一診)2025年蘭州市高三診斷考試政治試卷(含答案)
- 2025國(guó)家電力投資集團(tuán)有限公司應(yīng)屆畢業(yè)生招聘筆試參考題庫(kù)附帶答案詳解
- 2025年個(gè)人所得稅贍養(yǎng)老人費(fèi)用分?jǐn)倕f(xié)議模板
- 2025年內(nèi)蒙古興安盟單招職業(yè)適應(yīng)性測(cè)試題庫(kù)附答案
- 醫(yī)療器械使用安全和風(fēng)險(xiǎn)管理培訓(xùn)課件
- 2025年新疆生產(chǎn)建設(shè)兵團(tuán)興新職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)傾向性測(cè)試題庫(kù)帶答案
- 2025年江西工業(yè)貿(mào)易職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)帶答案
- 外周靜脈解剖知識(shí)
- 5萬噸年鋰電池物理法循環(huán)再生項(xiàng)目可行性研究報(bào)告模板-立項(xiàng)備案
- (正式版)JBT 14449-2024 起重機(jī)械焊接工藝評(píng)定
- DB32∕T 4117-2021 保溫裝飾板外墻外保溫系統(tǒng)技術(shù)規(guī)程
評(píng)論
0/150
提交評(píng)論