




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第1頁,共31頁,2023年,2月20日,星期六1概述近幾年,數(shù)學建模競賽的規(guī)模越來越大,水平越來越高;賽題難度也越來越大,對學生數(shù)據(jù)處理能力要求也越來越高,最困難的有兩個方面:
(1)無數(shù)據(jù)建模問題;(2)海量數(shù)據(jù)問題。第2頁,共31頁,2023年,2月20日,星期六無數(shù)據(jù)建模問題例如:(1)2010B:2010年上海世博會影響力的定量評估;(2)2008B:高等教育學費標準探討;
往往為綜合評價類模型,賽題來自于實際問題,開放程度比較高,需要據(jù)相關多因素信息及收集到數(shù)據(jù)對實際對象進行客觀、公正、合理的全面評價。第3頁,共31頁,2023年,2月20日,星期六無數(shù)據(jù)建模問題數(shù)據(jù)收集手段與方法:(1)權威機構或相關部門發(fā)布;(2)通過搜索引擎在Internet搜索;(3)通過問卷、實驗等自主采集;例如:公交車門的高度是按照成年男子與車門頂部碰頭的機率不超過1%設計的,山西省欲采購一批公交車,請問應將車門高度設計成多高比較合適?第4頁,共31頁,2023年,2月20日,星期六無數(shù)據(jù)建模問題問題的關鍵在于獲取山西省成年男子的身高情況,我們優(yōu)先考慮的方法是(1)(2),在無法通過前兩種方法獲取的情況下,可以通過(3)獲得。顯然取樣,進而可以獲得山西成年男子身高X的樣本均值和樣本方差,剩下的就是求解一個簡單的概率問題而已:P(X<h)>=99%第5頁,共31頁,2023年,2月20日,星期六海量數(shù)據(jù)建模問題2000A:DNA序列分類;2000B:鋼管訂購和運輸;2001A:血管的三維重建;2001B:公交車調度;2002B:彩票中的數(shù)學;2003A:SARS的傳播;2004A:奧運會臨時超市網(wǎng)點設計;第6頁,共31頁,2023年,2月20日,星期六海量數(shù)據(jù)建模問題2004B:電力市場的輸電阻塞管理;2005A:長江水質的評價和預測;2005B:DVD在線租賃;2006A:出版社的資源配置;2006B:艾滋病療法的評價及療效的預測……尤其是:2011年夏令營:測井曲線自動分層問題(10M)第7頁,共31頁,2023年,2月20日,星期六海量數(shù)據(jù)建模問題
顯然大批量數(shù)據(jù)是很難手工處理的,需要我們借助于計算機以及一些數(shù)據(jù)處理軟件來完成,需要掌握基本的計算機使用與編程能力。
實在無法完成大批量數(shù)據(jù)處理的情況下,隨機截取典型性數(shù)據(jù)也不失為一種合理的解決辦法。第8頁,共31頁,2023年,2月20日,星期六海量數(shù)據(jù)建模問題數(shù)學建模中常用軟件:World
MATLAB
Mathematica
LindoExecl
SPSS
C&C++
Lingo第9頁,共31頁,2023年,2月20日,星期六海量數(shù)據(jù)建模問題軟件學習的關鍵:(1)數(shù)據(jù)的讀入;(2)異常數(shù)據(jù)處理;(3)數(shù)據(jù)規(guī)范化與歸一化;(4)常見問題與軟件功能的對應。(5)繪圖與可視化輸出。第10頁,共31頁,2023年,2月20日,星期六(1)數(shù)據(jù)的讀入數(shù)據(jù)的讀入:a)復制、粘貼;b)功能函數(shù)。Matlab中textread():a=textread('data.txt','%*s%*s%f%*s','headerlines',3,'delimiter','')headerlines是文件頭有多少行delimiter就是詞跟詞之間的分隔符。%s是字符串的意思,%f是浮點數(shù)的意思而在它們中間加上*,表示跳過這個詞。%*s%*s的意思就是跳過前兩個詞。第11頁,共31頁,2023年,2月20日,星期六(1)數(shù)據(jù)的讀入Matlab中imread():該函數(shù)用于讀取圖片文件中的數(shù)據(jù)。filename='e.bmp';imgRgb=imread(filename);%讀入一幅彩色圖像imshow(imgRgb);%顯示彩色圖像Matlab中xlsread():該函數(shù)用于讀取Execl文件中的數(shù)據(jù)。第12頁,共31頁,2023年,2月20日,星期六(1)數(shù)據(jù)的讀入Lingo中@file():該函數(shù)用于文本文件的讀入。Lingo中@TEXT():該函數(shù)輸出數(shù)據(jù)(文本文件)。Lingo中@OLE()該函數(shù)與電子表格軟件(如EXCEL)連接;Lingo中@ODBC()該函數(shù)與數(shù)據(jù)庫連接。第13頁,共31頁,2023年,2月20日,星期六(1)數(shù)據(jù)的讀入@FILE和@TEXT:文本文件輸入輸出MODEL:SETS:MYSET/@FILE(‘myfile.txt’)/:@FILE(‘myfile.txt’);ENDSETSMIN=@SUM(MYSET(I):SHIP(I)*COST(I));@FOR(MYSET(I):[CON1]SHIP(I)>NEED(I);[CON2]SHIP(I)<SUPPLY(I));DATA:COST=@FILE(‘myfile.txt’);NEED=@FILE(‘myfile.txt’);SUPPLY=@FILE(‘myfile.txt’);@TEXT(‘result.txt’)=@STATUS(),SHIP,@DUAL(SHIP),@RANGED(SHIP)@DUAL(CON1),@RANGEU(CON2);ENDDATAENDmyfile.txt文件的內容、格式:Seattle,Detroit,Chicago,Denver~COST,NEED,SUPPLY,SHIP~12,28,15,20~1600,1800,1200,1000~1700,1900,1300,1100第14頁,共31頁,2023年,2月20日,星期六(1)數(shù)據(jù)的讀入c)計算機語言編程文本文檔中寫著:1Intel_Pentium_E_214049502AMD_Athlon64_X2_3600+46503Intel_Celeron_4204800......要求將這些讀入C程序中(編號,名稱,價格,已售出量組成)#include"stdio.h"structHardware_database{intnumber;charname[40];intprice;intsales;}CPU[50];intmain(intargc,char*argv[]){inti;FILE*CPU_record;PU_record=fopen("c:\\CPU_Data.txt","r");for(i=1;feof(CPU_record)==0;i++){fscanf(CPU_record,"%d%s%d%d\n",&CPU[i].number,CPU[i].name,&CPU[i].price,&CPU[i].sales);printf("%d,%s,%d\n",CPU[i].number,CPU[i].name,CPU[i].price);}printf("PressAnyKeytoBack");getchar();fclose(CPU_record);return0;}第15頁,共31頁,2023年,2月20日,星期六(2)異常數(shù)據(jù)處理第16頁,共31頁,2023年,2月20日,星期六(2)異常數(shù)據(jù)處理a)散點圖。Matlab中可由plot()實現(xiàn),在SPSS中可通過點選菜單的方式實現(xiàn)。畫散點圖還可以幫助我們找出數(shù)據(jù)的規(guī)律。第17頁,共31頁,2023年,2月20日,星期六(2)異常數(shù)據(jù)處理b)3σ檢測法第18頁,共31頁,2023年,2月20日,星期六(2)異常數(shù)據(jù)處理第19頁,共31頁,2023年,2月20日,星期六(2)異常數(shù)據(jù)處理C)聚類分析法第20頁,共31頁,2023年,2月20日,星期六(2)異常數(shù)據(jù)處理異常數(shù)據(jù)處理:
剔除均值替代回歸替代
異常數(shù)據(jù)的處理由SPSS、SAS、mintab實現(xiàn)比其他軟件更方便。第21頁,共31頁,2023年,2月20日,星期六(3)數(shù)據(jù)規(guī)范化
如果不對這些指標作相應的無量綱處理,則在綜合評價過程中就會出“大數(shù)吃小數(shù)”的錯誤結果,從而導致最后得到錯誤的評價結論。無量綱化處理又稱為指標數(shù)據(jù)的標準化,或規(guī)范化處理。常用方法:標準差法、極值差法和功效系數(shù)法等。
第22頁,共31頁,2023年,2月20日,星期六(3)數(shù)據(jù)規(guī)范化第23頁,共31頁,2023年,2月20日,星期六(3)數(shù)據(jù)規(guī)范化第24頁,共31頁,2023年,2月20日,星期六(3)數(shù)據(jù)規(guī)范化
極大型指標:總是期望指標的取值越大越好;
極小型指標:總是期望指標的取值越小越好;
中間型指標:總是期望指標的取值既不要太大,也不要太小為好,即取適當?shù)闹虚g值為最好;
區(qū)間型指標:總是期望指標的取值最好是落在某一個確定的區(qū)間內為最好。
在將數(shù)據(jù)無量綱化之前,在有些問題下,特別是綜合評價模型中,還需要將數(shù)據(jù)根據(jù)處理目標一致化。一般說來,數(shù)據(jù)指標一般說來,在評價指標中可能包含有:第25頁,共31頁,2023年,2月20日,星期六(3)數(shù)據(jù)規(guī)范化第26頁,共31頁,2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- c11h10o4的六元環(huán)化合物
- 深圳學校空間施工方案
- 臺州混凝土破碎施工方案
- 2025年江蘇旅游職業(yè)學院單招職業(yè)傾向性測試題庫含答案
- 2025年河北科技學院單招職業(yè)適應性測試題庫匯編
- 2025年重慶財經(jīng)職業(yè)學院單招職業(yè)技能測試題庫完整
- 2024新教材高中化學 第1章 第1節(jié) 走進化學科學教學實錄 魯科版必修第一冊
- 在線教育平臺課程制作規(guī)范
- 農(nóng)業(yè)智慧農(nóng)場建設與管理方案
- 游戲行業(yè)產(chǎn)品測試與發(fā)布流程指南
- 手術患者vte預防
- 消化道出血應急預案
- 2023年城市體檢基礎指標體系
- 2024年《滕王閣序》原文及翻譯
- AI技術在保險行業(yè)的應用
- 施工方案大全百度網(wǎng)盤下載
- 幼兒園故事課件:《盲人摸象》
- 電機與拖動技術
- 中職統(tǒng)編《金屬材料與熱處理》系列課件 第2章 金屬材料的性能(動畫) 云天課件
- 小公雞和小鴨子(完美版)
- GJB9001C-2017質量管理體系完整檢查內容的內部審核檢查表【含完整檢查內容】
評論
0/150
提交評論