江蘇自學(xué)考試 12577 智能數(shù)據(jù)處理_第1頁
江蘇自學(xué)考試 12577 智能數(shù)據(jù)處理_第2頁
江蘇自學(xué)考試 12577 智能數(shù)據(jù)處理_第3頁
江蘇自學(xué)考試 12577 智能數(shù)據(jù)處理_第4頁
江蘇自學(xué)考試 12577 智能數(shù)據(jù)處理_第5頁
已閱讀5頁,還剩11頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、高綱1543江蘇省高等教育自學(xué)考試大綱12577智能數(shù)據(jù)處理 南京信息工程大學(xué)編江蘇省高等教育自學(xué)考試委員會(huì)辦公室 課程性質(zhì)與課程目標(biāo)一、課程性質(zhì)和特點(diǎn)本課程是針對(duì)物聯(lián)網(wǎng)工程專業(yè)開設(shè)的專業(yè)必修課,是為從事科學(xué)研究、理論研究、工程實(shí)踐提供基本知識(shí)儲(chǔ)備和基本訓(xùn)練的基礎(chǔ)理論性課程。本課程以工程化手段為特點(diǎn)介紹設(shè)計(jì)處理、分析和應(yīng)用方法與技術(shù),是物聯(lián)網(wǎng)工程學(xué)科的重要內(nèi)容、核心與趨勢。課程以“設(shè)計(jì)-知識(shí)-服務(wù)”為主線,以數(shù)據(jù)的智能處理、分析和服務(wù)的代表性方法與技術(shù)為重點(diǎn)。圍繞著主線,重點(diǎn)講述了關(guān)系數(shù)據(jù)庫的設(shè)計(jì)與查詢優(yōu)化,信息檢索與Web搜索引擎、XML數(shù)據(jù)管理、數(shù)據(jù)挖掘與數(shù)據(jù)倉庫、Web服務(wù)等。通過本課程

2、內(nèi)容的學(xué)習(xí),能夠使學(xué)生對(duì)數(shù)據(jù)的處理、分析和服務(wù)的工程化方法有較為系統(tǒng)和完整的理解。以這些內(nèi)容作為對(duì)智能數(shù)據(jù)處理技術(shù)的代表和延伸,旨在傳遞概念、方法和技術(shù)內(nèi)涵與理論,為學(xué)生進(jìn)一步學(xué)習(xí)和研究面向數(shù)據(jù)科學(xué)的方法和技術(shù)提供支撐。 本課程的目的主要是培養(yǎng)學(xué)生對(duì)數(shù)據(jù)科學(xué)研究的興趣和數(shù)據(jù)處理的初步能力。培養(yǎng)學(xué)生分析數(shù)據(jù)與處理數(shù)據(jù)的基本能力,并提高數(shù)據(jù)服務(wù)實(shí)踐應(yīng)用的能力。通過本課程的學(xué)習(xí),將使得學(xué)生能夠從工程的角度理解數(shù)據(jù)科學(xué):它包括了數(shù)據(jù)處理技術(shù),以及數(shù)據(jù)分析技術(shù)和數(shù)據(jù)服務(wù)技術(shù);既有數(shù)據(jù)查詢和優(yōu)化、事務(wù)和工作流管理及數(shù)據(jù)庫架構(gòu)等基層內(nèi)容,也包括數(shù)據(jù)挖掘與知識(shí)發(fā)現(xiàn)、時(shí)空數(shù)據(jù)、元數(shù)據(jù)和社會(huì)數(shù)據(jù)分析等經(jīng)典問題,另

3、外還包括概率數(shù)據(jù)、云計(jì)算和大數(shù)據(jù)管理等前言課題。最后,通過本課程的學(xué)習(xí),還將加深物聯(lián)網(wǎng)工程專業(yè)的學(xué)生對(duì)本專業(yè)基本理論的理解及科學(xué)解決各專業(yè)相關(guān)問題的能力。二、課程目標(biāo)1. 要求學(xué)生能夠全面、深入理解和熟練掌握數(shù)據(jù)處理的基本技術(shù),掌握結(jié)構(gòu)化、半結(jié)構(gòu)化和結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)、查詢和優(yōu)化方法。了解數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)和數(shù)據(jù)倉庫的概念和結(jié)構(gòu)。了解Web服務(wù)的基本概念。2. 要求學(xué)生把握數(shù)據(jù)科學(xué)領(lǐng)域的前沿,通過課程的學(xué)習(xí)能夠嘗試追蹤層出不窮、內(nèi)涵日益豐富、熱點(diǎn)不斷演變的數(shù)據(jù)科學(xué)。3. 要求學(xué)生能夠從工程化的角度去掌握數(shù)據(jù)科學(xué),對(duì)“數(shù)據(jù)(Data)知識(shí)(Knowledge)服務(wù)(Service)”這一數(shù)據(jù)科學(xué)與

4、工程領(lǐng)域研究和應(yīng)用的趨勢和主線能夠有清晰的認(rèn)識(shí)。了解信息技術(shù)的核心和未來發(fā)展的方向即為基于數(shù)據(jù)的網(wǎng)絡(luò)信息服務(wù)。三、與相關(guān)課程的聯(lián)系與區(qū)別本課程先修課程應(yīng)涉及計(jì)算機(jī)文化基礎(chǔ)、計(jì)算機(jī)程序設(shè)計(jì)、數(shù)據(jù)結(jié)構(gòu)、管理信息系統(tǒng)、數(shù)據(jù)庫原理與應(yīng)用、計(jì)算機(jī)網(wǎng)絡(luò)等。后繼課程有算法設(shè)計(jì)、信息系統(tǒng)分析與設(shè)計(jì)、操作系統(tǒng)、軟件工程等。本課程與其他課程的區(qū)別為:本課程立足于理論,且與實(shí)際環(huán)節(jié)緊密結(jié)合,需要更多關(guān)注各種網(wǎng)絡(luò)應(yīng)用及新技術(shù)。四、課程的重點(diǎn)和難點(diǎn)課程的重點(diǎn)之一是關(guān)系數(shù)據(jù)庫查詢優(yōu)化技術(shù),包括數(shù)據(jù)庫設(shè)計(jì)、面向復(fù)雜應(yīng)用的數(shù)據(jù)查詢、基于索引的查詢優(yōu)化、基于數(shù)據(jù)庫模式反規(guī)范化和視圖物化的查詢優(yōu)化、基于數(shù)據(jù)查詢語句重寫的查詢優(yōu)化

5、;重點(diǎn)之二是信息檢索,包括信息檢索的基本原理、信息檢索模型的形式、布爾模型、向量空間模型、經(jīng)典概率模型、文本信息檢索中的文本洗預(yù)處理、文本信息的倒排索引、布爾檢索、相關(guān)反饋和提問式擴(kuò)展、Web信息檢索、信息檢索評(píng)價(jià)指標(biāo);課程的次重點(diǎn)是XML數(shù)據(jù)管理,包括XML簡介、XML數(shù)據(jù)模型和XML解析;次重點(diǎn)之二是數(shù)據(jù)挖掘,包括數(shù)據(jù)挖掘概念和數(shù)據(jù)清理;次重點(diǎn)之三是數(shù)據(jù)倉庫,包括數(shù)據(jù)倉庫概念和體系結(jié)構(gòu)。課程的一般重點(diǎn)是Web服務(wù),包括Web服務(wù)的基本概念和Web服務(wù)技術(shù)架構(gòu)等。課程的難點(diǎn)是幾種信息檢索模型、文本信息檢索和Web信息檢索。 考核目標(biāo)本大綱在考核目標(biāo)中,按照識(shí)記、領(lǐng)會(huì)、簡單應(yīng)用和綜合應(yīng)用四個(gè)層

6、次規(guī)定其應(yīng)達(dá)到的能力層次要求。四個(gè)能力層次是遞升的關(guān)系,后者必須建立在前者的基礎(chǔ)上。各能力層次的含義是:識(shí)記():要求考生能夠識(shí)別和記憶本課程中有關(guān)數(shù)據(jù)處理(包括數(shù)據(jù)庫、信息檢索、XML數(shù)據(jù)管理)、數(shù)據(jù)分析(包括數(shù)據(jù)挖掘、數(shù)據(jù)倉庫)、數(shù)據(jù)服務(wù)(Web)的概念性內(nèi)容(如基本概念、定義、定理、背景知識(shí)、特性等),并能夠根據(jù)考核的不同要求,做正確的表述、選擇和判斷。領(lǐng)會(huì)():要求考生能夠領(lǐng)會(huì)和理解本課程中關(guān)于關(guān)系數(shù)據(jù)庫查詢優(yōu)化、信息檢索、數(shù)據(jù)挖掘和數(shù)據(jù)倉庫的概念及特性的內(nèi)涵及外延,理解數(shù)據(jù)庫設(shè)計(jì)的概念、信息檢索的原理,XML語法基本知識(shí)、XML數(shù)據(jù)模型和XML解析,能夠鑒別關(guān)于概念和特性的似是而非的

7、說法;理解相關(guān)知識(shí)的區(qū)別和聯(lián)系,并能根據(jù)考核的不同要求分析各種不同領(lǐng)域所使用的數(shù)據(jù)處理和分析技術(shù)。簡單應(yīng)用():要求考生能夠根據(jù)已知的計(jì)算機(jī)知識(shí)和數(shù)據(jù)庫技術(shù)對(duì)ER模型進(jìn)行處理,轉(zhuǎn)化為關(guān)系模型;能夠?qū)谒饕牟樵儍?yōu)化、基于數(shù)據(jù)庫模式反規(guī)范化和視圖物化的查詢優(yōu)化、基于數(shù)據(jù)查詢語句重寫的查詢優(yōu)化進(jìn)行簡單分析,考慮其性能優(yōu)劣和可靠性。能夠利用Web搜索引擎的基本原理來分析其關(guān)鍵技術(shù),對(duì)其中的信息檢索的性能進(jìn)行初步的評(píng)估。此外,還可運(yùn)用本課程中的少量知識(shí)點(diǎn),利用簡單的模型分析和解決一般應(yīng)用問題,如簡單的計(jì)算和驗(yàn)證檢索效率及其他性能指標(biāo)等。綜合應(yīng)用():要求考生能夠處理具體、實(shí)際的數(shù)據(jù)處理技術(shù),能探究解

8、決問題的方法,并進(jìn)行推導(dǎo)。對(duì)數(shù)據(jù)庫查詢優(yōu)化,能夠綜合三種優(yōu)化方法,選擇合適的優(yōu)化途徑;對(duì)信息檢索,能夠利用文本信息檢索中的倒排索引和布爾索引的方法來分析文本信息檢索的解決途徑。在深入理解和熟練掌握數(shù)據(jù)庫查詢優(yōu)化內(nèi)容和信息檢索內(nèi)容的基礎(chǔ)上,能夠在數(shù)據(jù)處理的基礎(chǔ)上提升到數(shù)據(jù)分析和數(shù)據(jù)服務(wù)的層面,能夠?qū)?shù)據(jù)處理技術(shù)舉一反三。 課程內(nèi)容與考核要求第1章 關(guān)系數(shù)據(jù)庫查詢優(yōu)化一、學(xué)習(xí)目的與要求本章主要學(xué)習(xí)數(shù)據(jù)處理中的數(shù)據(jù)庫設(shè)計(jì)方法和優(yōu)化技術(shù),針對(duì)查詢進(jìn)行數(shù)據(jù)庫性能優(yōu)化。本章以數(shù)據(jù)查詢優(yōu)化為主線,以數(shù)據(jù)的具體用途為出發(fā)點(diǎn),討論幾種有代表性的關(guān)系數(shù)據(jù)庫查詢優(yōu)化方法:索引的創(chuàng)建和選擇、數(shù)據(jù)庫模式的反規(guī)范化和視圖

9、物化以及查詢語句的重寫。通過本章的學(xué)習(xí),要求學(xué)生重點(diǎn)關(guān)注和掌握四個(gè)問題,首先是對(duì)索引的創(chuàng)建和選擇問題,要求學(xué)生清楚何時(shí)、在何屬性上創(chuàng)建索引;其次是數(shù)據(jù)庫模式的反規(guī)范化問題,要求學(xué)生以代價(jià)最小化為目標(biāo),根據(jù)數(shù)據(jù)的使用模式對(duì)良構(gòu)關(guān)系進(jìn)行合理的合并調(diào)整;第三是視圖物化問題,要求學(xué)生掌握針對(duì)頻繁查詢進(jìn)行視圖反復(fù)完全實(shí)體化的方法,根據(jù)數(shù)據(jù)操作的類型和頻度考慮將視圖對(duì)應(yīng)的查詢結(jié)構(gòu)存儲(chǔ)到磁盤上,提高查詢效率;最后是查詢語句的重寫,要求學(xué)生能夠針對(duì)實(shí)際查詢中執(zhí)行比預(yù)計(jì)的慢得多的情況,能夠分析數(shù)據(jù)庫管理系統(tǒng)查詢執(zhí)行計(jì)劃性能低下的原因,并定位到查詢語句編寫方面的問題。學(xué)生需要理解在結(jié)果相同的前提下對(duì)查詢語句的結(jié)構(gòu)

10、進(jìn)行調(diào)整的方法。本章是課程的重點(diǎn),要求學(xué)生重視本章知識(shí)內(nèi)容的熟悉和掌握2、 課程內(nèi)容1. 領(lǐng)會(huì)數(shù)據(jù)庫設(shè)計(jì)的基本概念2. 掌握ER模型和關(guān)系模型3. 掌握從ER模型到關(guān)系模型的轉(zhuǎn)換4. 了解關(guān)系規(guī)范化概念5. 領(lǐng)會(huì)連接查詢、嵌套查詢和集合查詢6. 領(lǐng)會(huì)視圖、存儲(chǔ)過程和觸發(fā)器的作用7. 掌握基于索引的查詢優(yōu)化8. 掌握數(shù)據(jù)庫模式反規(guī)范化查詢優(yōu)化方法9. 領(lǐng)會(huì)視圖物化的查詢優(yōu)化方法10.掌握數(shù)據(jù)查詢語句重寫的查詢優(yōu)化三、考核知識(shí)點(diǎn)與考核要求1. 數(shù)據(jù)庫設(shè)計(jì)識(shí)記:(1)數(shù)據(jù)庫設(shè)計(jì)的基本概念和設(shè)計(jì)步驟、ER模型、關(guān)系模型、關(guān)系規(guī)范化的概念;(2)關(guān)系數(shù)據(jù)模型中的完整性約束,外鍵是否為空的判定準(zhǔn)則,良構(gòu)關(guān)

11、系的的判斷標(biāo)準(zhǔn);(3)第1范式、第2范式、第3范式的概念。領(lǐng)會(huì): ER模型到關(guān)系模型的轉(zhuǎn)換、不滿足第2范式時(shí)存在的問題。2. 面向復(fù)雜應(yīng)用的數(shù)據(jù)查詢識(shí)記:(1)連接查詢、嵌套查詢和集合查詢的概念和連接語法;(2)視圖、存儲(chǔ)過程和觸發(fā)器的概念、語法、適用場所。領(lǐng)會(huì):(1)連接查詢、嵌套查詢和集合查詢的性能表現(xiàn)及相互關(guān)系。重點(diǎn)考核連接查詢在查詢操作中的代表作用;(2)視圖、存儲(chǔ)過程和觸發(fā)器的作用、性能表現(xiàn)及相互關(guān)系,觸發(fā)器的優(yōu)點(diǎn),存儲(chǔ)過程的優(yōu)點(diǎn)。3. 查詢優(yōu)化識(shí)記:(1)索引的基本概念、索引的類型、索引創(chuàng)建的語法、索引的使用方法;(2)數(shù)據(jù)庫模式反規(guī)范化概念、視圖物化概念。領(lǐng)會(huì):(1)基于索引的查

12、詢優(yōu)化性能影響、代價(jià)、權(quán)衡;(2)聚集索引和非聚集索引在創(chuàng)建時(shí)間、刪除時(shí)間、存儲(chǔ)空間三個(gè)方面的性能比較,覆蓋索引有意義所需要滿足的條件,索引選擇和應(yīng)用的一般原則,以存儲(chǔ)和處理為中心的系統(tǒng)整體開銷、索引選擇的基本原則和規(guī)律、構(gòu)建新索引時(shí)考慮的三個(gè)基本要素和步驟;(3)規(guī)范化的關(guān)系模式對(duì)查詢操作在性能上的影響、關(guān)系模式反規(guī)范化的一般步驟、選擇反規(guī)范化的查詢優(yōu)化方案的基本原則、實(shí)施反規(guī)范化時(shí)確保數(shù)據(jù)同步、一致性、維護(hù)數(shù)據(jù)庫完整性所使用的三種方法;(4)理解視圖物化的兩個(gè)角度;(5)基于數(shù)據(jù)查詢語句重寫的查詢優(yōu)化中,幾種典型的查詢重寫方法。四、本章重點(diǎn)、難點(diǎn)本章重點(diǎn)為面向復(fù)雜應(yīng)用的數(shù)據(jù)查詢和查詢優(yōu)化,

13、本章難點(diǎn)為面向復(fù)雜應(yīng)用的數(shù)據(jù)查詢。第2章 信息檢索一、學(xué)習(xí)目的與要求本章主要學(xué)習(xí)數(shù)據(jù)處理中的信息檢索技術(shù)。信息檢索是一個(gè)具有鮮明交叉研究特性、與數(shù)據(jù)科學(xué)相關(guān)的學(xué)科領(lǐng)域,本章從計(jì)算機(jī)科學(xué)領(lǐng)域的視角,面向信息檢索工具的原理與方法,針對(duì)信息檢索領(lǐng)域中的三個(gè)關(guān)鍵問題,討論信息檢索建模、系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)的支持技術(shù)。通過本章學(xué)習(xí),要求學(xué)生熟悉三個(gè)方面的知識(shí):首先掌握如何從信息檢索問題的核心和本質(zhì)出發(fā),忽略實(shí)現(xiàn)細(xì)節(jié),構(gòu)建以信息分析為中心的模型,這是信息檢索建模問題,也即信息檢索的基礎(chǔ);其次學(xué)會(huì)根據(jù)自然語言文本中詞匯的頻率和分布情況進(jìn)行文本信息的預(yù)處理、構(gòu)建檢索模型、實(shí)現(xiàn)高效準(zhǔn)確的文本檢索,這是文本信息檢索問題

14、,這部分內(nèi)容是信息檢索和搜索引擎的主要組成部分;第三是針對(duì)當(dāng)前以用戶為中心的Web2.0時(shí)代,Web資源具有海量數(shù)據(jù)、分散無序、動(dòng)態(tài)變化、形式多樣、非結(jié)構(gòu)化或半結(jié)構(gòu)、質(zhì)量控制缺乏、使用方式個(gè)性化等特點(diǎn),要求學(xué)生學(xué)會(huì)構(gòu)建有效的Web搜索引擎,這是Web信息檢索問題,也是信息檢索技術(shù)的重要應(yīng)用領(lǐng)域;最后,要求學(xué)生熟悉衡量檢索系統(tǒng)效率的性能指標(biāo),了解各種檢索技術(shù)優(yōu)劣的性能比較法、理解改進(jìn)現(xiàn)有檢索系統(tǒng)和開發(fā)新興應(yīng)用領(lǐng)域的技術(shù),這是信息檢索評(píng)價(jià)問題,也是信息檢索領(lǐng)域一項(xiàng)有前景的研究內(nèi)容。本章是課程的重點(diǎn)和難點(diǎn)所在,要求學(xué)生高度重視本章知識(shí)內(nèi)容的熟悉和掌握。對(duì)相關(guān)知識(shí)從識(shí)記概念到領(lǐng)會(huì)技術(shù)和算法內(nèi)涵到掌握計(jì)

15、算方法進(jìn)行應(yīng)用處理都要全面深入學(xué)習(xí)和掌握。二、課程內(nèi)容1. 掌握信息檢索的基本概念和基本原理2. 領(lǐng)會(huì)信息檢索的相關(guān)性學(xué)科和研究內(nèi)容3. 領(lǐng)會(huì)信息檢索的發(fā)展史4. 掌握信息檢索系統(tǒng)的形式表示5. 掌握信息檢索中的布爾模型和向量空間模型6. 領(lǐng)會(huì)經(jīng)典概率模型7. 掌握文本信息檢索中詞匯的頻率域數(shù)量分布規(guī)律8. 掌握文本信息預(yù)處理9. 掌握文本信息的倒排索引10.掌握布爾檢索11.領(lǐng)會(huì)相關(guān)反饋和提問式擴(kuò)展12.掌握Web信息搜索的概念13.掌握Web搜索引擎的工作原理14.掌握Web搜索引擎的關(guān)鍵技術(shù)15.掌握信息檢索評(píng)價(jià)指標(biāo)16.掌握單個(gè)查詢的評(píng)價(jià)指標(biāo)17.掌握多個(gè)查詢的評(píng)價(jià)指標(biāo)18.領(lǐng)會(huì)面向用

16、戶的評(píng)價(jià)指標(biāo)19.領(lǐng)會(huì)搜索引擎性能評(píng)價(jià)指標(biāo)20.領(lǐng)會(huì)TREC評(píng)測三、考核知識(shí)點(diǎn)與考核要求1. 信息檢索概述識(shí)記:信息檢索的基本概念、信息檢索的基本原理、信息檢索的基本流程(兩個(gè)步驟)。領(lǐng)會(huì):信息檢索的主要研究內(nèi)容、信息檢索的發(fā)展史。2. 信息檢索模型識(shí)記:信息檢索系統(tǒng)的形式表示(四元組和解釋)、詞頻的概念、匹配函數(shù)的概念。領(lǐng)會(huì):匹配函數(shù)的選擇所考慮的原則、布爾模型的思想、布爾模型的優(yōu)缺點(diǎn)、詞的Zipf分布、向量空間模型的優(yōu)點(diǎn)、經(jīng)典概率模型的基本思想、經(jīng)典概率模型的基本假設(shè)、概率模型的優(yōu)點(diǎn)。應(yīng)用:布爾模型中利用析取范式和匹配函數(shù)求與提問式相關(guān)的文檔、求解包含若干個(gè)文檔的索引詞集所對(duì)應(yīng)的向量文檔、

17、詞的tf/idf權(quán)重、匹配函數(shù)的計(jì)算及檢索結(jié)果的確定與排序。3. 文本信息檢索識(shí)記:詞匯頻率與齊普夫分布模型,齊普夫定律、詞匯數(shù)量與Heaps分布模型、倒排文件的概念、布爾邏輯運(yùn)算符、檢索提問式等價(jià)處理方法。領(lǐng)會(huì):文本信息預(yù)處理操作、文本信息的倒排索引、倒排索引的建立、倒排索引的使用、倒排索引的維護(hù)、多種布爾運(yùn)算符下,檢索系統(tǒng)進(jìn)行檢索運(yùn)算的規(guī)則、逆波蘭式處理的基本思想、相關(guān)反饋的步驟。應(yīng)用:倒排索引的使用(利用倒排索引查找單詞)。4. Web信息檢索識(shí)記:Web信息搜索的概念、Shingle的概念。領(lǐng)會(huì):Web搜索引擎的工作原理、數(shù)據(jù)收集和預(yù)處理的過程、數(shù)據(jù)檢索和信息挖掘的過程、數(shù)據(jù)預(yù)處理中的

18、網(wǎng)頁去重(發(fā)現(xiàn)重復(fù)或近似網(wǎng)頁對(duì)搜索引擎的好處、網(wǎng)頁去重所包含的技術(shù)要點(diǎn)、網(wǎng)頁去重方法分類)、使用Shingle方法判斷重復(fù)網(wǎng)頁的步驟、數(shù)據(jù)檢索中的結(jié)果排序、基于網(wǎng)頁鏈接結(jié)構(gòu)分析的相關(guān)排序、PageRank算法(特點(diǎn)、基本觀點(diǎn)、計(jì)算公式)、HITS算法(兩類網(wǎng)頁、基本思想、HITS的不足之處)、PageRank算法和HITS算法的比較(相似、差異)。應(yīng)用:基于PageRank計(jì)算各個(gè)網(wǎng)頁的PR值。5. 信息檢索評(píng)價(jià)指標(biāo)識(shí)記:信息檢索評(píng)價(jià)的基本步驟、單個(gè)查詢的評(píng)價(jià)指標(biāo)及公式(查全率和查準(zhǔn)率、查全率查準(zhǔn)率曲線、調(diào)和平均數(shù)、E測度指標(biāo))、多個(gè)查詢的評(píng)價(jià)指標(biāo)及公式(平均查準(zhǔn)率、平均查準(zhǔn)率均值、微平均查準(zhǔn)

19、率)、面向用戶的評(píng)價(jià)指標(biāo)(覆蓋率、新穎率、相對(duì)查全率、查全努力)。領(lǐng)會(huì):評(píng)價(jià)和比較檢索系統(tǒng)的檢索性能時(shí)所需要的條件、搜索引擎性能評(píng)價(jià)指標(biāo)、TREC評(píng)測。應(yīng)用:單個(gè)查詢的查全率計(jì)算、單個(gè)查詢的查準(zhǔn)率計(jì)算、多個(gè)查詢的平均查準(zhǔn)率均值計(jì)算、多個(gè)查詢的微平均查準(zhǔn)率計(jì)算。四、本章重點(diǎn)、難點(diǎn)本章重點(diǎn)為信息檢索模型中的布爾模型、向量空間模型,文本信息檢索中的文本信息預(yù)處理、文本信息的倒排索引、布爾檢索,Web信息檢索中Web搜索引擎的工作原理和關(guān)鍵技術(shù)、信息檢索評(píng)價(jià)指標(biāo)、單個(gè)查詢和多個(gè)查詢的評(píng)價(jià)指標(biāo)。本章難點(diǎn)為信息檢索模型中的布爾模型、向量空間模型,文本信息檢索中的文本信息預(yù)處理、文本信息的倒排索引、布爾檢索

20、。第3章 XML數(shù)據(jù)管理一、學(xué)習(xí)目的與要求本章主要學(xué)習(xí)數(shù)據(jù)處理中的XML數(shù)據(jù)管理。作為萬維網(wǎng)上信息表示、信息傳輸和交換的基本形式,XML主要進(jìn)行半結(jié)構(gòu)化的數(shù)據(jù)處理,XML本身是一種標(biāo)記語言,有特色的數(shù)據(jù)類型、表達(dá)式和函數(shù)庫等XML語法。本章針對(duì)XML數(shù)據(jù)管理的模型和編程基礎(chǔ)及具體任務(wù),討論XML數(shù)據(jù)建模、語法和數(shù)據(jù)處理的代表性支撐技術(shù)。通過本章學(xué)習(xí),要求學(xué)生掌握半結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu),熟悉XML的基本概念,簡單了解XML的語法,掌握XML數(shù)據(jù)模型中的半結(jié)構(gòu)化數(shù)據(jù)以及XML數(shù)據(jù)模型,了解XML數(shù)據(jù)處理部分的XML解析內(nèi)容,熟悉XML數(shù)據(jù)庫性能評(píng)測的性能基準(zhǔn),了解XML性能評(píng)測數(shù)據(jù)集。領(lǐng)會(huì)關(guān)于XML數(shù)

21、據(jù)管理的兩個(gè)問題:第一,如何構(gòu)建一種具有一般性的邏輯模型,以描述XML半結(jié)構(gòu)化數(shù)據(jù)的結(jié)構(gòu)、約束和操作,這是XML數(shù)據(jù)建模問題,是半結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)、查詢及應(yīng)用的基礎(chǔ);第二,從數(shù)據(jù)庫的角度,如何有效地進(jìn)行XML數(shù)據(jù)庫的存儲(chǔ)、索引、查詢、及優(yōu)化,這是XML數(shù)據(jù)處理問題,是XML數(shù)據(jù)管理的具體任務(wù),也是XML數(shù)據(jù)庫系統(tǒng)研究的主要內(nèi)容。本章是數(shù)據(jù)處理中針對(duì)半結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理的技術(shù),考核要求較低。相對(duì)其他兩類數(shù)據(jù)處理,即基于結(jié)構(gòu)化數(shù)據(jù)處理和信息檢索,本章以基本概念的識(shí)記、基本模型及技術(shù)的領(lǐng)會(huì)為主。二、課程內(nèi)容1. 領(lǐng)會(huì)XML數(shù)據(jù)管理前言概述2. 熟悉XML語法簡介3. 了解XML文檔結(jié)構(gòu)中的基本語法要素

22、4. 了解Xpath和Xquery查詢語言的基本概念5. 領(lǐng)會(huì)XML數(shù)據(jù)模型,掌握結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)的概念6. 了解XML數(shù)據(jù)處理匯總的XML解析7. 了解XML數(shù)據(jù)庫性能評(píng)測三、考核知識(shí)點(diǎn)與考核要求1. XML語法識(shí)記:XML基本概念、定義、XML基本語法要素。領(lǐng)會(huì):XML文檔的基本組成部分,XML的主要優(yōu)點(diǎn),XML在實(shí)際應(yīng)用中具有的性質(zhì)和用途、Xpath和Xquery查詢語言。2. XML數(shù)據(jù)模型識(shí)記:結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)。領(lǐng)會(huì):半結(jié)構(gòu)化數(shù)據(jù)的特點(diǎn)、對(duì)象交換模型、半結(jié)構(gòu)化數(shù)據(jù)和XML數(shù)據(jù)、XML數(shù)據(jù)模型三要素。3. XML數(shù)據(jù)處理識(shí)記:四類XML解析技術(shù)。領(lǐng)會(huì):DO

23、M、SAX、VTD-XML。4. XML數(shù)據(jù)庫性能評(píng)測識(shí)記:兩類XML數(shù)據(jù)庫性能基準(zhǔn)。四、本章重點(diǎn)、難點(diǎn)本章重點(diǎn)為XML基本概念、XML文檔結(jié)構(gòu)中的語法要素、半結(jié)構(gòu)化數(shù)據(jù)、XML數(shù)據(jù)模型、XML解析、XML數(shù)據(jù)庫性能評(píng)測。本章難點(diǎn)為半結(jié)構(gòu)化數(shù)據(jù)、XML數(shù)據(jù)模型、XML解析。第4章 數(shù)據(jù)挖掘一、學(xué)習(xí)目的與要求本章主要學(xué)習(xí)數(shù)據(jù)分析中的數(shù)據(jù)挖掘,以數(shù)據(jù)挖掘過程和算法為主線,介紹數(shù)據(jù)挖掘的概念、代表性預(yù)處理和挖掘方法。數(shù)據(jù)挖掘建立在多個(gè)學(xué)科的基礎(chǔ)之上,是人工智能和數(shù)據(jù)庫領(lǐng)域的重要內(nèi)容。傳統(tǒng)的數(shù)據(jù)挖掘主要針對(duì)趨勢和行為自動(dòng)預(yù)測、關(guān)聯(lián)、聚類、關(guān)聯(lián)規(guī)則、特征、變化和偏差分析以及Web挖掘等方法,而本章迎合當(dāng)

24、前數(shù)據(jù)挖掘方法和技術(shù)不斷向支持大數(shù)據(jù)分析方向發(fā)展、衍生的趨勢,針對(duì)非結(jié)構(gòu)化數(shù)據(jù)大量出現(xiàn)的實(shí)際情況,數(shù)據(jù)分析和處理技術(shù)上,增加了這部分?jǐn)?shù)據(jù)的挖掘方法和技術(shù)的內(nèi)容。預(yù)處理、挖掘、評(píng)估和應(yīng)用,是數(shù)據(jù)挖掘的基本流程。在學(xué)習(xí)中,要把握住數(shù)據(jù)挖掘的主線進(jìn)行研究與掌握。通過本章學(xué)習(xí),要求學(xué)生數(shù)據(jù)挖掘的概念,了解數(shù)據(jù)挖掘的內(nèi)涵,領(lǐng)會(huì)數(shù)據(jù)挖掘的任務(wù),掌握數(shù)據(jù)挖掘的過程,領(lǐng)會(huì)數(shù)據(jù)清理的基本思想,掌握數(shù)據(jù)清理的三個(gè)步驟,領(lǐng)會(huì)相似重復(fù)數(shù)據(jù)、不完整數(shù)據(jù)、錯(cuò)誤數(shù)據(jù)的數(shù)據(jù)清理方法,了解數(shù)據(jù)分析的兩種方法,了解數(shù)據(jù)分類分析和數(shù)據(jù)聚類分析的概念和目的??傮w來說,要了解以下四個(gè)問題:第一,通過填補(bǔ)數(shù)據(jù)、消除異常數(shù)據(jù)、平滑噪聲數(shù)據(jù)

25、以及糾正不一致的數(shù)據(jù),來保證數(shù)據(jù)質(zhì)量,這是數(shù)據(jù)清理問題,是數(shù)據(jù)挖掘和數(shù)據(jù)倉庫構(gòu)建預(yù)處理的重要內(nèi)容;第二,在給定其他變量的條件下對(duì)感興趣的未知變量值做出預(yù)測,這是數(shù)據(jù)的分類問題;第三,將數(shù)據(jù)對(duì)象分解或劃分為多個(gè)類或簇,使同一個(gè)類中的數(shù)據(jù)對(duì)象之間具有較高的相似度、但與其他類中的數(shù)據(jù)又有較大的差異,這是句聚類問題;第四,通過實(shí)驗(yàn)來測試數(shù)據(jù)挖掘算法的性能,驗(yàn)證算法的有效性和有用性,這是算法評(píng)價(jià)問題。本章屬于數(shù)據(jù)科學(xué)的前沿知識(shí)部分,涉及到多個(gè)交叉學(xué)科和多種基礎(chǔ)知識(shí),作為數(shù)據(jù)處理的延伸性內(nèi)容,對(duì)學(xué)生的考核要求不高,以基本概念、基本知識(shí)的識(shí)記,相關(guān)技術(shù)的簡單領(lǐng)會(huì)為主。二、課程內(nèi)容1. 領(lǐng)會(huì)數(shù)據(jù)挖掘前言2.

26、領(lǐng)會(huì)數(shù)據(jù)挖掘基本的內(nèi)涵和任務(wù)3. 掌握數(shù)據(jù)挖掘的過程4. 了解數(shù)據(jù)質(zhì)量管理的基本思想5. 領(lǐng)會(huì)數(shù)據(jù)清理流程6. 掌握數(shù)據(jù)清理的三個(gè)步驟7. 領(lǐng)會(huì)相似重復(fù)數(shù)據(jù)、不完整數(shù)據(jù)、錯(cuò)誤數(shù)據(jù)的數(shù)據(jù)清理方法7. 了解數(shù)據(jù)分析的兩種方法8. 了解數(shù)據(jù)分類分析的概念和目的9. 了解數(shù)據(jù)聚類分析的概念和目的三、考核知識(shí)點(diǎn)與考核要求1. 數(shù)據(jù)挖掘概述識(shí)記:數(shù)據(jù)挖掘的過程。領(lǐng)會(huì):數(shù)據(jù)挖掘的內(nèi)涵、數(shù)據(jù)挖掘的幾類主要任務(wù)、數(shù)據(jù)挖掘的過程中確定分析對(duì)象、數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘、結(jié)果評(píng)價(jià)、結(jié)果應(yīng)用、數(shù)據(jù)預(yù)處理的幾個(gè)步驟。2. 數(shù)據(jù)清理識(shí)記:數(shù)據(jù)質(zhì)量、全面數(shù)據(jù)質(zhì)量管理及其四個(gè)環(huán)節(jié)的任務(wù)。領(lǐng)會(huì):影響數(shù)據(jù)質(zhì)量的幾個(gè)方面因素、數(shù)據(jù)清理的

27、步驟、 數(shù)據(jù)清理方法中的相似重復(fù)數(shù)據(jù)清理(問題提出、識(shí)別、清理算法)、不完整數(shù)據(jù)清理(問題、填充方法及舉例)、錯(cuò)誤數(shù)據(jù)清理(問題、清理步驟)。3. 數(shù)據(jù)分析識(shí)記:聚類的概念、分類的概念。領(lǐng)會(huì):數(shù)據(jù)分類的目的、聚類的目的。四、本章重點(diǎn)、難點(diǎn)本章重點(diǎn)為數(shù)據(jù)挖掘的過程,數(shù)據(jù)清理流程和數(shù)據(jù)清理方法。難點(diǎn)為相似重復(fù)數(shù)據(jù)、不完整數(shù)據(jù)、錯(cuò)誤數(shù)據(jù)的數(shù)據(jù)清理方法。第5章 數(shù)據(jù)倉庫一、學(xué)習(xí)目的與要求本章主要學(xué)習(xí)數(shù)據(jù)分析中的數(shù)據(jù)倉庫,以數(shù)據(jù)倉庫的構(gòu)建和應(yīng)用為主線,學(xué)習(xí)數(shù)據(jù)倉庫的概念、體系結(jié)構(gòu)技術(shù)。數(shù)據(jù)倉庫主要為現(xiàn)實(shí)應(yīng)用提供數(shù)據(jù)支持,并為縮小數(shù)據(jù)和信息之間的鴻溝提供橋梁,它是企業(yè)信息集成和輔助決策應(yīng)用的關(guān)鍵技術(shù)之一。

28、通過數(shù)據(jù)倉庫基礎(chǔ)知識(shí)的學(xué)習(xí),學(xué)生要對(duì)數(shù)據(jù)分析的前言知識(shí)有一些簡單的了解,對(duì)云計(jì)算、移動(dòng)通信與海量數(shù)據(jù)管理技術(shù)及電子商務(wù)應(yīng)用之間的發(fā)展和相輔相成的關(guān)系有一些基本的認(rèn)識(shí),為解決數(shù)據(jù)和信息之間的孤島、數(shù)據(jù)處理的高級(jí)應(yīng)用和數(shù)據(jù)科學(xué)的理論研究作鋪墊。通過本章的學(xué)習(xí),要求學(xué)生熟悉數(shù)據(jù)倉庫的基本概念、領(lǐng)會(huì)操作性系統(tǒng)和信息型系統(tǒng)的概念并掌握兩者的差異,領(lǐng)會(huì)數(shù)據(jù)倉庫體系結(jié)構(gòu),對(duì)一般的兩層結(jié)構(gòu)、獨(dú)立數(shù)據(jù)集市的數(shù)據(jù)倉庫體系結(jié)構(gòu)、依賴數(shù)據(jù)集市和操作型數(shù)據(jù)存儲(chǔ)體系結(jié)構(gòu)的三層結(jié)構(gòu)、邏輯數(shù)據(jù)集市和實(shí)時(shí)數(shù)據(jù)倉庫體系結(jié)構(gòu)有較為清晰的認(rèn)識(shí),了解聯(lián)機(jī)分析處理的基本概念??傮w而言,要領(lǐng)會(huì)三個(gè)方面的問題:第一,熟悉數(shù)據(jù)庫與數(shù)據(jù)倉庫、操

29、作型處理與分析型處理,闡述這些概念的本質(zhì)、區(qū)別與聯(lián)系,這是數(shù)據(jù)倉庫定義問題;第二,不同數(shù)據(jù)源中的數(shù)據(jù)流入數(shù)據(jù)倉庫后進(jìn)行分析處理,提供多樣的數(shù)據(jù)應(yīng)用,數(shù)據(jù)及在數(shù)據(jù)倉庫內(nèi)的數(shù)據(jù)轉(zhuǎn)換和流動(dòng)過程,可以認(rèn)為是數(shù)據(jù)倉庫的“流水線”,根據(jù)實(shí)際需求和分析任務(wù)設(shè)計(jì)數(shù)據(jù)流入流出數(shù)據(jù)倉庫的架構(gòu),是數(shù)據(jù)倉庫構(gòu)建和體系結(jié)構(gòu)問題,也是數(shù)據(jù)倉庫相關(guān)應(yīng)用的基礎(chǔ)和關(guān)鍵。第三,數(shù)據(jù)倉庫的真正價(jià)值體現(xiàn)在基于數(shù)據(jù)倉庫的數(shù)據(jù)應(yīng)用,根據(jù)不同的系統(tǒng)架構(gòu)及存儲(chǔ)模式進(jìn)行數(shù)據(jù)的檢索和處理以完成客戶提出的數(shù)據(jù)分析任務(wù),是聯(lián)機(jī)分析處理問題,也是實(shí)現(xiàn)報(bào)表展示、即席查詢、數(shù)據(jù)挖掘和數(shù)據(jù)分析等應(yīng)用的基礎(chǔ)。本章旨在提升學(xué)生數(shù)據(jù)處理的能力。作為數(shù)據(jù)處理的延伸

30、性內(nèi)容,對(duì)學(xué)生的考核要求中等偏低,以基本概念、基本知識(shí)的識(shí)記,相關(guān)技術(shù)的了解和領(lǐng)會(huì)為主。二、課程內(nèi)容1. 了解數(shù)據(jù)倉庫的基本概念2. 領(lǐng)會(huì)操作型系統(tǒng)和信息型系統(tǒng)3. 領(lǐng)會(huì)數(shù)據(jù)倉庫體系結(jié)構(gòu),對(duì)一般的兩層結(jié)構(gòu)、獨(dú)立數(shù)據(jù)集市的數(shù)據(jù)倉庫體系結(jié)構(gòu)、依賴數(shù)據(jù)集市和操作型數(shù)據(jù)存儲(chǔ)體系結(jié)構(gòu)的三層結(jié)構(gòu)、邏輯數(shù)據(jù)集市和實(shí)時(shí)數(shù)據(jù)倉庫體系結(jié)構(gòu)有較為清晰的認(rèn)識(shí),重點(diǎn)把握依賴數(shù)據(jù)集市和操作型數(shù)據(jù)存儲(chǔ)體系結(jié)構(gòu)的三層結(jié)構(gòu)、邏輯數(shù)據(jù)集市和實(shí)時(shí)數(shù)據(jù)倉庫體系結(jié)構(gòu)兩種結(jié)構(gòu)4. 了解聯(lián)機(jī)分析處理的概念三、考核知識(shí)點(diǎn)與考核要求1.數(shù)據(jù)倉庫概述識(shí)記:數(shù)據(jù)倉庫的基本概念、數(shù)據(jù)倉庫的四個(gè)重要特征。領(lǐng)會(huì):從操作性系統(tǒng)到信息型系統(tǒng)、數(shù)據(jù)倉庫的ET

31、L工具包括的功能部件。2 .數(shù)據(jù)倉庫體系結(jié)構(gòu)識(shí)記:數(shù)據(jù)集市的概念、依賴數(shù)據(jù)集市的概念、邏輯數(shù)據(jù)集市的概念、操作型數(shù)據(jù)存儲(chǔ)的概念、邏輯數(shù)據(jù)集市的概念。領(lǐng)會(huì):一般的兩層體系結(jié)構(gòu)的四個(gè)基本步驟、基于數(shù)據(jù)集市的數(shù)據(jù)倉庫體系結(jié)構(gòu)、基于依賴數(shù)據(jù)集市的操作型數(shù)據(jù)存儲(chǔ)體系結(jié)構(gòu)-三層結(jié)構(gòu)、邏輯數(shù)據(jù)集市和實(shí)時(shí)數(shù)據(jù)倉庫體系結(jié)構(gòu)(兩個(gè)角度出發(fā)的特征)、數(shù)據(jù)倉庫和數(shù)據(jù)集市在不同方面的區(qū)別。3.聯(lián)機(jī)分析處理識(shí)記:OLAP的概念。四、本章重點(diǎn)、難點(diǎn)本章重點(diǎn)為數(shù)據(jù)倉庫的體系結(jié)構(gòu),包括一般的兩層結(jié)構(gòu)、獨(dú)立數(shù)據(jù)集市的數(shù)據(jù)倉庫體系結(jié)構(gòu)、依賴數(shù)據(jù)集市和操作型數(shù)據(jù)存儲(chǔ)體系結(jié)構(gòu)的三層結(jié)構(gòu)、邏輯數(shù)據(jù)集市和實(shí)時(shí)數(shù)據(jù)倉庫體系結(jié)構(gòu)。難點(diǎn)為依賴數(shù)

32、據(jù)集市和操作型數(shù)據(jù)存儲(chǔ)體系結(jié)構(gòu)的三層結(jié)構(gòu)、邏輯數(shù)據(jù)集市和實(shí)時(shí)數(shù)據(jù)倉庫體系結(jié)構(gòu)。第6章 Web服務(wù)一、學(xué)習(xí)目的與要求本章主要學(xué)習(xí)數(shù)據(jù)服務(wù)中的Web服務(wù)。Web是數(shù)據(jù)服務(wù)的一種典型應(yīng)用,目前對(duì)Web服務(wù)的研究和應(yīng)用,從底層的分布式計(jì)算和互聯(lián)網(wǎng)協(xié)議、到中間層的服務(wù)部署與發(fā)布、再到上層的服務(wù)組合與應(yīng)用集成,具有豐富的內(nèi)容。本章以面向應(yīng)用的Web服務(wù)管理為出發(fā)點(diǎn),圍繞自動(dòng)服務(wù)發(fā)現(xiàn)與組合的支撐計(jì)算,在中間層之上討論Web服務(wù)的架構(gòu)與技術(shù)。本章的學(xué)習(xí)目標(biāo)是通過Web服務(wù)的學(xué)習(xí),對(duì)數(shù)據(jù)處理的最終目標(biāo)數(shù)據(jù)服務(wù)有較為清晰的理解,熟悉Web服務(wù)的特點(diǎn):面向應(yīng)用、高綜合性和高集成度;了解Web服務(wù)研究與應(yīng)用中的關(guān)鍵問

33、題是Web服務(wù)質(zhì)量以及自動(dòng)服務(wù)發(fā)現(xiàn)與組合。此外通過Web服務(wù)中Web計(jì)算和XML技術(shù)的融合,體會(huì)數(shù)據(jù)處理和數(shù)據(jù)服務(wù)之間的關(guān)系。通過本章的學(xué)習(xí),要求學(xué)生了解Web的基本概念,熟悉基于Web服務(wù)的電子商務(wù)應(yīng)用集成模式,領(lǐng)會(huì)Web技術(shù)架構(gòu),了解WSDL的簡介,領(lǐng)會(huì)Web服務(wù)質(zhì)量中,幾種QoS的度量尺度,了解Web服務(wù)安全問題,了解Web安全標(biāo)準(zhǔn)模型中Web安全機(jī)制概述內(nèi)容??傮w而言,要領(lǐng)會(huì)以下三個(gè)問題:第一,在基于Web服務(wù)的模型中,可以清晰地區(qū)分服務(wù)提供者、服務(wù)請(qǐng)求者和服務(wù)代理,這些參與者之間通過標(biāo)準(zhǔn)的協(xié)議進(jìn)行通信,服務(wù)之間也具有高度的獨(dú)立性和松散耦合性,各參與者的內(nèi)部結(jié)構(gòu)、協(xié)議及底層信息對(duì)用戶透

34、明,這是Web服務(wù)的技術(shù)架構(gòu)和標(biāo)準(zhǔn)協(xié)議問題,是Web服務(wù)應(yīng)用的基礎(chǔ);第二,在基于現(xiàn)有的計(jì)算資源開發(fā)基于服務(wù)的應(yīng)用時(shí),如何衡量服務(wù)的好壞,如何選擇可用的、合適的服務(wù),這是Web服務(wù)質(zhì)量問題;第三,在服務(wù)的組合和協(xié)調(diào)中,需要保證服務(wù)的安全性,建立安全模型,使安全保證成為Web服務(wù)中一個(gè)自動(dòng)完成的部分,這是Web服務(wù)安全問題。本章內(nèi)容屬于數(shù)據(jù)服務(wù)部分,屬于數(shù)據(jù)處理的應(yīng)用領(lǐng)域,旨在提升學(xué)生數(shù)據(jù)處理的能力。作為數(shù)據(jù)處理的延伸性內(nèi)容,對(duì)學(xué)生的考核要求中等偏高,在基本概念、基本知識(shí)的識(shí)記之外,對(duì)相關(guān)技術(shù)的領(lǐng)會(huì)也有較多要求。二、課程內(nèi)容1. 了解企業(yè)應(yīng)用集成與電子商務(wù)中的需求與挑戰(zhàn)2. 領(lǐng)會(huì)基于Web服務(wù)的電

35、子商務(wù)應(yīng)用集成模式3. 了解Web服務(wù)技術(shù)架構(gòu)中面向服務(wù)的架構(gòu)4. 了解Web服務(wù)技術(shù)架構(gòu)中Web服務(wù)體系結(jié)構(gòu)5. 了解Web服務(wù)協(xié)議棧6. 了解Web服務(wù)開發(fā)的生命周期和開發(fā)方案7. “軟件即服務(wù)”理念8. 了解WSDL、SOAP和UDDI的基本概念9. 了解Web服務(wù)質(zhì)量中幾種QoS的幾種度量尺度10. 熟悉Web服務(wù)質(zhì)量度量方法的基本思想11.了解Web服務(wù)安全問題12. 領(lǐng)會(huì)Web服務(wù)安全標(biāo)準(zhǔn)和模型中Web服務(wù)安全機(jī)制概述三、考核知識(shí)點(diǎn)與考核要求1. Web服務(wù)識(shí)記:面向服務(wù)的架構(gòu)(SOA)、Web服務(wù)體系結(jié)構(gòu)的三個(gè)參與者與三種基本操作、WSDL、SOAP、UDDI、“軟件即服務(wù)”定義

36、。領(lǐng)會(huì): Web服務(wù)的基本概念、基于Web服務(wù)的電子商務(wù)應(yīng)用集成模式(代價(jià)、優(yōu)越性)、Web服務(wù)技術(shù)架構(gòu)(面向服務(wù)的架構(gòu)、Web服務(wù)體系結(jié)構(gòu)、Web服務(wù)協(xié)議棧、Web服務(wù)開發(fā)的生命周期和開發(fā)方案、“軟件即服務(wù)”理念)、Web服務(wù)與基于Web的應(yīng)用程序的差異、Web服務(wù)的主要特點(diǎn)。2. Web服務(wù)的標(biāo)準(zhǔn)協(xié)議識(shí)記:WSDL簡介(基本屬性)、SOAP定義、UDDI簡介。領(lǐng)會(huì):SOAP的簡介、使用SOAP的分布式應(yīng)用。3. Web服務(wù)質(zhì)量識(shí)記:服務(wù)質(zhì)量概念。領(lǐng)會(huì):QoS的度量尺度、Web服務(wù)質(zhì)量度量(基本思想等)。4. Web服務(wù)安全識(shí)記:Web服務(wù)安全機(jī)制。領(lǐng)會(huì):Web服務(wù)安全問題(問題、安全性威脅

37、)、XML安全性標(biāo)準(zhǔn)、Web服務(wù)安全性模型和體系結(jié)構(gòu)。四、本章重點(diǎn)、難點(diǎn)本章重點(diǎn)為Web服務(wù)技術(shù)架構(gòu)、Web服務(wù)安全。本章難點(diǎn)為Web服務(wù)技術(shù)架構(gòu)。第7章 數(shù)據(jù)密集型計(jì)算 (不作考核要求)IV 有關(guān)說明和實(shí)施要求一、自學(xué)考試大綱的目的和作用課程自學(xué)考試大綱是根據(jù)專業(yè)自學(xué)考試計(jì)劃的要求,結(jié)合自學(xué)考試的特點(diǎn)而確定。其目的是對(duì)個(gè)人自學(xué)、社會(huì)助學(xué)和課程考試命題進(jìn)行指導(dǎo)和規(guī)定。課程自學(xué)考試大綱明確了課程學(xué)習(xí)的內(nèi)容以及深廣度,規(guī)定了課程自學(xué)考試的范圍和標(biāo)準(zhǔn)。因此,它是編寫自學(xué)考試教材和輔導(dǎo)書的依據(jù),是社會(huì)助學(xué)組織進(jìn)行自學(xué)輔導(dǎo)的依據(jù),是自學(xué)者學(xué)習(xí)教材、掌握課程內(nèi)容知識(shí)范圍和程度的依據(jù),也是進(jìn)行自學(xué)考試命題的

38、依據(jù)。二、課程自學(xué)考試大綱與教材的關(guān)系課程自學(xué)考試大綱是進(jìn)行學(xué)習(xí)和考核的依據(jù),教材是學(xué)習(xí)掌握課程知識(shí)的基本內(nèi)容與范圍,教材的內(nèi)容是大綱所規(guī)定的課程知識(shí)和內(nèi)容的擴(kuò)展與發(fā)揮。課程內(nèi)容在教材中可以體現(xiàn)一定的深度或難度,但在大綱中對(duì)考核的要求一定要適當(dāng)。大綱與教材所體現(xiàn)的課程內(nèi)容應(yīng)基本一致;大綱里面的課程內(nèi)容和考核知識(shí)點(diǎn),教材里一般也要有。反過來教材里有的內(nèi)容,大綱里就不一定體現(xiàn)。(注:如果教材是推薦選用的,其中有的內(nèi)容與大綱要求不一致的地方,應(yīng)以大綱規(guī)定為準(zhǔn)。)三、關(guān)于自學(xué)教材本課程使用教材為:數(shù)據(jù)工程處理、分析與服務(wù),岳昆編著,清華大學(xué)出版社,2013年12月第一版。四、關(guān)于自學(xué)要求和自學(xué)方法的指

39、導(dǎo)本大綱的課程基本要求是依據(jù)專業(yè)考試計(jì)劃和專業(yè)培養(yǎng)目標(biāo)而確定的。課程基本要求還明確了課程的基本內(nèi)容,以及對(duì)基本內(nèi)容掌握的程度?;疽笾械闹R(shí)點(diǎn)構(gòu)成了課程內(nèi)容的主體部分。因此,課程基本內(nèi)容掌握程度、課程考核知識(shí)點(diǎn)是高等教育自學(xué)考試考核的主要內(nèi)容。為有效地指導(dǎo)個(gè)人自學(xué)和社會(huì)助學(xué),本大綱已指明了課程的重點(diǎn)和難點(diǎn),在章節(jié)的基本要求中一般也指明了章節(jié)內(nèi)容的重點(diǎn)和難點(diǎn)。本課程共6學(xué)分(包括實(shí)驗(yàn)內(nèi)容學(xué)分)根據(jù)學(xué)習(xí)對(duì)象成人在職業(yè)余自學(xué)的情況,并結(jié)合本專業(yè)的要求、本課程的特點(diǎn),本大綱提出如下學(xué)習(xí)方法:1.在全面系統(tǒng)學(xué)習(xí)的基礎(chǔ)上,從工程化的角度把握數(shù)據(jù)處理、數(shù)據(jù)分析、數(shù)據(jù)服務(wù)的基本概念、基礎(chǔ)知識(shí)、基本方法和技能

40、。本課程內(nèi)容涉及到數(shù)據(jù)科學(xué)三個(gè)方面,知識(shí)范圍比較廣泛。自學(xué)者應(yīng)在全面系統(tǒng)學(xué)習(xí)各章節(jié)內(nèi)容,深刻領(lǐng)會(huì)從數(shù)據(jù)處理到數(shù)據(jù)分析到數(shù)據(jù)服務(wù)逐步擴(kuò)充的理論;識(shí)記其中的基本概念、基礎(chǔ)知識(shí)、基本方法和技能,并能夠進(jìn)行初級(jí)的應(yīng)用。2.本教材共7章,其中納入考核要求的為前六章,各章內(nèi)容相對(duì)獨(dú)立又有一定的關(guān)聯(lián),大致分為數(shù)據(jù)處理篇、數(shù)據(jù)分析篇和數(shù)據(jù)服務(wù)篇三部分。關(guān)系數(shù)據(jù)庫查詢優(yōu)化、信息檢索和XML數(shù)據(jù)管理這三章屬于數(shù)據(jù)服務(wù)篇;數(shù)據(jù)挖掘和數(shù)據(jù)倉庫屬于數(shù)據(jù)分析篇;Web服務(wù)和數(shù)據(jù)密集型計(jì)算屬于數(shù)據(jù)服務(wù)篇。建議學(xué)生在自學(xué)時(shí)一個(gè)知識(shí)模塊所涉及的幾個(gè)章節(jié)時(shí),應(yīng)該串起來學(xué)習(xí),以便加強(qiáng)整體上的把握和理解。此外,數(shù)據(jù)密集型計(jì)算屬于高級(jí)

41、應(yīng)用部分,不納入考核范圍之內(nèi)。3.智能數(shù)據(jù)處理是一門理論性為基礎(chǔ),實(shí)踐性為內(nèi)核的課程。因此,自學(xué)時(shí)應(yīng)注重理論與實(shí)踐的結(jié)合,借助基礎(chǔ)知識(shí)和實(shí)踐背景知識(shí)以增強(qiáng)對(duì)本課程的感性認(rèn)識(shí),切忌死記硬背,在關(guān)系數(shù)據(jù)庫查詢優(yōu)化中通過應(yīng)用實(shí)踐操作來更深刻地領(lǐng)會(huì)教材內(nèi)容,將知識(shí)內(nèi)容轉(zhuǎn)化為自身的素質(zhì),以提高自己數(shù)據(jù)處理和應(yīng)用的綜合能力。五、應(yīng)考指導(dǎo)1.如何學(xué)習(xí)。很好的計(jì)劃和組織是學(xué)習(xí)成功的法寶。如果自學(xué)者正在接受培訓(xùn)學(xué)習(xí),一定要跟緊課程并完成作業(yè)。為了在考試中作出滿意的回答,必須對(duì)所學(xué)課程內(nèi)容有很好的理解。使用“行動(dòng)計(jì)劃表”來監(jiān)控學(xué)習(xí)進(jìn)展。閱讀課本時(shí)可以做讀書筆記。如有需要重點(diǎn)注意的內(nèi)容,可以用彩筆來標(biāo)注。如:紅色代

42、表重點(diǎn);綠色代表需要深入研究的領(lǐng)域;黃色代表可以運(yùn)用在工作之中??梢栽诳瞻滋幱涗浵嚓P(guān)資料、文章。另外,本課程有較多新穎的內(nèi)容,涉及數(shù)據(jù)科學(xué)的方方面面,考生可以適當(dāng)借助因特網(wǎng)工具或文獻(xiàn)工具,查閱與課程相關(guān)的背景知識(shí)和前沿領(lǐng)域的最新發(fā)展。2.如何考試。卷面整潔非常重要。書寫工整,段落與間距合理,卷面賞心悅目有助于教師評(píng)分,教師只能為他能看懂的內(nèi)容打分?;卮鹚岢龅膯栴}。要回答所問的問題,而不是回答自己樂意回答的問題。避免超過問題的范圍3.如何處理緊張情緒。正確處理對(duì)失敗的懼怕,要正面思考。如果可能,請(qǐng)教已經(jīng)通過該科目考試的人,問他們一些問題。做深呼吸放松,這有助于使頭腦清醒,緩解緊張情緒??荚嚽昂?/p>

43、理膳食,保持旺盛精力,保持冷靜。4.如何克服心理障礙。這是一個(gè)普遍問題。如果在考試中出現(xiàn)這種情況,試試下列方法:使用“線索”紙條。進(jìn)入考場之前,將記憶“線索”記在紙條上,但不能將紙條帶進(jìn)考場,因此當(dāng)閱讀考卷時(shí),一旦有了思路就快速記下。按自己的步調(diào)進(jìn)行答卷。為每個(gè)考題或部分分配合理時(shí)間,并按此時(shí)間安排進(jìn)行。六、對(duì)社會(huì)助學(xué)的要求1.社會(huì)助學(xué)者應(yīng)根據(jù)大綱規(guī)定的考試內(nèi)容和考核目標(biāo),認(rèn)真鉆研指定教材,明確本課程與其他課程不同的特點(diǎn)和學(xué)習(xí)要求,對(duì)自學(xué)應(yīng)考者進(jìn)行切實(shí)有效的輔導(dǎo),引導(dǎo)他們防止自學(xué)中的各種偏向,把握社會(huì)助學(xué)的正確方向。2.要正確處理基本知識(shí)的應(yīng)用能力的關(guān)系,努力引導(dǎo)自學(xué)應(yīng)考者將識(shí)記、領(lǐng)會(huì)同應(yīng)用聯(lián)

44、系起來,把基本知識(shí)轉(zhuǎn)化為實(shí)際工作能力,在輔導(dǎo)的基礎(chǔ)上,著重培養(yǎng)和提高自學(xué)應(yīng)考者的素質(zhì)和思想水平。3.要正確處理重點(diǎn)和一般的關(guān)系。課程內(nèi)容有重點(diǎn)與一般之分,但考試內(nèi)容是全面的,而且重點(diǎn)與一般是相互影響的,不是截然分開的。社會(huì)助學(xué)者應(yīng)指導(dǎo)自學(xué)應(yīng)考者全面系統(tǒng)的學(xué)習(xí)教材,掌握全部考試內(nèi)容和考核知識(shí)點(diǎn),在此基礎(chǔ)上再突出重點(diǎn)??傊?,要把重點(diǎn)學(xué)習(xí)同兼顧一般結(jié)合起來,不要孤立地抓重點(diǎn),把自學(xué)應(yīng)考者引向猜題押題七、對(duì)考核內(nèi)容的說明1.本課程要求考生學(xué)習(xí)和掌握的知識(shí)點(diǎn)內(nèi)容都作為考核的內(nèi)容。課程中各章的內(nèi)容均由若干知識(shí)點(diǎn)組成,在自學(xué)考試中成為考核知識(shí)點(diǎn)。因此,課程自學(xué)考試大綱中所規(guī)定的考試內(nèi)容是以分解為考核知識(shí)點(diǎn)的方式給出的。由于各知識(shí)點(diǎn)在課程中的地位、作用以及知識(shí)自身的特點(diǎn)不同,自學(xué)考試將對(duì)各知識(shí)點(diǎn)分別按四個(gè)認(rèn)知(或叫能力)層次確定其考核要求。2.按照重要性程度不同,考核內(nèi)容分為重點(diǎn)內(nèi)容、次重點(diǎn)內(nèi)容、一般內(nèi)容,在本課程試卷中對(duì)不同考核內(nèi)容要求的分?jǐn)?shù)比例大致為:重點(diǎn)內(nèi)容占60%,次重點(diǎn)內(nèi)容占30%,一般內(nèi)容占10%。3.課程分為三個(gè)主要的部分,分別為數(shù)據(jù)處理篇(前3章)、數(shù)據(jù)分析篇(第4和第5章)、數(shù)據(jù)服務(wù)篇(第6章),考試試卷中所占的比例大約分別為:50%、30%和20%,其中數(shù)據(jù)處理篇分為關(guān)系數(shù)據(jù)庫查詢優(yōu)化、信息檢索和XML數(shù)據(jù)管理,在這部分的比例大約分別為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論