版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
第四章、第五章關(guān)鍵知識點辨析數(shù)據(jù)整理數(shù)據(jù)問題處理方法數(shù)據(jù)缺失忽略含有缺省值的實例或?qū)傩?簡單)采用平均值、中間值或概率統(tǒng)計值來填充(優(yōu))數(shù)據(jù)重復在進一步審核的基礎(chǔ)上進行合并或刪除處理異常數(shù)據(jù)不符合一般規(guī)律的數(shù)據(jù)對象,可能為噪聲或重要數(shù)據(jù)對象邏輯錯誤通過檢測字段中各屬性有效數(shù)據(jù)值的范圍來判斷格式不一數(shù)據(jù)轉(zhuǎn)換成適合后續(xù)分析和挖掘的統(tǒng)一形式引用A1——相對引用(默認):公式所在單元格的位置改變,引用也隨之改變。$A$1——絕對引用:公式所在單元格的位置改變,引用保持不變?;旌弦茫汗剿趩卧竦奈恢酶淖?,絕對引用部分不變,相對引用部分隨之改變,如$A1(僅鎖定列號),
A$1(僅鎖定行號)
?!?”在誰前面,誰被鎖定。常見錯誤類型錯誤類型錯誤名稱錯誤原因#DIV/0!除零錯誤除數(shù)為0#REF!引用錯誤刪除一個在公式中被引用的單元格#VALUE數(shù)據(jù)類型錯誤如一個文本型加一個數(shù)值型#NAME函數(shù)名錯誤如SUM拼成了SAM######不是錯誤,是單元格列寬不夠造成的大數(shù)據(jù)處理分類大數(shù)據(jù)處理靜態(tài)數(shù)據(jù)流數(shù)據(jù)圖數(shù)據(jù)★靜態(tài)數(shù)據(jù):在處理時已收集完成、在計算式不會發(fā)生改變的數(shù)據(jù)
★流數(shù)據(jù):是指不間斷地、持續(xù)地到達的實時數(shù)據(jù),隨著時間的流逝,流數(shù)據(jù)的價值也隨之降低,通過實時分析計算可以得到更有價值的分析的結(jié)果★圖數(shù)據(jù):以社交網(wǎng)絡、道路交通等數(shù)據(jù)為例的眾多以圖為數(shù)據(jù)呈現(xiàn)形式的數(shù)據(jù),或者轉(zhuǎn)化為圖之后再進行分析靜態(tài)數(shù)據(jù)——批處理Hadoop是一個運行于計算機集群上的分布式系統(tǒng)基礎(chǔ)架構(gòu),適用于靜態(tài)數(shù)據(jù)的批處理計算。Spark是一種與hadoop相似的,應用較廣的開源分布式計算架構(gòu)。Spark啟用了內(nèi)存存儲中間結(jié)果,運行速度比hadoop快。不間斷地、持續(xù)地到達的實時數(shù)據(jù)。流數(shù)據(jù)的價值會隨著時間
的流逝而降低。
對采集的數(shù)據(jù)實時分析和計算并反饋實時結(jié)果。經(jīng)處理系統(tǒng)處理完成的數(shù)據(jù)流直接丟棄或存儲用戶可以實時查詢最新數(shù)據(jù)分析結(jié)果,數(shù)據(jù)不斷更新,實時推薦給用戶流計算應用:廣告推送、個性化推薦、實時交通流計算軟件:Storm、Streams、S4、Puma流數(shù)據(jù)——流計算現(xiàn)實世界中以圖形式展現(xiàn)的數(shù)據(jù)。如社交網(wǎng)絡、道路交通等。圖處理軟件:Pregel、GraphX
圖數(shù)據(jù)——圖計算文本數(shù)據(jù)處理的主要目的是從大規(guī)模的文本數(shù)據(jù)中提取出符合需求的、感興趣的和隱藏的信息。文本數(shù)據(jù)源分詞特征提取數(shù)據(jù)分析結(jié)果呈現(xiàn)非結(jié)構(gòu)化數(shù)據(jù):各類的辦公文檔、文本、圖片、XML、HTML、各類報表、圖像、音頻、視頻無結(jié)構(gòu)的文本結(jié)構(gòu)化:行數(shù)據(jù),二維表結(jié)構(gòu),遵循數(shù)據(jù)格式與長度規(guī)范結(jié)構(gòu)化、便于計算機處理中文分詞分詞是將連續(xù)的字序列按照一定的規(guī)范重新組合成詞序列的過程。1、基于詞典的分詞方法_jieba根據(jù)設(shè)定好的詞典進行分詞2、基于統(tǒng)計的分詞方法依據(jù)上下文中相鄰字出現(xiàn)的頻率統(tǒng)計3、基于規(guī)則的分詞方法模擬人的思維,根據(jù)資料和規(guī)則進行學習分詞。(尚在探索)一般采用詞典法和統(tǒng)計法兩者結(jié)合知識要點1人工智能的本質(zhì)1.人工智能的概念人工智能是指以機器(計算機)為載體,模仿、延伸和擴展人類智能,其與人類或其他動物所呈現(xiàn)的生物智能有著重要區(qū)別。知識要點1人工智能的本質(zhì)
2.人工智能的主要方法知識要點1人工智能的本質(zhì)
3.人工智能的發(fā)展
(1)從計算到智能測試
1950年,圖靈針對“智能測試”問題提出了測試機器是否具有智能的一種方法,即著的“圖靈測試”。
(2)人工智能登上歷史舞臺
1956年,“人工智能達特茅斯夏季研討會”在美國達特茅斯學院召開,標志著人工智能作為一門新興學科正式誕生。
(3)以符號主義表達與推理為代表的人工智能
符號主義人工智能方法認為學習或者其他的智能特征原則上都可以
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2022年上海統(tǒng)計師(初級)考試題庫(含基礎(chǔ)和實務)
- 甘孜職業(yè)學院《工程機械設(shè)計》2023-2024學年第一學期期末試卷
- 七年級科學上冊11.1生物的感覺11.1.1生物對環(huán)境變化的反應學案無答案牛津上海版
- 三年級數(shù)學上冊6平移旋轉(zhuǎn)和軸對稱單元概述和課時安排素材蘇教版
- 三年級數(shù)學上冊四乘與除教案北師大版
- 三年級科學上冊第三單元人與動物5動物世界第一課時教案首師大版
- 三年級科學下冊第四單元磁鐵第3課磁鐵的兩極教學材料教科版
- 計量設(shè)備培訓課件
- 《米拉公寓建筑分析》課件
- 《弧形導臺過站》課件
- 2024版國開電大法學本科《商法》歷年期末考試總題庫
- 湖北省荊州市荊州八縣市區(qū)2023-2024學年高一上學期1月期末聯(lián)考物理試題(原卷版)
- 小程序商場方案
- 班組年終總結(jié)
- 高位肛瘺的護理查房
- 廣西桂林市2023-2024學年高二上學期期末考試物理試卷
- 內(nèi)蒙古赤峰市2023-2024學年高一上學期期末考試物理試題【含答案解析】
- nfc果汁加工工藝
- 慢性胃炎的康復治療
- 北京市通州區(qū)2023-2024學年七年級上學期期末數(shù)學試題
- 雨污分流管網(wǎng)工程施工重點難點分析及解決方案
評論
0/150
提交評論