空間數(shù)據(jù)挖掘中數(shù)據(jù)預處理技術(shù)探討_第1頁
空間數(shù)據(jù)挖掘中數(shù)據(jù)預處理技術(shù)探討_第2頁
空間數(shù)據(jù)挖掘中數(shù)據(jù)預處理技術(shù)探討_第3頁
空間數(shù)據(jù)挖掘中數(shù)據(jù)預處理技術(shù)探討_第4頁
空間數(shù)據(jù)挖掘中數(shù)據(jù)預處理技術(shù)探討_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、 述 。 % 空 間 區(qū) 分規(guī) 則 % 空 間演 化規(guī)則 , 指兩 類或 多類 目標 間幾 何或 屬性 的不 同特征 指 空 間 目標 的幾 何 、 , 是對 個 性 的描述 。 。 , 屬 性特 征 隨時間 而變化 的規(guī)律 。 這 一 規(guī)律 的發(fā) 現(xiàn) 必須基 于 時空 數(shù)據(jù) 庫或同 一 區(qū)域 的 多個時相 的數(shù)據(jù) % 面 向?qū)?象的知識 因此 , , 是關(guān) 于 某類復雜對象 的子 類構(gòu) 成及 其普 遍 特征的知 識 。 理論 上 來說 。 , 空 間數(shù)據(jù) 倉庫技 術(shù) 可 以 基本滿 足空 間數(shù)據(jù) 挖掘 中對 空 間 數(shù)據(jù) 進行 預 處 理 的要 求 4 勸/. ! = ; ! 為 了 實 現(xiàn)

2、 高 效 的 空 間 數(shù)據(jù) 預處理 , , 通 過 三個 主要 的模塊來實 現(xiàn) 數(shù) 據(jù) 預 處 理 + 特征 的選 取 空 間連 接和 數(shù)據(jù)轉(zhuǎn)換 5 + 。 特 征選 取模 塊 型 、 定 義 并從數(shù)據(jù)庫 中提取所有相關(guān) 信息 , 包括數(shù) 據(jù)庫 圖解 、 目標特 征 的類 目標特征 的非 空 間屬 性及 相關(guān)特征的類 型 , 空 間連 接模塊 + 基 于 特 征提取 模塊 中提 取的特 征 計算 和具 體化用 戶 指定 的空 間關(guān) 系 , , 數(shù)據(jù)轉(zhuǎn)換 模塊 + 用 于將 空 間連接關(guān) 系輸 出為可 以 為數(shù)據(jù)挖掘算法識 別 的格 式 + 。 這個 模塊 + 要求用 戶指 定兩個 參數(shù) 間隔尺

3、 寸 %粒度 水平 和 要選 用 的傳統(tǒng)數(shù)據(jù) 挖掘 方法 , 。 例如 某表 基于 2 中包 含 目標 特征 的非空 間屬 性 及所 有實例數(shù)據(jù) 此 模 塊將對表 2 中的每一 條 實例 數(shù)據(jù) 。 , 目標特征 和 相關(guān)特征間每 種不 同的空 間關(guān) 系來生 成 一個新 的屬性 6 # 空 間數(shù) 據(jù)預 處理 中的關(guān) 鍵技術(shù) 連 續(xù)型 空 間屬性數(shù) 據(jù) 的離散 化 , 6 對 于 連續(xù) 型 的空 間屬 性 數(shù)據(jù) 必須采用 適 當 的方 法加 以離 散 化 , , 這是 因為某 些 挖 掘算 法 難 以 對 整數(shù)或 實數(shù) 等 連續(xù) 型 變量 進 行操 作 性差 。 而 且連 續(xù) 型 屬 性數(shù)據(jù) 挖掘

4、 出來 的知識 通 常 可 理 解 , 屬性 數(shù)據(jù) 的離散 化是指 通過 用較 高層 的概 念替換原 始 數(shù)據(jù)或較低層 的概 念 將 屬性域 值 , , 分 成若 干 區(qū) 間 以 此 進 行 連續(xù) 屬 性 的離 散 化 , 大大 地濃 縮 數(shù) 據(jù)庫 記 錄 盡 管 這 種 泛化 使 得 細 , 。 。 節(jié) 丟失 但 泛 化后 的數(shù)據(jù) 更有 意 義并 容 易理 解 有助 于 挖掘 不 同抽 象層 次 的模 式 知識 于 離散數(shù)據(jù) , 即 使對 有 時也 需 要通 過 將 離 散值 進行 合 并 得 到更 高 抽象 層 次 的離 散值 、 。 常 見 的離 散 化算法 有 + 分箱 法 散化算 法

5、 、 直方 圖 法 、 聚類分析法 。 、 最大 嫡法 、 布爾 邏 輯 和 助 ; 集理論 相 結(jié)合 的離 基 于 屬性 重要 性 的 離散 化算 法 , 這 些算法 都可 歸結(jié) 為 利用 選 取 的斷點對 連續(xù) 屬 性 。 構(gòu) 成 的空 間進 行劃 分 分存在著 不確定 性 , 得 到有 限個 區(qū)域 , 使得每個 區(qū) 域中 的對象 的屬 性值相 同 。 但是 這些 劃 , , 并 不 能較 好 的模 擬人 類 的劃分 機制 何彬彬等人 以 4 算 法 為基 礎(chǔ) 顧 及 , 空 間數(shù)據(jù) 的不 確定性 和空 間 自相關(guān) 性 空 間 聚類的模糊性 以 及 空 間數(shù)據(jù) 的空 間 自相 關(guān)性 采用

6、不 確定性 的空 間聚類算法進 行 連續(xù) 型 空 間數(shù)據(jù)模糊 離散 化門 6 & 原 始數(shù)據(jù) 中不 確定 性信 息 的處 理 # 。 空 間數(shù) 據(jù) 的不確 定 性可 以認為 是空 間數(shù)據(jù) 的 , , “ 真實值 ” 不能 被肯定 的程度 , 。 它 可 以 看作 是 一 種更廣 義 的誤 差 既包 含 隨 機誤 差 也 包含 系統(tǒng)誤 差 和粗 差 還 包 含 可度 量 和不 可度量的誤 差 以 及 數(shù)值 上 和概念上 的誤 差 , 。 在 形式 上 它一 般 包含 著真 實值 的一 個范 圍 這個范 圍越大 數(shù) , , , , 據(jù) 的不 確定性就越 大 。 + 研 究空 間數(shù) 據(jù) 不確

7、定性有兩 個 目的 一 是要 消 除數(shù)據(jù) 之 間的矛 盾 , 二 是 要評價 空間數(shù)據(jù) 的質(zhì)量 包 括評 定原 始數(shù)據(jù) 和處理 結(jié)果 的質(zhì) 量 掘 過程 中會 不 斷傳播 和積 累 , 。 這些 不確定 性在 空 間數(shù)據(jù)挖 。 從 而導致 挖 掘 出來 的知識 有較大 的誤差 甚 至 毫無 意 義 , 如何通 過 分析 空 間數(shù) 據(jù)挖 掘過 程 中各種不 確定 性 因素 的特性 及其傳播規(guī) 律 1 模型 , 建 立 不確定性 傳播 的度 尋找有效 方法 來 降低其不 確定 性 。 , 從 而 提 高空 間數(shù)據(jù)挖 掘 的質(zhì)量 已成為迫 切需 要解 決的問題 口】 傳統(tǒng) 的不確定 信 息處理方 法

8、 如模糊集 理論 , , 、 證據(jù)理論 和概 率統(tǒng)計理 論等因需要 數(shù)據(jù) 的附 。 加信息或先驗知識 有時在處理大數(shù)據(jù) 量 的數(shù)據(jù)庫方 面無能為力 , , 粗集可 以克 服傳統(tǒng) 不確定信 、 息處 理方法的不 足 并 且 和 它們 的有 機 結(jié)合 可望 進 一 步增 強對 不 確定 力 。 不 完全信息 的處理能 何彬彬 等人 采 用 4 ! 18 . < ! 模 擬 法對 其進行 不確定 性模 擬 根據(jù) 不 同空 間對 象的位 數(shù) , 據(jù)和 不 同屬性數(shù)據(jù) 的均值和 中誤差 分別得到 不 同空 間對 象 的位置 數(shù)據(jù) 和不 同屬性數(shù)據(jù) 的模擬 , 數(shù) 據(jù)】 , 。 結(jié)語 目前 , 大

9、多數(shù) 的學 者都 致 力 于空 間數(shù)據(jù)挖 掘算 法 的研究 。 , 數(shù)據(jù)預 處理 并沒 有 被太 多人 重 , 視 , 這方 面 的研究成果 也不 是 很 多 實際 上 , 數(shù)據(jù) 預處 理在 數(shù)據(jù) 挖掘 過 程 中是 十分 重要 的 。 數(shù)據(jù) 預 處 理技 術(shù) 直接 影 響 著數(shù)據(jù) 挖 掘算法 能否 高 效 準 確 的執(zhí)行 相對 于 空 間數(shù) 據(jù) 預 處 理技 。 術(shù) , 目前傳統(tǒng)數(shù)據(jù)挖掘中數(shù)據(jù) 預處理技術(shù) 還 是有 一些 較成 熟 的理論 與 方法 的 , 空 間數(shù)據(jù) 預處 理應(yīng) 包 含非 空 間數(shù)據(jù) 預處 理 和空 間數(shù)據(jù) 預處 理兩部分 技術(shù) 的理 論與方法 的 同時 , 并 在研 究

10、空 間 數(shù)據(jù)挖 掘 中數(shù)據(jù) 預處 理 。 盡 可 能 繼承 已 有 的傳統(tǒng)數(shù)據(jù) 預處 理技術(shù)成果 參考 文 獻 【 畢 碩 本 耿煥 同 間 國 年 國 內(nèi)空 間 數(shù) 據(jù) 挖 掘 研 究 進 展 與 技 術(shù) 體 系 探討 5耳地 理 信 息 世 , , # 界只% (& # > # 第 集 , 同永慧 , , + 空間數(shù)據(jù)挖掘 中數(shù)據(jù)預 處理 技術(shù)探討 # & 【 李 德仁 王 樹 良 李德毅 王 新洲 論 空 間數(shù)據(jù) 挖掘 和 知識發(fā) 現(xiàn) 的理 論 與方 法 閉 武漢 大學學報 # % 息科學版 & ( ( 年 月 , & 信 6 王全 # # , 陳樺

11、 空 間 數(shù)據(jù) 挖 掘 技 術(shù) 理 論 及 方 法 研 究 閉 # # # 中國教育研 究 論叢 , &( 6 ( 6 6 5 、 力 /. = ! 怡 ; < 8 ! ! , , . ! , ! 4 斌/ ; 8 / ! 1 /! . , 8 < . # 8 8 8 ( 一 . # 80 2 . /. 1 一 3 1 . <1 . / ! ! 1 < 8 ; < 8 = . < 7 8 9 < ! # < 3 1 . 4/ / ; 刀 3 / ! < 5 # 8 # 8 _ / . 1 < ?2 即 6 , . < /

12、 & ( ( 5 =./ 8 . . ; ! . . 4 . 9 < 8 # # : 9 8 # 1 ! / / ; 3 ! 1 . 8 < , . 傲 1/! ! 1 . 8 4/ 一 ; / . 0 + 7 ! 0; 8 / 1 ! / . 5 林 麗清 ! # 3 / 8 ! . 8 < 5習 : . _ ! # / . 1! 2 18 4. , . 0 沙 8 8 1 8 . 1 / < , 0 8 , / 7 8 , , ! 6 # , , , ! &( ( ; 集 和云 理論 在空 間數(shù)據(jù) 挖掘 中的應(yīng)用 【 北 京化 工大 學 &

13、( ( 3 # # # 5 何彬彬 陳翠華 方 濤 郭達 志 空 間數(shù)據(jù)關(guān) 聯(lián) 規(guī)則 挖 掘 的不 確定 性處 理 及度 量 閉 地 理 與 地 , 理 信息科學 ! & , # , ! &( # , # # 5 沈 睿 芳 郭 立 甫 時 希杰 數(shù) 據(jù) 挖 掘 中 的 數(shù)據(jù) 預 處 理 模 型 與 算法 研 究 叨 計 算機 系 統(tǒng) 應(yīng) , , # # 用 5 # &( , ( + 科一 , , =/ / 8 . _ ! . ; . , 3 . / / ? ! ! , 8 < 遨/ / 8 1 8 / 2 . / 1 / ; . 3 1 . 4 / / ; 5 < ! 8 88 0 / ; # ! 1 8 1 _ /< 0 : 1 & ( # 8 1 ! . / 8 ! <8 8 8 4 . 8 / . / .

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論