




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、第第3章章 實際實際SQL Server數(shù)據(jù)發(fā)掘數(shù)據(jù)發(fā)掘創(chuàng)建數(shù)據(jù)發(fā)掘工程創(chuàng)建數(shù)據(jù)發(fā)掘工程n在在SQL Server 2019的程序目錄中翻開的程序目錄中翻開n進入進入BI Dev Studio,在文件菜單中選擇,在文件菜單中選擇“新建新建“工程工程 n留意工程文件是保管在留意工程文件是保管在“我的文檔文件夾中的我的文檔文件夾中的新建工程對話框新建工程對話框翻開處理方案資源管理器查看翻開處理方案資源管理器查看MovieClick數(shù)據(jù)集數(shù)據(jù)集n2019年年11月,對微軟的雇員進展調(diào)查。月,對微軟的雇員進展調(diào)查。n調(diào)查訊問了被調(diào)查者的電影觀看行為、人口統(tǒng)計信調(diào)查訊問了被調(diào)查者的電影觀看行為、人口統(tǒng)計
2、信愛所喜歡的電影、演員和導(dǎo)演。愛所喜歡的電影、演員和導(dǎo)演。n內(nèi)容包括內(nèi)容包括n多久看一次電影多久看一次電影n多久租一次影片多久租一次影片n家里有多少臺電視機家里有多少臺電視機n誰通常會選擇您觀看的電影誰通常會選擇您觀看的電影n您最喜歡的電影您最喜歡的電影MovieClick數(shù)據(jù)集數(shù)據(jù)集n2019年年11月,對微軟的雇員進展調(diào)查。月,對微軟的雇員進展調(diào)查。n內(nèi)容包括內(nèi)容包括n您最喜歡的導(dǎo)演您最喜歡的導(dǎo)演n您最喜歡的男演員和女演員您最喜歡的男演員和女演員n年齡年齡n性別性別n婚姻情況婚姻情況n有幾個小孩有幾個小孩n您家里有多少張床您家里有多少張床n您擁有多少輛汽車您擁有多少輛汽車您的房子中有多少間
3、浴室您的房子中有多少間浴室您最喜歡的喜好、興趣領(lǐng)域是什么您最喜歡的喜好、興趣領(lǐng)域是什么您的學(xué)歷您的學(xué)歷在在ssms中創(chuàng)建數(shù)據(jù)庫中創(chuàng)建數(shù)據(jù)庫1 在在ssms中創(chuàng)建數(shù)據(jù)庫中創(chuàng)建數(shù)據(jù)庫2 從外部文件導(dǎo)入數(shù)據(jù)從外部文件導(dǎo)入數(shù)據(jù)2 從外部文件導(dǎo)入數(shù)據(jù)從外部文件導(dǎo)入數(shù)據(jù)2 從外部文件導(dǎo)入數(shù)據(jù)從外部文件導(dǎo)入數(shù)據(jù)2 從外部文件導(dǎo)入數(shù)據(jù)從外部文件導(dǎo)入數(shù)據(jù)2 從外部文件導(dǎo)入數(shù)據(jù)從外部文件導(dǎo)入數(shù)據(jù)2 從外部文件導(dǎo)入數(shù)據(jù)從外部文件導(dǎo)入數(shù)據(jù)2 從外部文件導(dǎo)入數(shù)據(jù)從外部文件導(dǎo)入數(shù)據(jù)2 從外部文件導(dǎo)入數(shù)據(jù)從外部文件導(dǎo)入數(shù)據(jù)在處理方案中新建數(shù)據(jù)源在處理方案中新建數(shù)據(jù)源 BI新建數(shù)據(jù)源視圖新建數(shù)據(jù)源視圖n為了使下一步順利進展,
4、為了使下一步順利進展,在數(shù)據(jù)發(fā)掘工程節(jié)點上在數(shù)據(jù)發(fā)掘工程節(jié)點上單擊右鍵選擇單擊右鍵選擇“屬性屬性進展設(shè)置進展設(shè)置將部署中的目的效力器更改將部署中的目的效力器更改改為本機上的數(shù)據(jù)庫改為本機上的數(shù)據(jù)庫效力器的稱號效力器的稱號創(chuàng)建創(chuàng)建MovieClick數(shù)據(jù)源數(shù)據(jù)源n在在SSMS中創(chuàng)建中創(chuàng)建MovieClick數(shù)據(jù)庫,導(dǎo)入數(shù)據(jù)表數(shù)據(jù)庫,導(dǎo)入數(shù)據(jù)表n在在BI Dev Studio中創(chuàng)建工程中創(chuàng)建工程MovieClickn在在MovieClick工程中建立數(shù)據(jù)源工程中建立數(shù)據(jù)源n建立數(shù)據(jù)源視圖:本例的要點是建立數(shù)據(jù)源中多張建立數(shù)據(jù)源視圖:本例的要點是建立數(shù)據(jù)源中多張表之間的嵌套關(guān)系表之間的嵌套關(guān)系n假設(shè)
5、一個事例表和一個嵌套表之間的關(guān)系不存在于假設(shè)一個事例表和一個嵌套表之間的關(guān)系不存在于關(guān)系數(shù)據(jù)庫中,那么必需在關(guān)系數(shù)據(jù)庫中,那么必需在DSV中指定該關(guān)系,否中指定該關(guān)系,否那么將無法將嵌套表添加到模型中那么將無法將嵌套表添加到模型中 n大家可以嘗試在大家可以嘗試在SSMS的相應(yīng)數(shù)據(jù)庫中經(jīng)過建立數(shù)的相應(yīng)數(shù)據(jù)庫中經(jīng)過建立數(shù)據(jù)庫關(guān)系圖來建立表之間的關(guān)系據(jù)庫關(guān)系圖來建立表之間的關(guān)系MovieClick數(shù)據(jù)源視圖數(shù)據(jù)源視圖運用運用DSV來閱讀數(shù)據(jù)來閱讀數(shù)據(jù)運用命名計算運用命名計算n在在DSV中可以創(chuàng)建命名計算、命名查詢和視圖,這中可以創(chuàng)建命名計算、命名查詢和視圖,這些操作并不會影響到原數(shù)據(jù)庫中的數(shù)據(jù)些操作
6、并不會影響到原數(shù)據(jù)庫中的數(shù)據(jù)n在在DSV中,命名計算列是表中附加的虛列,所以可中,命名計算列是表中附加的虛列,所以可以在本人的數(shù)據(jù)中發(fā)掘派生信息,而不需求改動源以在本人的數(shù)據(jù)中發(fā)掘派生信息,而不需求改動源數(shù)據(jù)數(shù)據(jù)n命名計算列包含一個稱號、一個包含計算的命名計算列包含一個稱號、一個包含計算的SQL表表達式和一個可選的描畫達式和一個可選的描畫運用命名計算運用命名計算n1 算術(shù)操作算術(shù)操作n可以運用可以運用+,-,*,/和和%(求模求模)。例如創(chuàng)建利潤列。例如創(chuàng)建利潤列nSales Price-Item Costn2 數(shù)學(xué)函數(shù)數(shù)學(xué)函數(shù)n例:以對數(shù)的方法來規(guī)范化一個以指數(shù)級別增長的例:以對數(shù)的方法來規(guī)
7、范化一個以指數(shù)級別增長的列列nLog(Sales Quantity)n創(chuàng)建一個標(biāo)志,判別實踐值高于還是低于季度預(yù)算創(chuàng)建一個標(biāo)志,判別實踐值高于還是低于季度預(yù)算nSign(Actual Expenses-Budgeted Expenses)運用命名計算運用命名計算n3 組合表達式組合表達式n將婚姻情況和能否有孩子的屬性進展組合將婚姻情況和能否有孩子的屬性進展組合nMarital Status+ +Has Childrenn4 CASE表達式表達式nCASE表達式可以創(chuàng)建有意義的變量,可以到達如表達式可以創(chuàng)建有意義的變量,可以到達如下的目的:下的目的:n改動值的標(biāo)簽改動值的標(biāo)簽n手動離散化列手動離
8、散化列n減少有效形狀的個數(shù)減少有效形狀的個數(shù)n將一個屬性從一個嵌套表中轉(zhuǎn)換為一個事例級屬性將一個屬性從一個嵌套表中轉(zhuǎn)換為一個事例級屬性運用命名計算運用命名計算n4 CASE表達式表達式n改動值的標(biāo)簽改動值的標(biāo)簽nCASE Categoryn When 1 then foodn When 2 then Beveragen When 3 then goodsnEND CASE運用命名計算運用命名計算n4 CASE表達式表達式n手動離散化列:手動離散化列:nCASE n When Age20 then Under 20n When Age=30 then Berween 20 and 30n Whe
9、n Age=40 then Between 30 and 40n ELSE Over 40nEND運用命名計算運用命名計算n4 CASE表達式表達式n減少有效形狀的個數(shù)減少有效形狀的個數(shù)nCASE Marital Statusn When Married then Marital Statusn When Never Married then Marital Status n ELSE OthernEND運用命名計算運用命名計算n4 CASE表達式表達式n將一個屬性從一個嵌套表轉(zhuǎn)換到事例表:將一個屬性從一個嵌套表轉(zhuǎn)換到事例表:nCASE n When Existsn (Select Movie
10、 From Moviesn Where Movie=Star Wars And n Movies.CustomerID=Customers.CustomerIDn ) then True n ELSE FalsenEND在在Customers表上創(chuàng)建一個命名計算表上創(chuàng)建一個命名計算n下面創(chuàng)建一個命名計算離散化并減少下面創(chuàng)建一個命名計算離散化并減少Num Bedrooms列中的形狀。列中的形狀。n在在DSV中右擊中右擊Customers表,選擇表,選擇“新建命名計算新建命名計算在在Customers表上創(chuàng)建一個命名計算表上創(chuàng)建一個命名計算n在對話框中輸入計算列名在對話框中輸入計算列名Bedroo
11、ms、描畫和表達、描畫和表達式式在在Customers表上創(chuàng)建一個命名計表上創(chuàng)建一個命名計算算Case WHEN NUM BEDROOMS =1 THEN ONE WHEN NUM BEDROOMS =4 THEN FOUR OR MORE ELSE NONEEND運用命名查詢運用命名查詢n可以運用數(shù)據(jù)源視圖設(shè)計器中的可以運用數(shù)據(jù)源視圖設(shè)計器中的“創(chuàng)建命名查詢創(chuàng)建命名查詢對話框向數(shù)據(jù)源視圖添加命名查詢。對話框向數(shù)據(jù)源視圖添加命名查詢。n命名查詢是以表的方式表示的命名查詢是以表的方式表示的 SQL 表達式。表達式。n在命名查詢中,可以指定一個在命名查詢中,可以指定一個 SQL 表達式來選擇表達式
12、來選擇從一個或多個數(shù)據(jù)源的一個或多個表前往的行和列。從一個或多個數(shù)據(jù)源的一個或多個表前往的行和列。n命名查詢基于一個表達式,除此之外,它在行和關(guān)命名查詢基于一個表達式,除此之外,它在行和關(guān)系方面都與數(shù)據(jù)源視圖中的其他表類似。系方面都與數(shù)據(jù)源視圖中的其他表類似。n該表達式作為表顯示在數(shù)據(jù)源視圖中,其行為也與該表達式作為表顯示在數(shù)據(jù)源視圖中,其行為也與表一樣。表一樣。運用命名查詢運用命名查詢n創(chuàng)建命名查詢時,需求為創(chuàng)建命名查詢時,需求為 SQL 查詢前往的此表的查詢前往的此表的列和數(shù)據(jù)指定稱號,并根據(jù)需求對命名查詢進展闡列和數(shù)據(jù)指定稱號,并根據(jù)需求對命名查詢進展闡明。明。nSQL 表達式可以援用數(shù)
13、據(jù)源視圖中的其他表。表達式可以援用數(shù)據(jù)源視圖中的其他表。n命名查詢允許不修正根底數(shù)據(jù)源即可擴展數(shù)據(jù)源視命名查詢允許不修正根底數(shù)據(jù)源即可擴展數(shù)據(jù)源視圖中現(xiàn)有表的關(guān)系架構(gòu)。圖中現(xiàn)有表的關(guān)系架構(gòu)。n例如,可以運用一系列命名查詢將一個復(fù)雜的維度例如,可以運用一系列命名查詢將一個復(fù)雜的維度表分割為幾個較小、較簡單的維度表以便在數(shù)據(jù)庫表分割為幾個較小、較簡單的維度表以便在數(shù)據(jù)庫維度中運用。維度中運用。運用命名查詢運用命名查詢n對于數(shù)據(jù)發(fā)掘來說,有用的典型查詢是過濾、銜接對于數(shù)據(jù)發(fā)掘來說,有用的典型查詢是過濾、銜接和采樣查詢和采樣查詢n基于列的值過濾行:基于列的值過濾行:nSelect * From Mov
14、ies Where Movie !=Star Wars運用命名查詢運用命名查詢n從嵌套表中過濾掉不常見的項從嵌套表中過濾掉不常見的項nselect CustomerID,Movie from Moviesnwhere Movie inn (select distinct Movien from Movies Group by Movien Having count(Movie)20)對記錄按照對記錄按照Movie字段分組字段分組對分組按照組的對分組按照組的聚合結(jié)果作過濾聚合結(jié)果作過濾運用命名查詢運用命名查詢n從一個外表中銜接信息:從一個外表中銜接信息:nselectn customers.*,
15、Education.Education Leveln from Customers Join Education on Customers.Education Id =Education.Education Id運用命名查詢運用命名查詢n采樣一個采樣一個SQL Server數(shù)據(jù)庫中的行數(shù)據(jù)庫中的行nselect * from customersn tablesample (30 precent)n pepeatable(1)基于基于Customers表創(chuàng)建命名查詢表創(chuàng)建命名查詢n在在Customers表上創(chuàng)建一個命名查詢,該表上創(chuàng)建一個命名查詢,該Customers表之包含擁有房子的客戶。表之
16、包含擁有房子的客戶。n由于這個表包含一個命名計算,所以必需將命名計由于這個表包含一個命名計算,所以必需將命名計算手動添加到查詢中算手動添加到查詢中n首先復(fù)制首先復(fù)制Bedrooms Named Calculation中的代中的代碼碼n其次在其次在DSV中右擊然后選擇中右擊然后選擇“新建命名查詢新建命名查詢3.3 創(chuàng)建和編輯模型創(chuàng)建和編輯模型n3.3.1 構(gòu)造和模型構(gòu)造和模型n發(fā)掘構(gòu)造包含一切列的數(shù)據(jù)類型和內(nèi)容類型的定義,發(fā)掘構(gòu)造包含一切列的數(shù)據(jù)類型和內(nèi)容類型的定義,但沒有包含列的用法定義和運用的算法但沒有包含列的用法定義和運用的算法n發(fā)掘模型包括發(fā)掘算法及其相關(guān)的參數(shù),還有來自發(fā)掘模型包括發(fā)掘
17、算法及其相關(guān)的參數(shù),還有來自發(fā)掘構(gòu)造的列發(fā)掘構(gòu)造的列n有了發(fā)掘構(gòu)造的概念,可以很容易地對同一數(shù)據(jù)集有了發(fā)掘構(gòu)造的概念,可以很容易地對同一數(shù)據(jù)集測試不同的假定測試不同的假定3.3.2 運用數(shù)據(jù)發(fā)掘?qū)в芜\用數(shù)據(jù)發(fā)掘?qū)в蝞運用數(shù)據(jù)發(fā)掘?qū)в闻c運用運用數(shù)據(jù)發(fā)掘?qū)в闻c運用DMX言語創(chuàng)建數(shù)據(jù)發(fā)掘言語創(chuàng)建數(shù)據(jù)發(fā)掘構(gòu)造構(gòu)造/模型所需求的信息是一樣的:選擇算法、選模型所需求的信息是一樣的:選擇算法、選擇數(shù)據(jù)源并指定源表的用法、選擇表中的列并制定擇數(shù)據(jù)源并指定源表的用法、選擇表中的列并制定這些列的用法、對數(shù)據(jù)發(fā)掘模型命名。這些列的用法、對數(shù)據(jù)發(fā)掘模型命名。指定表的類型:事例表或嵌套表指定表的類型:事例表或嵌套表指定
18、列的用法指定列的用法n指定了事例表和嵌套表后,可以確定要包括在發(fā)掘指定了事例表和嵌套表后,可以確定要包括在發(fā)掘構(gòu)造中的表的每一列的運用類型。假設(shè)沒有指定列構(gòu)造中的表的每一列的運用類型。假設(shè)沒有指定列的運用類型,那么發(fā)掘構(gòu)造中將不會包含該列。的運用類型,那么發(fā)掘構(gòu)造中將不會包含該列。n數(shù)據(jù)發(fā)掘列可以為以下四種類型之一:鍵列、輸入數(shù)據(jù)發(fā)掘列可以為以下四種類型之一:鍵列、輸入列、可預(yù)測列或輸入列和可預(yù)測列的組合。列、可預(yù)測列或輸入列和可預(yù)測列的組合。n鍵列包含表中每個行的獨一標(biāo)識符。鍵列包含表中每個行的獨一標(biāo)識符。n某些發(fā)掘模型如順序分析和聚類分析以及時序模某些發(fā)掘模型如順序分析和聚類分析以及時序模
19、型能夠包含多個鍵列。型能夠包含多個鍵列。n預(yù)測列包含要在發(fā)掘模型中預(yù)測的信息。預(yù)測列包含要在發(fā)掘模型中預(yù)測的信息。 指定列的用法指定列的用法n例如,一系列表能夠包含客戶例如,一系列表能夠包含客戶 ID、人口統(tǒng)計信息、人口統(tǒng)計信息以及每位客戶在某個特定商店消費的金額。以及每位客戶在某個特定商店消費的金額。n客戶客戶 ID 可以獨一地標(biāo)識客戶,并且使事例表與嵌可以獨一地標(biāo)識客戶,并且使事例表與嵌套表相關(guān),因此,普通會將客戶套表相關(guān),因此,普通會將客戶 ID 作為鍵列。作為鍵列。n可以運用從人口統(tǒng)計信息中選擇的列作為輸入列,可以運用從人口統(tǒng)計信息中選擇的列作為輸入列,將闡明每位客戶消費金額的列作為預(yù)
20、測列。將闡明每位客戶消費金額的列作為預(yù)測列。n可以生成一個發(fā)掘模型,該模型可將人口統(tǒng)計信息可以生成一個發(fā)掘模型,該模型可將人口統(tǒng)計信息與某位客戶在商店中的消費金額關(guān)聯(lián)起來。可以運與某位客戶在商店中的消費金額關(guān)聯(lián)起來。可以運用此模型作為有針對性的營銷的根底。用此模型作為有針對性的營銷的根底。指定列的用法指定列的用法n數(shù)據(jù)發(fā)掘?qū)в翁峁┝藬?shù)據(jù)發(fā)掘?qū)в翁峁┝恕敖ㄗh功能,在選擇預(yù)測列建議功能,在選擇預(yù)測列時將啟用該功能。時將啟用該功能。n數(shù)據(jù)集包含的列經(jīng)常多于生成發(fā)掘模型時要運用的數(shù)據(jù)集包含的列經(jīng)常多于生成發(fā)掘模型時要運用的列。列?!敖ㄗh功能可以計算出一個數(shù)值分?jǐn)?shù)介于建議功能可以計算出一個數(shù)值分?jǐn)?shù)介于
21、0 到到 1 之間,用于闡明數(shù)據(jù)集中的每一列與預(yù)測之間,用于闡明數(shù)據(jù)集中的每一列與預(yù)測列之間的關(guān)系。列之間的關(guān)系。n根據(jù)此分?jǐn)?shù),該功能可以建議可用作發(fā)掘模型的輸根據(jù)此分?jǐn)?shù),該功能可以建議可用作發(fā)掘模型的輸入的列。入的列。n假設(shè)運用了假設(shè)運用了“建議功能,您就可以運用建議的列,建議功能,您就可以運用建議的列,修正選擇的列以滿足需求,也可以忽略建議。修正選擇的列以滿足需求,也可以忽略建議。 提供相關(guān)列建議提供相關(guān)列建議提供相關(guān)列建議提供相關(guān)列建議n單擊單擊“建議翻開建議翻開“提供相關(guān)列建議對話框,該對提供相關(guān)列建議對話框,該對話框列出與可預(yù)測列關(guān)系最親密的列。話框列出與可預(yù)測列關(guān)系最親密的列。n“
22、提供相關(guān)列建議對話框按照各屬性與可預(yù)測屬提供相關(guān)列建議對話框按照各屬性與可預(yù)測屬性的相關(guān)性對其進展排序。值大于性的相關(guān)性對其進展排序。值大于 0.05 的列將被的列將被自動選中,以包括在模型中。自動選中,以包括在模型中。n在在“指定列的內(nèi)容和數(shù)據(jù)類型頁上,單擊指定列的內(nèi)容和數(shù)據(jù)類型頁上,單擊“檢測。檢測。n某個算法將運轉(zhuǎn)此例如數(shù)字?jǐn)?shù)據(jù),并確定這些數(shù)字某個算法將運轉(zhuǎn)此例如數(shù)字?jǐn)?shù)據(jù),并確定這些數(shù)字列是包含延續(xù)值還是包含離散值。列是包含延續(xù)值還是包含離散值。n在在 SSAS中處置發(fā)掘模型之前,可以為作為建模根中處置發(fā)掘模型之前,可以為作為建模根據(jù)的發(fā)掘構(gòu)造列定義數(shù)據(jù)類型。據(jù)的發(fā)掘構(gòu)造列定義數(shù)據(jù)類型。
23、Analysis Services 支持以下發(fā)掘構(gòu)造列數(shù)據(jù)類型:支持以下發(fā)掘構(gòu)造列數(shù)據(jù)類型:nText、Long、Boolean、Double、Daten導(dǎo)游中的最后一步是對發(fā)掘構(gòu)造和關(guān)聯(lián)的發(fā)掘模型導(dǎo)游中的最后一步是對發(fā)掘構(gòu)造和關(guān)聯(lián)的發(fā)掘模型進展命名。假設(shè)選擇進展命名。假設(shè)選擇“允許鉆取,那么會在模型允許鉆取,那么會在模型中啟用鉆取功能。這樣,您就可以閱讀用于生成模中啟用鉆取功能。這樣,您就可以閱讀用于生成模型的源數(shù)據(jù)。型的源數(shù)據(jù)。 3.3.4 運用數(shù)據(jù)發(fā)掘設(shè)計器運用數(shù)據(jù)發(fā)掘設(shè)計器n有些操作在導(dǎo)游中無法實現(xiàn),需求在數(shù)據(jù)發(fā)掘設(shè)計有些操作在導(dǎo)游中無法實現(xiàn),需求在數(shù)據(jù)發(fā)掘設(shè)計器中進展器中進展n設(shè)置離
24、散化屬性:假設(shè)所選擇的數(shù)據(jù)發(fā)掘算法不支設(shè)置離散化屬性:假設(shè)所選擇的數(shù)據(jù)發(fā)掘算法不支持延續(xù)的屬性,在數(shù)據(jù)發(fā)掘?qū)в沃邢到y(tǒng)會自動將延持延續(xù)的屬性,在數(shù)據(jù)發(fā)掘?qū)в沃邢到y(tǒng)會自動將延續(xù)的列內(nèi)容類型改為續(xù)的列內(nèi)容類型改為Discretized。假設(shè)要指定離。假設(shè)要指定離散的方法和參數(shù),可以在發(fā)掘構(gòu)造的列列表中單擊,散的方法和參數(shù),可以在發(fā)掘構(gòu)造的列列表中單擊,然后在屬性窗口中設(shè)置然后在屬性窗口中設(shè)置DiscretizationMethod和和DiscretiztionBuckets屬性屬性設(shè)置屬性的類型和離散化參數(shù)設(shè)置屬性的類型和離散化參數(shù)多次將同一列添加到發(fā)掘構(gòu)造中多次將同一列添加到發(fā)掘構(gòu)造中n一個發(fā)掘構(gòu)
25、造中可以包含多個模型,能夠要用多種一個發(fā)掘構(gòu)造中可以包含多個模型,能夠要用多種不同的方法來針對某一特殊的列創(chuàng)建多個模型,目不同的方法來針對某一特殊的列創(chuàng)建多個模型,目的是為了查看這一列如何影響預(yù)測的結(jié)果。的是為了查看這一列如何影響預(yù)測的結(jié)果。n例如能夠想采用下面的方式來比較例如能夠想采用下面的方式來比較Age列是如何影列是如何影響預(yù)測結(jié)果的響預(yù)測結(jié)果的n把把Age列作為延續(xù)的值列作為延續(xù)的值n將將Age列離散化為列離散化為3桶、桶、5桶或桶或7桶桶n從從DSV中將列拖到構(gòu)造樹種即可實現(xiàn)多次將同一個中將列拖到構(gòu)造樹種即可實現(xiàn)多次將同一個列添加到模型中列添加到模型中創(chuàng)建屬性層次創(chuàng)建屬性層次n假設(shè)兩
26、個列間存在相關(guān)關(guān)系,在假設(shè)兩個列間存在相關(guān)關(guān)系,在DMX中可以運用中可以運用構(gòu)造構(gòu)造Related to來闡明。來闡明。n在設(shè)計器中可以經(jīng)過設(shè)置列的在設(shè)計器中可以經(jīng)過設(shè)置列的Classified Column屬性實現(xiàn)屬性實現(xiàn)n例如要創(chuàng)建一個例如要創(chuàng)建一個Product Category-Product Name(產(chǎn)品目錄產(chǎn)品目錄-產(chǎn)品稱號產(chǎn)品稱號)層次,可將層次,可將Product Category列的列的Classified Column屬性設(shè)置為屬性設(shè)置為Product Name創(chuàng)建屬性層次創(chuàng)建屬性層次添加一個在另外一個表中查找其值添加一個在另外一個表中查找其值的列的列n假設(shè)數(shù)據(jù)曾經(jīng)是規(guī)范
27、化的假設(shè)數(shù)據(jù)曾經(jīng)是規(guī)范化的(數(shù)據(jù)庫由很多小表構(gòu)成,數(shù)據(jù)庫由很多小表構(gòu)成,相互用主鍵和外鍵銜接相互用主鍵和外鍵銜接),那么想要發(fā)掘的表中包,那么想要發(fā)掘的表中包含了查找表的外鍵而不是希望在模型中出現(xiàn)的真實含了查找表的外鍵而不是希望在模型中出現(xiàn)的真實數(shù)據(jù)列。數(shù)據(jù)列。n在在DSV中右擊有外鍵的表,選擇中右擊有外鍵的表,選擇“顯示相關(guān)表就顯示相關(guān)表就可以添加相應(yīng)的列可以添加相應(yīng)的列添加一個在另外一個表中查找其值添加一個在另外一個表中查找其值的列的列n例如:假設(shè)正在發(fā)掘一個例如:假設(shè)正在發(fā)掘一個Purchases表和另外一個表和另外一個Products表。表。Purchases表有一個表有一個Produ
28、ct ID列,列,Products表的表的Product Name列于列于Purchases表表的的Product ID列相關(guān)聯(lián)列相關(guān)聯(lián)n要創(chuàng)建一個運用要創(chuàng)建一個運用Product Name列的發(fā)掘構(gòu)造,只列的發(fā)掘構(gòu)造,只需右擊需右擊Pruchases表,選擇表,選擇“顯示相關(guān)表就會調(diào)顯示相關(guān)表就會調(diào)入入Products表,然后即可將表,然后即可將Product Name列單列單擊并拖入到構(gòu)造樹中擊并拖入到構(gòu)造樹中運用發(fā)掘模型編輯器運用發(fā)掘模型編輯器n運用發(fā)掘模型編輯器,可以在發(fā)掘構(gòu)造上創(chuàng)建多個運用發(fā)掘模型編輯器,可以在發(fā)掘構(gòu)造上創(chuàng)建多個發(fā)掘模型:發(fā)掘模型:n為每個模型設(shè)置要運用的算法以及算法
29、的參數(shù)為每個模型設(shè)置要運用的算法以及算法的參數(shù)n為每個模型選擇要用到的列以及指定這些列的用法為每個模型選擇要用到的列以及指定這些列的用法n對每一列設(shè)置特定于算法的建模標(biāo)志對每一列設(shè)置特定于算法的建模標(biāo)志發(fā)掘模型編輯器發(fā)掘模型編輯器設(shè)置列的屬性設(shè)置列的屬性n列的屬性:列的屬性:nInput:輸入列:輸入列nPredict:可預(yù)測列,也可作為其他可預(yù)測列的輸:可預(yù)測列,也可作為其他可預(yù)測列的輸入列入列nPredictOnly:僅作為可預(yù)測列,不能作為其他可:僅作為可預(yù)測列,不能作為其他可預(yù)測列的輸入列預(yù)測列的輸入列n忽略:該模型不包含這個指定的列忽略:該模型不包含這個指定的列設(shè)置模型的屬性設(shè)置模型
30、的屬性n選擇列頭,那么有關(guān)模型的屬性就會出如今屬性窗選擇列頭,那么有關(guān)模型的屬性就會出如今屬性窗口口n可以設(shè)置稱號及模型運用的算法,或添加注釋可以設(shè)置稱號及模型運用的算法,或添加注釋創(chuàng)建附加模型創(chuàng)建附加模型n在發(fā)掘模型菜單中選擇新建在發(fā)掘模型菜單中選擇新建創(chuàng)建附加模型創(chuàng)建附加模型3.4 處置處置n在效力器上訓(xùn)練模型的過程稱為處置。處置的過程在效力器上訓(xùn)練模型的過程稱為處置。處置的過程包含讀取源數(shù)據(jù)并作高速緩存,然后訓(xùn)練模型。包含讀取源數(shù)據(jù)并作高速緩存,然后訓(xùn)練模型。n有關(guān)發(fā)掘模型和發(fā)掘構(gòu)造的處置有有關(guān)發(fā)掘模型和發(fā)掘構(gòu)造的處置有3種形狀:經(jīng)過種形狀:經(jīng)過處置的、部分經(jīng)過處置的和沒有經(jīng)過處置的處置
31、的、部分經(jīng)過處置的和沒有經(jīng)過處置的n部分經(jīng)過處置:能夠有一個包含幾個發(fā)掘模型的發(fā)部分經(jīng)過處置:能夠有一個包含幾個發(fā)掘模型的發(fā)掘構(gòu)造,而只想處置其中的一個發(fā)掘模型,這時的掘構(gòu)造,而只想處置其中的一個發(fā)掘模型,這時的發(fā)掘構(gòu)培育是部分經(jīng)過處置的。發(fā)掘構(gòu)培育是部分經(jīng)過處置的。n在發(fā)掘模型菜單下選擇處置,在彈出的處置發(fā)掘構(gòu)在發(fā)掘模型菜單下選擇處置,在彈出的處置發(fā)掘構(gòu)造對話框中可以設(shè)置處置選項造對話框中可以設(shè)置處置選項3.4 處置處置n處置選項:處置選項:n處置全部處置全部n處置默許值處置默許值n不處置:刪除與該對象有關(guān)的一切數(shù)據(jù)不處置:刪除與該對象有關(guān)的一切數(shù)據(jù)n處置構(gòu)造:讀和高速緩存數(shù)據(jù),而不處置發(fā)掘
32、構(gòu)造處置構(gòu)造:讀和高速緩存數(shù)據(jù),而不處置發(fā)掘構(gòu)造包含的模型包含的模型n處置去除構(gòu)造:發(fā)掘構(gòu)造將刪除緩沖的源數(shù)據(jù)而不處置去除構(gòu)造:發(fā)掘構(gòu)造將刪除緩沖的源數(shù)據(jù)而不處置包含的模型處置包含的模型3.5 運用模型運用模型n3.5.1 了解模型查看器了解模型查看器nSSAS的每一個數(shù)據(jù)發(fā)掘算法都有屬于它的查看器。的每一個數(shù)據(jù)發(fā)掘算法都有屬于它的查看器。查看器提供了模型多個方面的信息查看器提供了模型多個方面的信息n提供的視圖包括圖和表提供的視圖包括圖和表n圖帶有相應(yīng)的工具欄可以實現(xiàn)一些操作圖帶有相應(yīng)的工具欄可以實現(xiàn)一些操作n表支持以表支持以Html格式復(fù)制格式復(fù)制3.5.2 運用發(fā)掘準(zhǔn)確性圖表運用發(fā)掘準(zhǔn)確性
33、圖表n驗證數(shù)據(jù)發(fā)掘模型驗證數(shù)據(jù)發(fā)掘模型n驗證是評價發(fā)掘模型對實踐數(shù)據(jù)執(zhí)行情況的過程。驗證是評價發(fā)掘模型對實踐數(shù)據(jù)執(zhí)行情況的過程。在將發(fā)掘模型部署到消費環(huán)境之前,務(wù)必經(jīng)過了解在將發(fā)掘模型部署到消費環(huán)境之前,務(wù)必經(jīng)過了解其質(zhì)量和特征來對其進展驗證。其質(zhì)量和特征來對其進展驗證。n可以運用多種方法評價數(shù)據(jù)發(fā)掘模型的質(zhì)量和特征可以運用多種方法評價數(shù)據(jù)發(fā)掘模型的質(zhì)量和特征n運用統(tǒng)計信息有效性的各種度量值來確定數(shù)據(jù)或模運用統(tǒng)計信息有效性的各種度量值來確定數(shù)據(jù)或模型中能否存在問題型中能否存在問題n可將數(shù)據(jù)劃分定型集和測試集,以測試預(yù)測的準(zhǔn)確可將數(shù)據(jù)劃分定型集和測試集,以測試預(yù)測的準(zhǔn)確性性n也可以請商業(yè)專家查看
34、數(shù)據(jù)發(fā)掘模型的結(jié)果,以確也可以請商業(yè)專家查看數(shù)據(jù)發(fā)掘模型的結(jié)果,以確定發(fā)現(xiàn)的方式在目的商業(yè)方案中能否有意義。定發(fā)現(xiàn)的方式在目的商業(yè)方案中能否有意義。3.5.2 運用發(fā)掘準(zhǔn)確性圖表運用發(fā)掘準(zhǔn)確性圖表n度量數(shù)據(jù)發(fā)掘模型的條件度量數(shù)據(jù)發(fā)掘模型的條件 n數(shù)據(jù)發(fā)掘的度量通常分為以下三類:數(shù)據(jù)發(fā)掘的度量通常分為以下三類:n準(zhǔn)確性、可靠性和有用性準(zhǔn)確性、可靠性和有用性n“準(zhǔn)確性是模型與所提供數(shù)據(jù)中的屬性的結(jié)果相準(zhǔn)確性是模型與所提供數(shù)據(jù)中的屬性的結(jié)果相關(guān)聯(lián)程度的度量值。關(guān)聯(lián)程度的度量值。n準(zhǔn)確性有各種度量值,但準(zhǔn)確性的一切度量值都依準(zhǔn)確性有各種度量值,但準(zhǔn)確性的一切度量值都依賴于所運用的數(shù)據(jù)。賴于所運用的數(shù)據(jù)
35、。3.5.2 運用發(fā)掘準(zhǔn)確性圖表運用發(fā)掘準(zhǔn)確性圖表n準(zhǔn)確性、可靠性和有用性準(zhǔn)確性、可靠性和有用性n“準(zhǔn)確性準(zhǔn)確性n現(xiàn)實上,值能夠短少或近似,數(shù)據(jù)能夠已被多個進現(xiàn)實上,值能夠短少或近似,數(shù)據(jù)能夠已被多個進程更改。程更改。n在探求和開發(fā)階段,通常允許數(shù)據(jù)中存在一定數(shù)量在探求和開發(fā)階段,通常允許數(shù)據(jù)中存在一定數(shù)量的錯誤。的錯誤。n例如,基于過去的銷售額來預(yù)測特定商店的銷售額例如,基于過去的銷售額來預(yù)測特定商店的銷售額的模型能夠非常相關(guān),并且非常準(zhǔn)確,即使該商店的模型能夠非常相關(guān),并且非常準(zhǔn)確,即使該商店不斷運用錯誤的會計方法。所以,準(zhǔn)確性的度量值不斷運用錯誤的會計方法。所以,準(zhǔn)確性的度量值必需經(jīng)過評
36、價可靠性來平衡。必需經(jīng)過評價可靠性來平衡。3.5.2 運用發(fā)掘準(zhǔn)確性圖表運用發(fā)掘準(zhǔn)確性圖表n準(zhǔn)確性、可靠性和有用性。準(zhǔn)確性、可靠性和有用性。n“可靠性評價數(shù)據(jù)發(fā)掘模型處置不同數(shù)據(jù)集的方可靠性評價數(shù)據(jù)發(fā)掘模型處置不同數(shù)據(jù)集的方法法n假設(shè)無論提供哪些測試數(shù)據(jù),數(shù)據(jù)發(fā)掘模型都生成假設(shè)無論提供哪些測試數(shù)據(jù),數(shù)據(jù)發(fā)掘模型都生成一樣類型的預(yù)測,或者發(fā)現(xiàn)一樣常規(guī)類型的方式,一樣類型的預(yù)測,或者發(fā)現(xiàn)一樣常規(guī)類型的方式,那么該數(shù)據(jù)發(fā)掘模型是可靠的。那么該數(shù)據(jù)發(fā)掘模型是可靠的。n例如,為運用錯誤解計方法的商店生成預(yù)測的模型例如,為運用錯誤解計方法的商店生成預(yù)測的模型將不適用于其他商店,因此該模型是不可靠的將不適用
37、于其他商店,因此該模型是不可靠的3.5.2 運用發(fā)掘準(zhǔn)確性圖表運用發(fā)掘準(zhǔn)確性圖表n準(zhǔn)確性、可靠性和有用性。準(zhǔn)確性、可靠性和有用性。n“有用性包括闡明模型能否提供了有用信息的各有用性包括闡明模型能否提供了有用信息的各種目的。種目的。n如將商店位置與銷售額相關(guān)聯(lián)的數(shù)據(jù)發(fā)掘模型能夠如將商店位置與銷售額相關(guān)聯(lián)的數(shù)據(jù)發(fā)掘模型能夠既是準(zhǔn)確的,也是可靠的,但能夠是無用的,由于既是準(zhǔn)確的,也是可靠的,但能夠是無用的,由于不能經(jīng)過在同一位置添加更多商店來推行該結(jié)果。不能經(jīng)過在同一位置添加更多商店來推行該結(jié)果。并且它沒有回答為什么某些位置銷售額較高這一根并且它沒有回答為什么某些位置銷售額較高這一根本商業(yè)問題。本商
38、業(yè)問題。3.5.2 運用發(fā)掘準(zhǔn)確性圖表運用發(fā)掘準(zhǔn)確性圖表nSQL Server 支持多種驗證方法。支持多種驗證方法。n將數(shù)據(jù)分區(qū)為定型集和測試集將數(shù)據(jù)分區(qū)為定型集和測試集n將數(shù)據(jù)分區(qū)為定型集和測試集是用于預(yù)備要評價的將數(shù)據(jù)分區(qū)為定型集和測試集是用于預(yù)備要評價的數(shù)據(jù)的一種既定技術(shù)。數(shù)據(jù)的一種既定技術(shù)。n定型數(shù)據(jù)集中的某些數(shù)據(jù)保管用于進展測試,其他定型數(shù)據(jù)集中的某些數(shù)據(jù)保管用于進展測試,其他數(shù)據(jù)用于進展定型。數(shù)據(jù)用于進展定型。n模型完成后將用于針對測試集進展預(yù)測。模型完成后將用于針對測試集進展預(yù)測。n由于定型集中的數(shù)據(jù)是從用于進展定型的一樣數(shù)據(jù)由于定型集中的數(shù)據(jù)是從用于進展定型的一樣數(shù)據(jù)中隨機選擇
39、的,因此從測試得出的準(zhǔn)確性目的能夠中隨機選擇的,因此從測試得出的準(zhǔn)確性目的能夠受數(shù)據(jù)差別的影響較小,因此可以更好地反映模型受數(shù)據(jù)差別的影響較小,因此可以更好地反映模型的特征。的特征。3.5.2 運用發(fā)掘準(zhǔn)確性圖表運用發(fā)掘準(zhǔn)確性圖表n發(fā)掘模型的交叉驗證發(fā)掘模型的交叉驗證n經(jīng)過交叉驗證,可以將一個數(shù)據(jù)集分區(qū)為許多更小經(jīng)過交叉驗證,可以將一個數(shù)據(jù)集分區(qū)為許多更小的交叉部分,并可以對交叉部分創(chuàng)建多個模型以測的交叉部分,并可以對交叉部分創(chuàng)建多個模型以測試整個數(shù)據(jù)集的有效性。然后,試整個數(shù)據(jù)集的有效性。然后,Analysis Services 將為每個分區(qū)生成詳細的準(zhǔn)確性目的。將為每個分區(qū)生成詳細的準(zhǔn)確性
40、目的。n運用這些信息,可以提高各個模型的質(zhì)量,也可以運用這些信息,可以提高各個模型的質(zhì)量,也可以確定特定數(shù)據(jù)集的最正確模型。確定特定數(shù)據(jù)集的最正確模型。十折交叉驗證十折交叉驗證n英文名叫做英文名叫做10-fold cross-validation,用來測試,用來測試算法準(zhǔn)確性,是常用的測試方法。算法準(zhǔn)確性,是常用的測試方法。n將數(shù)據(jù)集分成非常,輪番將其中將數(shù)據(jù)集分成非常,輪番將其中9份作為訓(xùn)練數(shù)據(jù),份作為訓(xùn)練數(shù)據(jù),1份作為測試數(shù)據(jù),進展實驗。份作為測試數(shù)據(jù),進展實驗。n每次實驗都會得出相應(yīng)的正確率或過失率。每次實驗都會得出相應(yīng)的正確率或過失率。10次的結(jié)果的正確率或過失率的平均值作為對算次的結(jié)
41、果的正確率或過失率的平均值作為對算法精度的估計法精度的估計n普通還需求進展多次普通還需求進展多次10折交叉驗證例如折交叉驗證例如10次次10折交叉驗證,再求其均值,作為對算法準(zhǔn)確性的折交叉驗證,再求其均值,作為對算法準(zhǔn)確性的估計。估計。十折交叉驗證十折交叉驗證n之所以選擇將數(shù)據(jù)集分為之所以選擇將數(shù)據(jù)集分為10份,是由于經(jīng)過利用大份,是由于經(jīng)過利用大量數(shù)據(jù)集、運用不同窗習(xí)技術(shù)進展的大量實驗,闡量數(shù)據(jù)集、運用不同窗習(xí)技術(shù)進展的大量實驗,闡明明10折是獲得最好誤差估計的恰中選擇,而且也有折是獲得最好誤差估計的恰中選擇,而且也有一些實際根據(jù)可以證明這一點。一些實際根據(jù)可以證明這一點。n但這并非最終結(jié)論
42、,爭議依然存在。而且似乎但這并非最終結(jié)論,爭議依然存在。而且似乎5折折或者或者20折與折與10折所得出的結(jié)果也相差無幾折所得出的結(jié)果也相差無幾3.5.2 運用發(fā)掘準(zhǔn)確性圖表運用發(fā)掘準(zhǔn)確性圖表nSSAS提供了繪制預(yù)測準(zhǔn)確性圖表,針對新數(shù)據(jù)或提供了繪制預(yù)測準(zhǔn)確性圖表,針對新數(shù)據(jù)或現(xiàn)有數(shù)據(jù)測試模型,或者在圖表和報表中比較多個現(xiàn)有數(shù)據(jù)測試模型,或者在圖表和報表中比較多個模型的工具。模型的工具。n“提升圖是將運用數(shù)據(jù)發(fā)掘模型獲得的改良與隨提升圖是將運用數(shù)據(jù)發(fā)掘模型獲得的改良與隨機推測進展對比時,可視化所獲得改良的方法。機推測進展對比時,可視化所獲得改良的方法。n也可以創(chuàng)建將財務(wù)收益或本錢與運用發(fā)掘模型相
43、關(guān)也可以創(chuàng)建將財務(wù)收益或本錢與運用發(fā)掘模型相關(guān)聯(lián)的聯(lián)的“利潤圖,以及為回歸模型創(chuàng)建利潤圖,以及為回歸模型創(chuàng)建“散點圖。散點圖。n“分類矩陣是在表中對準(zhǔn)確和不準(zhǔn)確的推測進展分類矩陣是在表中對準(zhǔn)確和不準(zhǔn)確的推測進展排序的方法,以便可以快速方便地丈量模型預(yù)測目排序的方法,以便可以快速方便地丈量模型預(yù)測目的值的準(zhǔn)確程度。的值的準(zhǔn)確程度。提升圖提升圖n提升圖是經(jīng)過繪制針對測試數(shù)據(jù)集進展的預(yù)測查詢提升圖是經(jīng)過繪制針對測試數(shù)據(jù)集進展的預(yù)測查詢的結(jié)果根據(jù)測試數(shù)據(jù)集中存在的可預(yù)測列的知值的結(jié)果根據(jù)測試數(shù)據(jù)集中存在的可預(yù)測列的知值而創(chuàng)建的。而創(chuàng)建的。n在數(shù)據(jù)發(fā)掘設(shè)計器的在數(shù)據(jù)發(fā)掘設(shè)計器的“發(fā)掘準(zhǔn)確性圖表選項卡的發(fā)
44、掘準(zhǔn)確性圖表選項卡的“提升圖選項卡中,可以查看兩種類型的圖表:提升圖選項卡中,可以查看兩種類型的圖表:n提升圖:比較每個模型預(yù)測的準(zhǔn)確性提升圖:比較每個模型預(yù)測的準(zhǔn)確性n利潤圖:顯示與運用每個模型相關(guān)聯(lián)的實際上的利利潤圖:顯示與運用每個模型相關(guān)聯(lián)的實際上的利潤增長。潤增長。提升圖提升圖n運用運用“圖表類型列表選擇所需的圖表類型。圖表類型列表選擇所需的圖表類型。 在從在從該列表中選擇該列表中選擇“利潤圖時,會自動翻開利潤圖時,會自動翻開“利潤圖設(shè)利潤圖設(shè)置對話框。置對話框。 單擊單擊“設(shè)置時也會翻開此對話設(shè)置時也會翻開此對話框???。 運用此對話框,可以設(shè)置定義利潤圖的參運用此對話框,可以設(shè)置定義
45、利潤圖的參數(shù)。數(shù)。 n在提升圖中只能對包含可預(yù)測離散屬性的發(fā)掘模型在提升圖中只能對包含可預(yù)測離散屬性的發(fā)掘模型進展比較。進展比較。n “發(fā)掘準(zhǔn)確性圖表選項卡不能用于時序模型或具發(fā)掘準(zhǔn)確性圖表選項卡不能用于時序模型或具有可預(yù)測延續(xù)屬性的模型。有可預(yù)測延續(xù)屬性的模型。提升圖類型提升圖類型n“提升圖選項卡顯示發(fā)掘模型所引起的提升圖選項卡顯示發(fā)掘模型所引起的“提升變提升變化的圖形表示方式。化的圖形表示方式。 n例如,請思索下面的事例,即例如,請思索下面的事例,即 Adventure Works Cycles 的市場部要搞一個發(fā)送郵件的活動。的市場部要搞一個發(fā)送郵件的活動。 n從以往的活動中,他們推算應(yīng)
46、有從以往的活動中,他們推算應(yīng)有 10% 的回答率。的回答率。 n在數(shù)據(jù)庫的一個表中,存儲了一個包含在數(shù)據(jù)庫的一個表中,存儲了一個包含 10,000 名名潛在客戶的列表。潛在客戶的列表。 n按照正?;卮鹇视嬎愎烙媽⒂邪凑照;卮鹇视嬎愎烙媽⒂?1,000 名客戶回答名客戶回答提升圖類型提升圖類型n此外,還思索到該方案的預(yù)算低于向數(shù)據(jù)庫中一切此外,還思索到該方案的預(yù)算低于向數(shù)據(jù)庫中一切 10,000 名客戶發(fā)送郵件所需的費用。名客戶發(fā)送郵件所需的費用。 根據(jù)預(yù)算,根據(jù)預(yù)算,他們只能承當(dāng)向他們只能承當(dāng)向 5,000 名客戶發(fā)送郵件廣告的費名客戶發(fā)送郵件廣告的費用。用。 市場部有以下兩種選擇:市場部有
47、以下兩種選擇: n隨機選擇隨機選擇 5,000 名目的客戶名目的客戶n運用發(fā)掘模型確定最有能夠回答的運用發(fā)掘模型確定最有能夠回答的 5,000 名目的名目的客戶客戶提升圖類型提升圖類型n假設(shè)該公司隨機選擇假設(shè)該公司隨機選擇 5,000 名客戶,那么在估計名客戶,那么在估計給予積極回答的給予積極回答的 1,000 名客戶中,只能有名客戶中,只能有 500 名名客戶做出回答,由于正常情況下只需客戶做出回答,由于正常情況下只需 10% 的客戶的客戶回答?;卮?。 這正是提升圖中的隨機線所表示的情況。這正是提升圖中的隨機線所表示的情況。 n但假設(shè)市場部運用發(fā)掘模型來確定發(fā)送郵件的目的,但假設(shè)市場部運用發(fā)
48、掘模型來確定發(fā)送郵件的目的,那么估計可以獲得更高的回答率,由于他們鎖定了那么估計可以獲得更高的回答率,由于他們鎖定了最有能夠回答的客戶。最有能夠回答的客戶。提升圖類型提升圖類型n假設(shè)該模型準(zhǔn)確無誤,那么意味著它可以構(gòu)成完全假設(shè)該模型準(zhǔn)確無誤,那么意味著它可以構(gòu)成完全準(zhǔn)確的預(yù)測,即該公司經(jīng)過向該模型引薦的準(zhǔn)確的預(yù)測,即該公司經(jīng)過向該模型引薦的 1,000 名潛在客戶發(fā)送電子郵件廣告,估計可以得到全部名潛在客戶發(fā)送電子郵件廣告,估計可以得到全部 1,000 個回答個回答( 這正是提升圖中的理想線所表示的這正是提升圖中的理想線所表示的情況情況)n現(xiàn)實是發(fā)掘模型最能夠位于這兩種極限情況之間,現(xiàn)實是發(fā)掘
49、模型最能夠位于這兩種極限情況之間,即介于隨機推測模型和理想或準(zhǔn)確無誤的預(yù)測模型即介于隨機推測模型和理想或準(zhǔn)確無誤的預(yù)測模型之間。之間。 與隨機推測相比,回答率的任何提高均被與隨機推測相比,回答率的任何提高均被 視為提升。視為提升。n可以創(chuàng)建兩種類型的圖表,在一種圖表中可以指定可以創(chuàng)建兩種類型的圖表,在一種圖表中可以指定可預(yù)測列的形狀,另一種那么不指定該形狀??深A(yù)測列的形狀,另一種那么不指定該形狀。n該圖對發(fā)掘模型的結(jié)果顯示一條線,同時還顯示其該圖對發(fā)掘模型的結(jié)果顯示一條線,同時還顯示其他兩條線:一條線表示理想的模型會產(chǎn)生的結(jié)果,他兩條線:一條線表示理想的模型會產(chǎn)生的結(jié)果,并帶有永遠不會錯誤的完美預(yù)測,一條線表示隨機并帶有永遠不會錯誤的完美預(yù)測,一條線表示隨機猜測的結(jié)果。模型的結(jié)果將位于理想模型和隨機推猜測的結(jié)果。模型的結(jié)果將位于理想模型和隨機推測之間的某個位置。對隨機行的任何改良稱為測之間的某個位置。對隨機行的任何改良稱為“提提升
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 成人高考中國法制史與法律文化考核試卷
- 投影設(shè)備在船舶導(dǎo)航與海圖顯示的應(yīng)用考核試卷
- 第20課《談創(chuàng)造性思維》教學(xué)設(shè)計 2024-2025學(xué)年統(tǒng)編版語文九年級上冊
- 課程思政與價值觀教育計劃
- 第22課《智取生辰綱》教學(xué)設(shè)計 20242025學(xué)年統(tǒng)編版語文九年級上冊
- 《圓的周長》第2課時(教學(xué)設(shè)計)-2024-2025學(xué)年六年級上冊數(shù)學(xué)西師大版
- 體育賽事安保工作的成功經(jīng)驗總結(jié)計劃
- 《化學(xué)生物學(xué)綜合實驗》課程教學(xué)大綱
- 2024-2025學(xué)年八年級上學(xué)期期末數(shù)學(xué)真題匯編《二元一次方程》含答案解析
- 培養(yǎng)團隊合作意識的幼兒園教研計劃
- 油氣田開發(fā)專業(yè)危害因素辨識與風(fēng)險防控
- 2025年浙江省衢州市常山糧食收儲有限責(zé)任公司招聘筆試參考題庫附帶答案詳解
- 假肢安裝合同范本
- 《重大基礎(chǔ)設(shè)施項目涉及風(fēng)景名勝區(qū)選址論證報告編制技術(shù)規(guī)范》編制說明
- 2025年中國中煤能源股份有限公司招聘筆試參考題庫含答案解析
- 2024年蘇州健雄職業(yè)技術(shù)學(xué)院高職單招語文歷年參考題庫含答案解析
- 2024年大慶醫(yī)學(xué)高等??茖W(xué)校高職單招語文歷年參考題庫含答案解析
- 四川省綿陽市2025屆高三上學(xué)期第二次診斷性考試語文試題(含答案)
- 2025年1月 浙江首考英語試卷
- 2024年07月威海市商業(yè)銀行校園招考大學(xué)生報到筆試歷年參考題庫附帶答案詳解
- 房屋修繕工程難點、重點分析及應(yīng)對措施
評論
0/150
提交評論