SAS軟件中insight模塊_第1頁
SAS軟件中insight模塊_第2頁
SAS軟件中insight模塊_第3頁
SAS軟件中insight模塊_第4頁
SAS軟件中insight模塊_第5頁
已閱讀5頁,還剩45頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、 啟動SAS/INSIGHT的方法: 從菜單啟動 從命令條啟動 這時SAS/INSIGHT必須先選擇一個要分析、觀察的數(shù)據(jù)集。如果要生成新數(shù)據(jù)集,按New按鈕,如果要打開已有數(shù)據(jù)集,按Open按鈕。圖 4是SAS/INSIGHT運(yùn)行時的樣子。 數(shù)據(jù)窗口 : SAS/INSIGHT提供了一個類似于電子表格的數(shù)據(jù)窗口來管理數(shù)據(jù)集。圖 5為顯示了數(shù)據(jù)集SASUSER.CLASS的數(shù)據(jù)窗口: 此數(shù)據(jù)集是一個班19個學(xué)生的一些情況,包括姓名、性別、年齡、身高、體重。我們看到,數(shù)據(jù)窗口標(biāo)題行顯示了打開的數(shù)據(jù)集的名字,標(biāo)題行下左上角有一個向右的小三角,這是數(shù)據(jù)窗口的菜單,見圖 6 三角下方的19是觀測行數(shù),

2、右方的5 是變量個數(shù)。窗口內(nèi)每行最左邊的方塊是觀測的繪圖標(biāo)記,用于在圖形中標(biāo)記觀測;然后是觀測序號;再往右是各變量的值。數(shù)據(jù)窗口中的各變量用作列標(biāo)題,如圖 5中的NAME、SEX、AGE 、HEIGHT、WEIGHT就是數(shù)據(jù)集SASUSER.CLASS中的五個變量的名字。 在每一個變量名的上面有兩個標(biāo)簽,右邊一個代表變量的量測水平,分為區(qū)間變量(Int)和名義變量(Nom)。 區(qū)間變量是取連續(xù)值的變量,只能為數(shù)值;名義變量是取離散值的變量,一般為字符型,也可以取數(shù)值。變量名上面左邊的標(biāo)簽代表變量在分析中的缺省用途,比如NAME上面的Label表示此變量的值(學(xué)生姓名)在繪圖中用來標(biāo)記觀測,SE

3、X上面的Group表示此變量(性別)用來分組,等等 數(shù)據(jù)窗口可以用來建立新數(shù)據(jù)集。在SAS/INSIGHT內(nèi)用“File | New”菜單或在啟動INSIGHT 的窗口(圖 3)按“New”按鈕,將出現(xiàn)一個空的數(shù)據(jù)窗口。這時,可以直接向第一行輸入數(shù)據(jù),比如要輸入 1.1.3 中的C9501數(shù)據(jù)集,就可以在第一行的前四列中分別輸入李明、男、92 、98,這時各列自動取變量名為A、B、C、D,而且量測水平自動定為前兩個字符型是名義變量(Nom),后兩個數(shù)值型是區(qū)間變量(Int)。為了修改變量名和變量的用途,從數(shù)據(jù)窗口的菜單(圖 6)選Define Variables,出現(xiàn)圖 7的定義變量窗口: 在

4、這里可以修改變量名,給變量加標(biāo)簽(Label),可以選擇變量的量測水平,可以規(guī)定變量的用途。變量的標(biāo)簽是對變量的一個可以長達(dá)40個字符的描述,可以用于以后的輸出,可以用漢字。 定好變量名等屬性后就可以繼續(xù)輸入其它數(shù)據(jù)行,每輸入一行后回車,直至把全部數(shù)據(jù)輸完。為了使回車時光標(biāo)從前一行尾部進(jìn)到下一行第一格,可以從數(shù)據(jù)窗口菜單(圖 6)中選 “Data Options”,在彈出的對話框中(圖 9) 選擇回車的方向(Direction of Enter)為左下(Down and Left)。為了保存輸入的數(shù)據(jù)集,選“File | Save | Data”菜單,出現(xiàn)圖 8 那樣的輸入數(shù)據(jù)集的窗口: 可以

5、選擇數(shù)據(jù)集放在哪一個數(shù)據(jù)庫,可以輸入一個數(shù)據(jù)集名,把這里的A改成c9501,按OK鈕就可以保存數(shù)據(jù)集。對于比較小的數(shù)據(jù)集(幾個、十幾個變量,幾十個觀測),用SAS/INSIGHT的數(shù)據(jù)窗口可以迅速而直觀地輸入。對于更大量的數(shù)據(jù),一般從其它格式轉(zhuǎn)換而得。 在數(shù)據(jù)窗口中如果需要修改某一個值,只要直接用鼠標(biāo)點到其單元格修改,然后把輸入光標(biāo)離開其所在行就實現(xiàn)了修改。在單元格之間移動可以用鼠標(biāo)單擊、制表鍵、回車、上下光標(biāo)鍵等方法。要保存所作的修改還需要用“File | Save | Data”菜單。 當(dāng)數(shù)據(jù)窗口中變量較多時,可以用滾動條滾動窗口內(nèi)容來查看。如果某個變量比較重要,可以考慮把它放到第一列的位

6、置,這只要先單擊該變量的名字選中它,然后在圖 6的菜單中選Move to First。要把某列移到最后,選中它后用Move to Last菜單。 選中一列只要單擊其變量名。如果要選中多個列,在選中一個后按住Ctrl鍵單擊其它的名字可以添加選中其它變量。選中一個變量后按住Shift單擊另一個變量名可以選中這兩個變量及它們之間的所有變量。選中的多個列也可以用Move to First和Move to Last移動。 要選中一個觀測(行),只要單擊其觀測號(行號)。選多個觀測可以用Ctrl單擊或Shift 單擊的方法。選中的觀測也可以用Move to First和Move to Last移動到最前或

7、最后。 還可以選中某些列同時選中某些行。只要在后續(xù)的選中操作時用添加選中(Shift單擊或Ctrl 單擊)即可。用鼠標(biāo)在數(shù)據(jù)窗口數(shù)值顯示部分拖出一個方框也可以選定一部分?jǐn)?shù)值。 選定了列或者行以后,用“Edit | Delete”菜單可以刪除選定的列或行。 要取消所有選中,只要單擊某一單元格而不是行、列標(biāo)題即可。 下面簡單介紹一下數(shù)據(jù)窗口菜單(圖 6)中各命令: Find Next 在選定了若干個觀測的情況下,把下一個被選定的觀測顯示在窗口第一行的位置。 Move to First 把選定的行或列移到最前。 Move to Last 把選定的行或列移到最后。 New Observations 用

8、于快速添加若干個空數(shù)據(jù)行,彈出一個對話框要求輸入添加的觀測數(shù),缺省是100個。添加的空行中字符型數(shù)據(jù)先填空值,數(shù)值型數(shù)據(jù)先填缺失值(用單獨的小數(shù)點代表)。 New Variables 用于快速添加若干個新變量。 Sort 在選定了一列的情況下,把數(shù)據(jù)集按此列從小到大排序;在選定了多列的情況下,按選定的變量次序按這些變量綜合排序,比如在SASUSER.CLASS窗口中先選定SEX 然后用Ctrl單擊附加選定HEIGHT,然后排序,這樣的結(jié)果是把數(shù)據(jù)集先按女、男生排序然后在女生內(nèi)部和男生內(nèi)部分別按身高從小到大排序。如果沒有選定任何列,則彈出一個菜單,詢問按哪些變量排序,比如說對SASUSER.CL

9、ASS數(shù)據(jù),可以先點SEX,然后單擊Y按鈕,把性別加入了排序變量中,再選HEIGHT,單擊Y按鈕,把身高作為第二排序變量,再單擊排序變量中的HEIGHT,單擊Asc/Des按鈕(這是要求對身高值要由高到低排序),按OK后數(shù)據(jù)將按性別分組,然后女生、男生內(nèi)部分別按身高由高到低排列。 Define Variables 設(shè)定變量的名字、標(biāo)簽、量測水平、缺省分析用途等,見圖 7??梢栽谏尚聰?shù)據(jù)集時定義變量,也可以對已有數(shù)據(jù)集的變量屬性進(jìn)行修改。 Fill Values 用于自動生成一個等差數(shù)列變量。先選定一個數(shù)值型變量,然后用此命令,將彈出一個對話框要求輸入起始值(Value)和增量(Increme

10、nt),比如起始值填100 ,增量填50,則此變量的在各觀測中的值分別填入為100,150,200,。 Extract 這是一個很強(qiáng)的功能,它可以把選定的部分行、部分列或者部分行列取出到另一個窗口。比如,在SASUSER.CLASS中先選定所有女生的觀測,再用添加選擇(Shift 或Ctrl單擊)的辦法選定NAME和HEIGHT變量,然后用此命令,可以打開一個SASUSER.CLASS1 數(shù)據(jù)窗口,此數(shù)據(jù)窗口中只有姓名和身高兩列和女生的觀測行??梢杂弥鞑藛沃械摹癋ile | Save | Data ”把此新數(shù)據(jù)集保存為WORK.CLASS1(盡量不用永久數(shù)據(jù)集存放練習(xí)用的數(shù)據(jù)集)。這樣可以由已

11、有數(shù)據(jù)集挑選部分列、部分行組成新數(shù)據(jù)集。 1 直方圖:步驟,改變圖形大小,保存圖形, 設(shè)置菜單 2 盒形圖: 步驟,解釋,加菱形,選定觀測,分 組盒形圖; 3 馬賽克圖:畫法(單個變量,多個變量) 1 曲線圖:單個Y變量,多個Y變量,顯示記 錄,改標(biāo)簽; 2 散點圖:畫法,選觀測值,改標(biāo)簽,刷亮; 3 散點圖矩陣:畫法,選中觀察值 SAS/INSIGHT對三維數(shù)據(jù)可以作稱為旋轉(zhuǎn)圖的三維散點圖。比如,要對SASUSER.CLASS 中的學(xué)生年齡、身高、體重作三維散點圖,在數(shù)據(jù)窗口依次選定AGE、HEIGHT、WEIGHT,然后啟動菜單“Analyze | Rotating Plot”,可以生成一

12、個三維散點圖。圖 21是經(jīng)過旋轉(zhuǎn)后的圖形。 這種三維散點圖之所以稱為旋轉(zhuǎn)圖,是因為坐標(biāo)系可以在三維空間繞原點任意旋轉(zhuǎn)。圖形的左側(cè)有一個小工具欄,其中有向上、下、左、右、逆時針、順時針旋轉(zhuǎn)的圖標(biāo),再往下有一個滾動條,用它來規(guī)定自動旋轉(zhuǎn)的速度。左下角是圖形的菜單(向右的三角形)。 為了旋轉(zhuǎn)坐標(biāo)系,單擊左側(cè)的旋轉(zhuǎn)方向圖標(biāo)。按住旋轉(zhuǎn)圖標(biāo)可以連續(xù)旋轉(zhuǎn)。按住Shift或Ctrl 再旋轉(zhuǎn)可以實現(xiàn)自動旋轉(zhuǎn)。當(dāng)鼠標(biāo)光標(biāo)移到圖形的四個角時光標(biāo)形狀變成了手的形狀,單擊可以旋轉(zhuǎn),拖動可以連續(xù)旋轉(zhuǎn),拖動時“拋出”可以自動旋轉(zhuǎn)。自動旋轉(zhuǎn)中可以隨時拖動圖形以改變旋轉(zhuǎn)方向。旋轉(zhuǎn)圖的菜單(圖 22)中,Ticks用來調(diào)整坐標(biāo)軸

13、刻度,Axes可以選坐標(biāo)軸以數(shù)據(jù)中心點為原點、以左端點為原點、不畫坐標(biāo)軸。Observations指定畫出所有觀測,如果沒有選中此項則只畫被選中的觀測。Rays從原點向每個散點畫射線。Cube在散點四周畫一個長方體盒子。Depth可以使離視點近的點畫得較大,離得遠(yuǎn)的點畫得較小。Fast Draw指定用另一種較快的繪圖方法繪圖。Markers Sizes選擇散點的大小。 SAS/INSIGHT提供了很強(qiáng)的調(diào)整繪制的圖形的功能。比如,調(diào)整坐標(biāo)軸的畫法,點的大小、符號、顏色,隱藏某些觀測,等等。 給不同觀測使用不同的符號和顏色畫點有助于迅速區(qū)分不同類觀測的特點。 比如,SASUSER.IRIS 數(shù)據(jù)

14、集中包含了Fisher著名的Iris數(shù)據(jù),其中有三種不同的鳶尾屬植物的花瓣、花萼長、寬的測量數(shù)據(jù),希望從這些測量數(shù)據(jù)找出區(qū)分這三種植物的指標(biāo)。為了直觀看到不同植物的測量數(shù)據(jù)的特征,最好用不同顏色畫每一種植物的散點。打開數(shù)據(jù)集后,選定分類變量SPECIES ,調(diào)用“Analyse / Box Plot / Mosaic Plot”菜單來作其馬賽克圖,可以看到此變量的三個值為Virginica、Versicolor、Setosa。用“Edit | Windows | Tools”菜單可以打開一個工具窗口,如圖 23。這個窗口可以改變觀測符號的顏色、符號,連線的線型、線寬,可以放大圖形局部。 在打開

15、的馬賽克圖中先選定Virginica,這時所有類型Virginica的觀測被選中,按一下工具窗口中的紅色,就給所有這些觀測規(guī)定了繪圖符號為紅色。類似指定Virsicolor 為綠色,Setosa為藍(lán)色。作PETALWID(花瓣寬)對PETALLEN(花瓣長)的散點圖,可以作出三種不同植物用不同顏色繪點的散點圖,見圖 24。 利用一個變量的不同值來確定觀測繪點的顏色還可以自動進(jìn)行,方法是先選定該變量(如SPECIES ),然后單擊工具窗口的漸變顏色棒,就可以為SPECIES的每一不同值分配一種不同顏色。這一方法不僅適用于SPECIES這樣的名義變量,也適用于數(shù)值型變量。顏色棒的顏色可以調(diào)整,比如

16、要把顏色棒變?yōu)橛杉t到藍(lán),只要把紅色方塊拖到顏色棒左端,把藍(lán)色方塊拖到顏色棒右端。 為了改變繪點符號的大小,調(diào)用圖形菜單(圖形邊角上的向右三角符號)中的Marker Sizes 菜單可以選擇一個合適的符號大小。 利用一個分類變量來決定不同的繪點符號除了上述的對每一類觀測分別選定,然后指定繪點符號的辦法,還可以選定這一分類變量,然后單擊工具欄中繪點符號下面的多種符號的長棒形圖標(biāo),可以自動為每一類分配一個繪點符號。 不同類觀測用不同的顏色和符號來繪點是一種強(qiáng)有力的數(shù)據(jù)探索手段,恰當(dāng)使用可以直觀地發(fā)現(xiàn)不同類型觀測的區(qū)別。 SAS/INSIGHT提供了很強(qiáng)的一維分布研究功能。對連續(xù)型變量,除了可以畫直方

17、圖、盒形圖外,還可以作各種統(tǒng)計表,比如矩、分位數(shù)表,可以在直方圖上畫擬合密度曲線,可以檢驗分布是否來自正態(tài)、對數(shù)正態(tài)、指數(shù)、威布爾分布,等等。對離散型變量,可以畫馬賽克圖、條形圖、頻數(shù)表。 為了研究SASUSER.CLASS中身高的分布,在未選中變量的情況下,啟動“Analyze | Distribution(Y) ”菜單,出現(xiàn)圖 25的選擇變量對話框: 選Y變量為HEIGHT,按OK可以打開一個新窗口,顯示身高的直方圖、盒形圖、矩統(tǒng)計量表(圖 26): 分位數(shù)表: 在Graphs菜單中已選了直方圖、盒形圖,還可以作QQ圖,即分位數(shù)分位數(shù)圖。 圖 28為身高的正態(tài)QQ圖,其中畫出了班上19個學(xué)

18、生的19個點,每個點的縱坐標(biāo)為變量值,而橫坐標(biāo)為該值的累計百分比頻數(shù)對應(yīng)的標(biāo)準(zhǔn)正態(tài)分位數(shù)。比如,身高最低的一個為51.3,其累計百分比頻數(shù)(即51.3的經(jīng)驗分布函數(shù)值)為5.3%,即身高小于51.3的占5.3%,而標(biāo)準(zhǔn)正態(tài)分布的0.053分位數(shù)為-1.84570,所以此點的橫坐標(biāo)即-1.84570。如果身高服從正態(tài)分布,QQ圖的散點應(yīng)大致在一條直線附近變動。QQ圖的各種不同形狀能夠反映出變量分布的偏斜情況和重、輕尾情況。在QQ圖中也可以選觀測、刷亮等。畫出QQ圖后選主菜單中的“Curves | QQ Ref Line ”可以為圖中散點畫一條擬合直線。 圖 28的身高的QQ圖顯示身高基本服從正態(tài)

19、分布。如果我們畫SASUSER.GPA中GPA分?jǐn)?shù)的QQ 圖(圖 30): 就可以看到GPA的分布呈現(xiàn)左偏的情況。這是因為,在QQ圖的左下端,GPA散點的走向比正態(tài)(圖中直線)偏下,說明GPA分布的左尾比正態(tài)長;在QQ圖的右上端,GPA散點的走向比正態(tài)偏右下,說明GPA分布的右尾比正態(tài)短,即分布左偏。作為驗證,可以看一看的圖 29直方圖: 圖 32給出了與正態(tài)相比左偏、右偏、輕尾、重尾的分布的QQ圖的典型模式: 除了可以作正態(tài)分布QQ圖外,還可以作對數(shù)正態(tài)、指數(shù)分布、威布爾分布的QQ圖。對數(shù)正態(tài)要指定參數(shù)Sigma,威布爾分布要指定形狀參數(shù)C。 SAS/INSIGHT為研究一維變量分布除畫直方

20、圖外還提供了兩類 分布密度估計分布密度估計:參數(shù)估計和非參數(shù)估計。參數(shù)估計可以擬合正態(tài)、對數(shù)正態(tài)、指數(shù)、威布爾分布密度。非參數(shù)估計使用核估計。 比如,為了估計身高的正態(tài)密度并把密度曲線疊加在直方圖上,選“Curves | Parametric Density ”,彈出對話框圖 31: 指定正態(tài)分布且方法為用樣本估計分布密度參數(shù)。按OK后作出的圖見圖 33: 為了作身高密度的核估計圖,選“Curves | Kernel Density”,彈出一個對話框,可以選三種核函數(shù):正態(tài)核、三角核、二次函數(shù)核,可以自動擬合最優(yōu)的密度估計(方法為AMISE )或者自己指定平滑參數(shù)C。見圖 33。 作了密度曲線圖后在圖形下面將出現(xiàn)顯示密度估計主要參數(shù)的表格. 單擊其中的曲線標(biāo)志可以加亮顯示圖中的曲線。對參數(shù)密度估計,給出了估計的參數(shù),比如正態(tài)的均值、方差;對核估計,給出了核函數(shù)類型,及平滑參數(shù)值。有些參數(shù)旁邊有一個滑塊,可以手工選擇參數(shù)的值。比如拖動核估計中的平滑參

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論