版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
貧困生判別深入分析—3.6—
小明同學(xué)為了探究邏輯回歸算法的原理,他以貧困生判定案例進行探索。
幾列數(shù)據(jù)分別為是否貧困生、平均每次消費的金額、單次最小的消費金額、單次最大的消費金額、總消費金額。其中貧困生標(biāo)注為1,非貧困生標(biāo)注為0。試一試
請在計算機或草稿紙上畫出總消費金額和是否貧困生的關(guān)系,如果使用線性回歸算法,這個回歸線大致怎么畫?自己試試吧。想一想
有了回歸線,能否使用回歸線來區(qū)分學(xué)生是否為貧困生?
邏輯回歸,雖然被稱為回歸,但其實際上是分類模型。邏輯回歸因其簡單易于解釋、可并行化、可解釋性強,深受工業(yè)界喜愛。那為什么不可以用線性回歸做分類呢?3.6.1為什么用邏輯回歸
那為什么不可以用線性回歸做分類呢?如圖所示畫出了貧困與否和特征的關(guān)系圖3.6.1為什么用邏輯回歸0102有了這條回歸斜線,你能區(qū)分貧困和非貧困嗎?寫出你的理由。你認為應(yīng)該如何來理解這條回歸斜線?使用回歸方法
如圖所示,我們可以為所選特征設(shè)置一個閾值,根據(jù)特征的值與閾值的比較來預(yù)測是否貧困。也就是找到一個分界線對應(yīng)的值,設(shè)置這個值為閾值,大于閾值的是貧困生,否則非貧困生。3.6.1為什么用邏輯回歸
但是這條回歸線到底代表什么呢?3.6.1為什么用邏輯回歸為什么回歸線想要讓所有點盡可能接近呢?3.6.1為什么用邏輯回歸3.6.1為什么用邏輯回歸
為了解決這些問題,我們可以想象,最好能做出圖所示的結(jié)果。如果可以的話,只要計算出來貧困的概率比閾值大,就預(yù)測為是貧困,否則就是非貧困。3.6.1為什么用邏輯回歸如圖所示類似的線,能夠解決上述的兩個問題嗎?為什么?想一想
3.6.1為什么用邏輯回歸現(xiàn)在的問題,就是如何能將直線變彎呢?
我們使用Sigmoid函數(shù)將線性回歸的直線轉(zhuǎn)為一個S形曲線。Sigmoid函數(shù)為:
3.6.2從線性回歸到邏輯回歸
這個例子中,閾值的兩側(cè)有不同的貧困結(jié)果,這條線就叫判定邊界(DecisionBoundary),我們可以調(diào)整判定邊界來調(diào)整判定的結(jié)果。3.6.3判定邊界假設(shè)學(xué)校對貧困生資助的預(yù)算充足,如圖3-23所示的判定邊界可以如何移動?假設(shè)學(xué)校對貧困生資助的預(yù)算不足,如圖3-23所示的判定邊界可以如何移動?3.6.3判定邊界
在前面線性回歸問題中,我們可以使用決定系數(shù)來評價模型,在分類問題中,我們使用ROC/AUC、F1等指標(biāo),這些指標(biāo)都是值越接近1越好。3.6.4評價指標(biāo)與模型解釋2網(wǎng)絡(luò)中獎詐騙
我們主要使用“分布”小部件對數(shù)據(jù)進行探索性分析。我們已經(jīng)嘗試過使用“散點圖”小部件可視化數(shù)據(jù),這里嘗試通過“分布”小部件來查看項目總結(jié)—3.7—
本章以圖形化的方式著重闡述了分類問題,為什么要采用邏輯回歸方法,以及邏輯回歸的基本思想和方法。通過學(xué)生身邊的貧困生判別的案例,分析了分類問題,并在“橙現(xiàn)智能”中采用邏輯回歸算法實現(xiàn)了貧困生的判
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 揚塵治理委托協(xié)議模板
- 2025年度文化創(chuàng)意產(chǎn)品開發(fā)合作協(xié)議范本3篇
- 2025版外債借款合同法律框架與政策背景分析3篇
- 2025年銷售薪資與銷售團隊建設(shè)合同2篇
- 2025版押一付三車位租賃合同模板參考9篇
- 2025年高端住宅產(chǎn)權(quán)轉(zhuǎn)讓合同范本3篇
- 2025-2030全球熔鹽儲熱設(shè)備行業(yè)調(diào)研及趨勢分析報告
- 2025年全球及中國實驗室渦旋混合器行業(yè)頭部企業(yè)市場占有率及排名調(diào)研報告
- 2025版投票權(quán)委托合同:股東權(quán)益保護專項3篇
- 2025年度綠色有機農(nóng)產(chǎn)品個人果園承包經(jīng)營合同書4篇
- 2025年N1叉車司機考試試題(附答案)
- 《醫(yī)院財務(wù)分析報告》課件
- 2025老年公寓合同管理制度
- 2024年考研政治試題及答案
- 2024-2025學(xué)年人教版數(shù)學(xué)六年級上冊 期末綜合卷(含答案)
- 2024中國汽車后市場年度發(fā)展報告
- 感染性腹瀉的護理查房
- 天津市部分區(qū)2023-2024學(xué)年高二上學(xué)期期末考試 物理 含解析
- 《人工智能基礎(chǔ)》全套英語教學(xué)課件(共7章)
- GB/T 35613-2024綠色產(chǎn)品評價紙和紙制品
- 2022-2023學(xué)年五年級數(shù)學(xué)春季開學(xué)摸底考(四)蘇教版
評論
0/150
提交評論