




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
scikit-learn庫的介紹1.知道sklearn機(jī)器學(xué)習(xí)庫
2.了解Sklearn機(jī)器學(xué)習(xí)庫1.什么是機(jī)器學(xué)習(xí)
2.sklearn介紹機(jī)器學(xué)習(xí)是一門人工智能的科學(xué),該領(lǐng)域的主要研究對(duì)象是人工智能,特別是如何在經(jīng)驗(yàn)學(xué)習(xí)中改善具體算法的性能機(jī)器學(xué)習(xí)是對(duì)能通過經(jīng)驗(yàn)自動(dòng)改進(jìn)的計(jì)算機(jī)算法的研究機(jī)器學(xué)習(xí)是一門研究機(jī)器獲取新知識(shí)和新技能,并識(shí)別現(xiàn)有知識(shí)的學(xué)問。這里所說的“機(jī)器”,指的就是計(jì)算機(jī)。什么是機(jī)器學(xué)習(xí)傳統(tǒng)機(jī)器學(xué)習(xí)—主要是算法深度學(xué)習(xí)(DeepLearning)是機(jī)器學(xué)習(xí)的一個(gè)子集,就是用復(fù)雜、龐大的神經(jīng)網(wǎng)絡(luò)進(jìn)行機(jī)器學(xué)習(xí)。核心是大數(shù)據(jù)量什么是機(jī)器學(xué)習(xí)什么是機(jī)器學(xué)習(xí)SciPy——一個(gè)開源的基于Python的科學(xué)計(jì)算工具包。基于SciPy,目前開發(fā)者們針對(duì)不同的應(yīng)用領(lǐng)域已經(jīng)發(fā)展出了為數(shù)眾多的分支版本,它們被統(tǒng)一稱為Scikits,即SciPy工具包的意思。而在這些分支版本中,最有名,也是專門面向機(jī)器學(xué)習(xí)的一個(gè)就是Scikit-learn。Scikit-learn開源庫顯得較為保守。這主要體現(xiàn)在兩個(gè)方面:一是Scikit-learn從來不做除機(jī)器學(xué)習(xí)領(lǐng)域之外的其他擴(kuò)展,二是Scikit-learn從來不采用未經(jīng)廣泛驗(yàn)證的算法。
sklearn簡(jiǎn)介基本功能主要分為六大部分:分類回歸聚類數(shù)據(jù)降維模型選擇數(shù)據(jù)預(yù)處理sklearn簡(jiǎn)介識(shí)別給定對(duì)象的所屬類別,屬于監(jiān)督學(xué)習(xí)的范疇。最常見的應(yīng)用場(chǎng)景包括垃圾郵件檢測(cè)和圖像識(shí)別等。算法:支持向量機(jī)(SVM),最近鄰,邏輯回歸,隨機(jī)森林,決策樹以及多層感知器(MLP)神經(jīng)網(wǎng)絡(luò)等等。不支持深度學(xué)習(xí),也不支持GPU加速,MLP不適合于處理大規(guī)模問題Sklearn功能--分類預(yù)測(cè)與給定對(duì)象相關(guān)聯(lián)的連續(xù)值屬性,最常見的應(yīng)用場(chǎng)景包括預(yù)測(cè)藥物反應(yīng)和預(yù)測(cè)股票價(jià)格等。算法:支持向量回歸(SVR),脊回歸,Lasso回歸,彈性網(wǎng)絡(luò)(ElasticNet),最小角回歸(LARS),貝葉斯回歸,以及各種不同的魯棒回歸算法等。Sklearn功能--回歸是指自動(dòng)識(shí)別具有相似屬性的給定對(duì)象,并將其分組為集合,屬于無監(jiān)督學(xué)習(xí)的范疇,最常見的應(yīng)用場(chǎng)景包括顧客細(xì)分和試驗(yàn)結(jié)果分組。算法:K-均值聚類,譜聚類,均值偏移,分層聚類,DBSCAN聚類等。Sklearn功能--聚類使用降維技術(shù)來減少要考慮的隨機(jī)變量的個(gè)數(shù),其主要應(yīng)用場(chǎng)景包括可視化處理和效率提升。算法:主成分分析(PCA)、非負(fù)矩陣分解(NMF)、映射(Projection)、流行學(xué)習(xí)(ManifoldLearning)、增量式PCA、
RandomizedPCA、KernelPCA、
LLE(LocallyLinearEmbedding)、LDA(LinearDiscriminantAnalysis)、特征選擇等Sklearn功能--數(shù)據(jù)降維對(duì)于給定參數(shù)和模型的比較、驗(yàn)證和選擇,其主要目的是通過參數(shù)調(diào)整來提升精度。模塊:格點(diǎn)搜索,交叉驗(yàn)證、各種針對(duì)預(yù)測(cè)誤差評(píng)估的度量函數(shù)Sklearn功能--模型選擇數(shù)據(jù)的特征提取和歸一化,是機(jī)器學(xué)習(xí)過程中的第一個(gè)也是最重要的一個(gè)環(huán)節(jié)。這里歸一化是指將輸入數(shù)據(jù)轉(zhuǎn)換為具有零均值和單位權(quán)方差的新變量,但因?yàn)榇蠖鄶?shù)時(shí)候都做不到精確等于零,因此會(huì)設(shè)置一個(gè)可接受的范圍,一般都要求落在0-1之間。而特征提取是指將文本或圖像數(shù)據(jù)轉(zhuǎn)換為可用于機(jī)器學(xué)習(xí)的數(shù)字變量。方法:標(biāo)準(zhǔn)化(中心化)、歸
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 奶茶店商鋪?zhàn)赓U合同
- 倉庫租賃協(xié)議合同范例
- 買賣合同范例簡(jiǎn)
- 供貨合同范例防止賴賬
- 農(nóng)機(jī)水箱銷售合同范例
- 公司與工人臨時(shí)合同范本
- 冷鏈物流倉儲(chǔ)合同范例
- 分紅提成合同范例
- 養(yǎng)殖草地出售合同范例
- 農(nóng)藥外貿(mào)合同范例實(shí)例
- 企業(yè)人力資源管理師知識(shí)考試題及答案
- 2025年上半年宜賓江安縣人社局招考易考易錯(cuò)模擬試題(共500題)試卷后附參考答案
- 2025年山東省高考物理復(fù)習(xí)方法及備考策略指導(dǎo)(深度課件)
- 2025年安徽工業(yè)職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫完整版
- 做一個(gè)指南針(課件)-二年級(jí)科學(xué)下冊(cè)教科版
- 2025至2030年中國十二烷基磺酸鈉數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 《C#程序設(shè)計(jì)基礎(chǔ)》課件
- 全國計(jì)算機(jī)等級(jí)考試《三級(jí)信息安全技術(shù)》專用教材【考綱分析+考點(diǎn)精講+真題演練】
- 2024年第五屆美麗中國全國國家版圖知識(shí)競(jìng)賽題庫及答案(中小學(xué)組)
- 2025年江蘇航空職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試近5年??及鎱⒖碱}庫含答案解析
- 2025年上海市各區(qū)初三語文一模試題匯編之綜合運(yùn)用
評(píng)論
0/150
提交評(píng)論