




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
研究生項(xiàng)目報(bào)告學(xué)生學(xué)號(hào)專業(yè)電子信息班級(jí)人工智能課程名稱深度學(xué)習(xí)任課教師項(xiàng)目名稱基于LSTM的北京空氣質(zhì)量預(yù)測
一、數(shù)據(jù)集介紹這是一個(gè)空氣質(zhì)量數(shù)據(jù)集,報(bào)告了北京2010年到2014年每小時(shí)氣壓風(fēng)向雨雪量等相關(guān)物理量的數(shù)據(jù)集來反映空氣污染水平。屬性字段簡要說明No行號(hào)year此列中數(shù)據(jù)的年份month此列中數(shù)據(jù)的月份day此列中數(shù)據(jù)的幾號(hào)hour此行中數(shù)據(jù)的小時(shí)pm2.5PM2.5濃度DEWP露點(diǎn)溫度TEMP對應(yīng)時(shí)刻的溫度PRES對應(yīng)時(shí)刻的氣壓cbwd組合風(fēng)向Iws累計(jì)風(fēng)速Is累計(jì)降雪時(shí)數(shù)ls累計(jì)降雨時(shí)數(shù)數(shù)據(jù)處理1.將日期時(shí)間信息合并為單個(gè)日期時(shí)間,以便可以將其用作Pandas中的索引。2.刪除存在空值數(shù)據(jù)和標(biāo)簽屬性行。3.將數(shù)據(jù)集中的'pollution'列中的缺失值(NA)用0填充。4.刪除數(shù)據(jù)集中的前24行數(shù)據(jù)。5.將數(shù)據(jù)集保存到名為'pollution.csv'的CSV文件中綜合起來,該段代碼實(shí)現(xiàn)了從名為'raw.csv'的文件中讀取數(shù)據(jù)集,解析日期時(shí)間列,進(jìn)行一些數(shù)據(jù)處理(如刪除列、填充缺失值、刪除行),然后將處理后的數(shù)據(jù)保存為'pollution.csv'文件,并打印出數(shù)據(jù)集的前5行。處理結(jié)果(部分'pollution.csv'數(shù)據(jù)展示):數(shù)據(jù)繪圖這段代碼的目的是通過繪圖展示數(shù)據(jù)集中特定列的趨勢變化。每個(gè)子圖對應(yīng)于一個(gè)特定列,圖表的縱軸表示該列的數(shù)值,橫軸表示時(shí)間或數(shù)據(jù)點(diǎn)的索引。通過繪制折線圖,可以觀察到每個(gè)特定列隨時(shí)間的變化趨勢。不同的子圖分別展示了不同列的趨勢,每個(gè)子圖都有相應(yīng)的標(biāo)題來指示所展示的列。該代碼段的輸出結(jié)果是一個(gè)包含多個(gè)子圖的圖表,每個(gè)子圖對應(yīng)一個(gè)特定列的趨勢。結(jié)果:將數(shù)據(jù)轉(zhuǎn)換成監(jiān)督學(xué)習(xí)數(shù)據(jù)該步驟將數(shù)據(jù)集構(gòu)建為監(jiān)督學(xué)習(xí)問題并對輸入變量進(jìn)行標(biāo)準(zhǔn)化。將監(jiān)督學(xué)習(xí)問題定義為根據(jù)前一時(shí)間步驟的污染測量和天氣條件來預(yù)測當(dāng)前時(shí)間(t)的污染。首先,加載“pollution.csv”數(shù)據(jù)集。風(fēng)向特征是標(biāo)簽編碼的(整數(shù)編碼)。接下來,對所有特征進(jìn)行歸一化,然后將數(shù)據(jù)集轉(zhuǎn)化為監(jiān)督學(xué)習(xí)問題。然后刪除要預(yù)測的小時(shí)(t)的天氣變量。1.定義series_to_supervised函數(shù):該函數(shù)將時(shí)間序列數(shù)據(jù)轉(zhuǎn)換為監(jiān)督學(xué)習(xí)型數(shù)據(jù)。它接受參數(shù)data表示輸入數(shù)據(jù),n_in表示輸入序列長度,n_out表示輸出序列長度,dropna表示是否刪除包含空值的行。函數(shù)首先將數(shù)據(jù)轉(zhuǎn)換為數(shù)據(jù)框,并創(chuàng)建空的列列表和列名列表。然后,它通過使用df.shift方法向列列表中添加平移后的數(shù)據(jù)。接下來,函數(shù)將列列表中的張量按列拼接起來,創(chuàng)建一個(gè)包含輸入和輸出序列的數(shù)據(jù)框。最后,函數(shù)重命名列名,并根據(jù)dropnan參數(shù)刪除包含空值的行,最終返回轉(zhuǎn)換后的數(shù)據(jù)框。2.數(shù)據(jù)預(yù)處理:對"風(fēng)向"列進(jìn)行數(shù)字編碼轉(zhuǎn)換:使用LabelEncoder將字符串標(biāo)簽轉(zhuǎn)換為數(shù)值編碼,并將結(jié)果存儲(chǔ)回原始數(shù)據(jù)集中。數(shù)據(jù)類型轉(zhuǎn)換:將數(shù)據(jù)集中的所有值轉(zhuǎn)換為浮點(diǎn)型,以便后續(xù)的數(shù)據(jù)縮放。數(shù)據(jù)縮放:使用MinMaxScaler對數(shù)據(jù)進(jìn)行縮放,將所有特征值縮放到[0,1]的范圍內(nèi)。3.數(shù)據(jù)轉(zhuǎn)換為監(jiān)督學(xué)習(xí)型數(shù)據(jù):調(diào)用series_to_supervised函數(shù),將縮放后的數(shù)據(jù)轉(zhuǎn)換為監(jiān)督學(xué)習(xí)型數(shù)據(jù)集。設(shè)置輸入序列長度為1,輸出序列長度為1。轉(zhuǎn)換后的數(shù)據(jù)集存儲(chǔ)在reframed變量中。4.刪掉不需要預(yù)測的列:使用drop方法刪除不需要的列,通過指定axis=1表示列操作,inplace=True表示原地修改。5.打印刪減后的數(shù)據(jù)集的前幾行,最終的數(shù)據(jù)集形式是:v1(t-1),v2(t-2),v3(t-3),v4(t-4),v5(t-5),v6(t-6),v7(t-7),v8(t-1),v1(t),其中v1(t-1)到v8(t-1)表示前一天的數(shù)據(jù),v1(t)表示當(dāng)天要預(yù)測的數(shù)據(jù)。轉(zhuǎn)換后部分?jǐn)?shù)據(jù)展示:三、模型介紹1.LSTM模型LSTM(LongShort-TermMemory)是一種常用于處理序列數(shù)據(jù)的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)模型。相比于傳統(tǒng)的RNN,LSTM在處理長期依賴性問題上表現(xiàn)更好。它通過引入特殊的記憶單元和門控機(jī)制來有效地捕捉和管理序列中的長期依賴關(guān)系。1.1LSTM單元LSTM模型中的關(guān)鍵組件是LSTM單元,每個(gè)LSTM單元由以下部分組成:1.輸入門(InputGate):決定是否將輸入信息納入記憶。2.遺忘門(ForgetGate):決定是否從記憶中刪除先前的信息。3.輸出門(OutputGate):決定從記憶中輸出的信息。4.記憶單元(CellState):負(fù)責(zé)存儲(chǔ)和傳遞信息的長期記憶。LSTM通過在每個(gè)時(shí)間步驟中執(zhí)行一系列的數(shù)學(xué)操作來處理序列數(shù)據(jù):1.輸入信息經(jīng)過輸入門,決定哪些信息需要被記憶。2.遺忘門根據(jù)當(dāng)前輸入信息和上一個(gè)時(shí)間步驟的隱藏狀態(tài),決定需要從記憶單元中刪除哪些信息。3.記憶單元根據(jù)輸入門和遺忘門的結(jié)果來更新和存儲(chǔ)記憶。4.輸出門根據(jù)當(dāng)前輸入信息和上一個(gè)時(shí)間步驟的隱藏狀態(tài),決定從記憶單元中輸出哪些信息。5.隱藏狀態(tài)(HiddenState)是LSTM的輸出,它被傳遞到下一個(gè)時(shí)間步驟,并作為輸入用于更新記憶單元。RNN與LSRM對比所有RNN都具有一種重復(fù)神經(jīng)網(wǎng)絡(luò)模塊的鏈?zhǔn)降男问?。在?biāo)準(zhǔn)的RNN中,這個(gè)重復(fù)的模塊只有一個(gè)非常簡單的結(jié)構(gòu),例如一個(gè)tanh層。LSTM同樣是這樣的結(jié)構(gòu),但是重復(fù)的模塊擁有一個(gè)不同的結(jié)構(gòu)。不同于單一神經(jīng)網(wǎng)絡(luò)層,這里是有四個(gè),以一種非常特殊的方式進(jìn)行交互。1.3LSTM的核心思想LSTM的關(guān)鍵就是細(xì)胞狀態(tài),水平線在圖上方貫穿運(yùn)行。細(xì)胞狀態(tài)類似于傳送帶。直接在整個(gè)鏈上運(yùn)行,只有一些少量的線性交互。信息在上面流傳保持不變會(huì)很容易。LSTM有通過精心設(shè)計(jì)的稱作為“門”的結(jié)構(gòu)來去除或者增加信息到細(xì)胞狀態(tài)的能力。門是一種讓信息選擇式通過的方法。他們包含一個(gè)sigmoid神經(jīng)網(wǎng)絡(luò)層和一個(gè)按位的乘法操作。Sigmoid層輸出0到1之間的數(shù)值,描述每個(gè)部分有多少量可以通過。代表“不許任何量通過”,就指“允許任意量通過”。
1.4LSTM的優(yōu)點(diǎn)LSTM模型在處理序列數(shù)據(jù)時(shí)具有以下優(yōu)點(diǎn):1.長期依賴性處理:傳統(tǒng)的RNN模型在處理長序列時(shí)容易出現(xiàn)梯度消失或梯度爆炸的問題,導(dǎo)致難以捕捉長期依賴關(guān)系。LSTM通過門控機(jī)制可以有效地解決這個(gè)問題,使得模型能夠更好地記住和利用長期的信息。2.學(xué)習(xí)長期模式:LSTM能夠?qū)W習(xí)到序列數(shù)據(jù)中的長期模式和規(guī)律,對于時(shí)間序列預(yù)測、自然語言處理等任務(wù)非常有效。3.可變長度輸入:LSTM模型可以接受可變長度的輸入序列,適用于處理不同長度的序列數(shù)據(jù)。4.魯棒性:LSTM模型對于噪聲和輸入數(shù)據(jù)中的局部擾動(dòng)具有一定的魯棒性,能夠更好地處理復(fù)雜的序列數(shù)據(jù)。在實(shí)際應(yīng)用中,LSTM模型常用于時(shí)間序列預(yù)測、文本生成、語音識(shí)別等任務(wù),它的靈活性和強(qiáng)大的建模能力使其成為處理序列數(shù)據(jù)的重要工具。四、劃分?jǐn)?shù)據(jù)集將數(shù)據(jù)集按照一定的時(shí)間范圍劃分為訓(xùn)練集和測試集,并將輸入數(shù)據(jù)和輸出標(biāo)簽進(jìn)行預(yù)處理和格式轉(zhuǎn)換,以便用于LSTM模型的訓(xùn)練和測試。LSTM模型結(jié)構(gòu)模型的輸入形狀為(None,train_X.shape[1],train_X.shape[2]),其中train_X.shape[1]表示訓(xùn)練數(shù)據(jù)的時(shí)間步數(shù),train_X.shape[2]表示每個(gè)時(shí)間步的特征數(shù)量。輸出形狀為(None,1),預(yù)測一個(gè)數(shù)值。模型總共有10,651個(gè)可訓(xùn)練參數(shù),其中LSTM層有10,600個(gè)參數(shù),Dense層有51個(gè)參數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 航天信息財(cái)務(wù)培訓(xùn)
- 綜合實(shí)踐課:水與健康
- 舞蹈培訓(xùn)匯報(bào)演出
- TTT培訓(xùn)師成長特訓(xùn)營
- 腫瘤放化療科出科培訓(xùn)大綱
- 客車操作培訓(xùn)課件
- 女士正裝培訓(xùn)
- 培訓(xùn)銷售流程
- 腫瘤患者飲食營養(yǎng)護(hù)理
- 酒店前廳服務(wù)流程標(biāo)準(zhǔn)化管理
- 2024年度中國資管行業(yè)ESG投資發(fā)展研究報(bào)告
- 顯示設(shè)備健康護(hù)眼技術(shù)研究-洞察分析
- 乙肝免疫標(biāo)志物檢測及其實(shí)驗(yàn)結(jié)果解讀
- 軟件定義網(wǎng)絡(luò)SDN
- 血糖管理課件
- 2024年浙江省普通高中學(xué)業(yè)水平適應(yīng)性考試歷史試題(解析版)
- 410th循環(huán)流化床鍋爐本體化學(xué)清洗方案(HCL)
- DB34∕T 1555-2011 存量房交易計(jì)稅價(jià)格評(píng)估技術(shù)規(guī)范
- 青少年無人機(jī)課程:第一課-馬上起飛
- 桂科版八年級(jí)下冊信息技術(shù) 1.1規(guī)劃網(wǎng)站 教學(xué)設(shè)計(jì)
- 民辦學(xué)校托管合同范本
評(píng)論
0/150
提交評(píng)論