![在線課程評論的情感傾向識別與話題挖掘技術_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-5/20/9ecfb458-ad84-413b-bce3-10e175d34560/9ecfb458-ad84-413b-bce3-10e175d345601.gif)
![在線課程評論的情感傾向識別與話題挖掘技術_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-5/20/9ecfb458-ad84-413b-bce3-10e175d34560/9ecfb458-ad84-413b-bce3-10e175d345602.gif)
![在線課程評論的情感傾向識別與話題挖掘技術_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-5/20/9ecfb458-ad84-413b-bce3-10e175d34560/9ecfb458-ad84-413b-bce3-10e175d345603.gif)
![在線課程評論的情感傾向識別與話題挖掘技術_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-5/20/9ecfb458-ad84-413b-bce3-10e175d34560/9ecfb458-ad84-413b-bce3-10e175d345604.gif)
下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、在線課程評論的情感傾向識別與話題挖掘技術伴隨信息技術的快速發(fā)展,為各行業(yè)領域注入新鮮的活 力。以教育領域為例,較多互動學習平臺逐漸被引入其中,特別 其中包含的學習者評論數(shù)據(jù), 均可為教學質量改善、 用戶選課以 及平臺支持提供參考, 然而現(xiàn)有的平臺運行中并未充分利用這些 反饋信息, 需行之有效的完善策略。 本次研究將對情感傾向識別 與話題挖掘技術做簡單介紹, 在此基礎上提出在線課程評論樣本 處理與特征提取方法、 情感傾向識別算法以及在線課程評論話題 挖掘技術等。信息化時代背景下, 學習資源共享、 平臺共享已成為大多學 習者青睞的主要內容, 也因此有較多學習行為數(shù)據(jù)生成, 如何對 這些數(shù)據(jù)充分利用
2、成為當前需考慮的主要問題。值得注意的是, 前許多數(shù)據(jù)提取、 教學系統(tǒng)設計并不能滿足數(shù)據(jù)挖掘需求, 更無 從談及利用所獲取的數(shù)據(jù)為教學實踐進行指導, 要求引入有效的 數(shù)據(jù)提取、情感傾向識別以及話題挖掘技術。因此,本本文對在 線課程評論的情感傾向識別與話題挖掘技術研究, 具有十分重要 的意義。1 情感傾向識別與話題挖掘技術介紹關于情感傾向識別、 話題挖掘技術的概念, 首先可從教育大 數(shù)據(jù)進行分析, 近年來在線學習中較多學習平臺逐漸引入, 使海 量未結構化數(shù)據(jù)生成, 這些數(shù)據(jù)區(qū)別于傳統(tǒng)結構化數(shù)據(jù)如考勤記錄、考試成績等,有數(shù)據(jù)動態(tài)變化、數(shù)據(jù)規(guī)?;约邦愋投鄻踊?等特點,而滿足這些特征的在線學習數(shù)據(jù)均推
3、動教育大數(shù)據(jù)的形 成。而在此基礎上提出的情感傾向識別,Web2.0 時代下,大眾在瀏覽事物信息中, 更注重對以往相關評論內容關注, 或將自身 的想法、意見與心情表達出來。大數(shù)據(jù)環(huán)境下,便強調數(shù)據(jù)挖掘 中能夠對大眾的平均內容做情感分析, 該過程被稱之為情感傾向 識別。另外,在話題挖掘技術方面,由于很多情感傾向信息并非 針對一個整體評論對象, 而是對其中某一部分的傾向表現(xiàn), 而這 些部分便可被叫做話題。 實際進行海量文本瀏覽中, 便要求引入 話題自動提取技術, 保證信息檢索與處理效率, 以此達到話題挖 掘的目的。2 在線課程評論樣本處理與特征提取2.1 在線課程評論數(shù)據(jù)樣本處理 本次研究中,主要針
4、對在線課程學習網(wǎng)站中的點評區(qū)分析, 具體做樣本數(shù)據(jù)出去中,相關的要求主要包括:(1)對點評區(qū)網(wǎng)頁結構信息充分了解,這些存儲于后臺數(shù) 據(jù)庫內的半結構化形式文本數(shù)據(jù),向用戶展示中,將通過 HTML 頁面以相應的格式顯示, 因網(wǎng)頁引入的通訊技術有一定差異, 所 以在采集數(shù)據(jù)中有多種方式,如利用HTML表單形式,或借助HTML 結構樹抽?。唬?)為使服務器訪問壓力、系統(tǒng)資源減少,一般設計中也 考慮引入加載方式,以 JavaScript 為例,通過腳本動態(tài)導入數(shù)據(jù)。實際做數(shù)據(jù)采集中,可設定相應的方案流程,整個流程強調 首先對 JS 腳本內有無提取信息判斷, 若加載過程需借助 JS 動態(tài) 實現(xiàn),取中間代理
5、方法,對 JavaScript Object Notation頁面探測,進行格式解吸, 然后將評論數(shù)據(jù)相關信息提取出來并存儲。 假若加載方式選擇HTML靜態(tài)加載,轉換的目標體現(xiàn)在文本對象 模型DOMt,在此基礎上做定位解析,將其中信息提取出來并存 儲在數(shù)據(jù)庫內。2.2 特征提取所謂文本特征, 主要指被識別對象的特征, 具體進行文本情 感識別中,通常也需由這些特征著手。值得注意的是,在評論信 息中,不同學習者在表達細致程度上有一定差異, 其直接導致課 程評論文本長度不同, 部分評論中有豐富的文字內容, 傳遞的信 息較多,而部分評論僅有幾個字, 其意味文本特征分布有稀疏性、 不均衡性特點。對此,實
6、際進行文本特征提取中,本次研究考慮 引入細粒度特征生成法,如 N-gram 語言模型,所有文本內容, 均以字符單元形式呈現(xiàn),有長度為N的字符片段序列形成,其中 各片段均被叫做gram。同時,既往研究資料中,也對稀疏文本 特征提取問題提出較多優(yōu)化方式, 如多空間微粒群優(yōu)化, 這一方 式側重于取訓練集, 細化為不同交叉訓練子集, 通過檢驗各子集, 提取其中的特征信息,達到文本特征提取目標。3 在線課程評論情感傾向識別算法研究 情感傾向識別的實現(xiàn),主要強調通過對在線課程評論的分 析,了解情感傾向。本次研究中,考慮引入自適應多視圖選擇方 法,其亦被稱之為AMVS識別中采用半監(jiān)督情感識別方法,其 區(qū)別于
7、傳統(tǒng)RSS方法,更注重做情感強度的計算, 能夠優(yōu)先選取 鑒別型高的特征。需注意該方法應用下,選擇視圖中,要求結合 特征維度、訓練精度兩者關系,進行維度分布的構建,保證各視 圖維度均較為合適, 這樣僅需保證特征采樣覆蓋率適宜, 便可進 行視圖生成量的確定。 盡管該算法應用下無需考慮視圖劃分、 視 圖維度等影響因素, 且自適應性強, 但在無標記樣本規(guī)模影響下, 識別精度可能無法保證。4 在線課程評論話題挖掘技術分析情感識別的基礎上, 便要求做話題挖掘。 本文在研究中對于 評論話題挖掘方法的選擇, 主要結合既往研究成果, 如話題情感 模型的構建,DEI-TM,這一模型強調對情感表達尋找相應的話題, 融入以往LDA模型話題挖掘機制,即通過語句間關聯(lián)信息的利 用,過濾出正面、負面情感樣本,以分而治之理論為指導,實現(xiàn) 不同情感類別話題信息的提取。實踐研究發(fā)現(xiàn),DEI-TM模型運用下,提取后的話題無較高相似度,在泛化能力上較強,可充分 展示話題內單詞,極大程度上提高話題挖掘效果。5 結論 情感傾向識別及其話題挖掘是當前在線課程評論數(shù)據(jù)被充 分利用的關鍵性保證。 實
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 氣候變化下農業(yè)生態(tài)系統(tǒng)的適應性調整研究進展
- 物聯(lián)網(wǎng)技術在智能家居生態(tài)圈的應用前景
- 國慶節(jié)秋天主題活動方案
- 現(xiàn)代辦公樓電力維護成本深度剖析
- 現(xiàn)代物流技術與醫(yī)療行業(yè)互補與共進
- Unit 4 Friends Forever Understanding ideas 說課稿-2024-2025學年高中英語外研版(2019)必修第一冊001
- 2023八年級物理上冊 第四章 在光的世界里第6節(jié) 神奇的眼睛說課稿(新版)教科版
- 6《觀察土壤》說課稿-2023-2024學年科學四年級下冊教科版
- 2023二年級語文上冊 第八單元 24 風娃娃說課稿 新人教版
- 18《文言文二則 鐵杵成針》(說課稿)2023-2024學年-統(tǒng)編版四年級語文下冊
- 北京地鐵13號線
- 塑料成型模具設計(第2版)江昌勇課件1-塑料概述
- 產(chǎn)業(yè)園EPC總承包工程項目施工組織設計
- 方形補償器計算
- 為加入燒火佬協(xié)會致辭(7篇)
- 兒科重癥監(jiān)護病房管理演示文稿
- 甲基異丁基甲酮化學品安全技術說明書
- 條形基礎的平法識圖課件
- 秘書實務完整版課件全套ppt教程
- 新版神經(jīng)系統(tǒng)疾病的病史采集和體格檢查ppt
- 義務教育《歷史》課程標準(2022年版)
評論
0/150
提交評論