1603班電子商務(wù)實(shí)驗(yàn)報(bào)告實(shí)驗(yàn)三_第1頁
1603班電子商務(wù)實(shí)驗(yàn)報(bào)告實(shí)驗(yàn)三_第2頁
1603班電子商務(wù)實(shí)驗(yàn)報(bào)告實(shí)驗(yàn)三_第3頁
1603班電子商務(wù)實(shí)驗(yàn)報(bào)告實(shí)驗(yàn)三_第4頁
1603班電子商務(wù)實(shí)驗(yàn)報(bào)告實(shí)驗(yàn)三_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、電子商務(wù)應(yīng)用實(shí)驗(yàn)報(bào)告項(xiàng)目名稱 搜索引擎及數(shù)據(jù)挖掘?qū)嶒?yàn) 專業(yè)班級 1603 班學(xué)號 3901160315姓名 陳至聰實(shí)驗(yàn)成績: 批閱教師:年月日實(shí)驗(yàn) 3搜索引擎及數(shù)據(jù)挖掘?qū)嶒?yàn)實(shí)驗(yàn)學(xué)時:4每組人數(shù):1實(shí)驗(yàn)類型:2(1:基礎(chǔ)性(1:必修(1:基礎(chǔ)2:綜合性2:選修2:專業(yè)基礎(chǔ)3:設(shè)計(jì)性 4:研究性)3:其它)實(shí)驗(yàn)要求:1實(shí)驗(yàn)類別:33:專業(yè)4:其它)一、實(shí)驗(yàn)?zāi)康?. 熟練運(yùn)用所學(xué) SEO 技術(shù)對網(wǎng)頁進(jìn)行優(yōu)化。2. 熟悉搜索引擎中的幾種現(xiàn)一個簡單的主題爬蟲。算法,包括中文分詞算法、PageRank 算法等,設(shè)計(jì)并實(shí)3. 熟悉幾種常用的數(shù)據(jù)挖掘算法,包括 Apriori 算法、KNN 算法和 K-mea

2、ns 算法等。4. 運(yùn)用所學(xué)算法,結(jié)合選題設(shè)計(jì)并實(shí)現(xiàn)一個簡單的商品或信息推薦模型。二、實(shí)驗(yàn)內(nèi)容和方法1. 使用所學(xué)的 SEO 技術(shù),對實(shí)驗(yàn)二所設(shè)計(jì)的采用如下技術(shù):靜態(tài)首頁實(shí)施 SEO,在實(shí)施過程中需(1)(2)(3)(4)(5)(6)網(wǎng)頁標(biāo)題(title)的優(yōu)化;選取合適的元的優(yōu)化;并對進(jìn)行優(yōu)化;結(jié)構(gòu)和 URL 的優(yōu)化;創(chuàng)建 robots.txt 文件,蜘蛛抓取頁面;網(wǎng)頁內(nèi)部的優(yōu)化;的優(yōu)化;(7) Heading(8) 圖片優(yōu)化;(9) 網(wǎng)頁減肥技術(shù)。2. 學(xué)習(xí)和研究兩種不同的中文分詞工具,理解它們的實(shí)現(xiàn)原理及相關(guān)算法,并使用這兩種分詞工具對朱自清的荷塘月色一文進(jìn)行分詞,比較這兩種分詞工具的分

3、詞結(jié)果?!究蛇x分詞工具包括 jieba、SnowNLP、THULAC、NLPIR、CoreNLP、pyLTP、pynlpir、FudanNLP、HanLP、分詞、庖丁解牛等?!?. 使用任意一種編程語言實(shí)現(xiàn)公司的 PageRank 算法,并計(jì)算如下網(wǎng)頁關(guān)系圖中各個頁面的 PageRank 值?!緸榱吮阌谟?jì)算,假設(shè)每個頁面的 PR 初始值為 1,阻尼因子 d 為 1,迭代次數(shù)或終止條件可以自行設(shè)定?!緼BECD4. 使用 Python、Java、C+和 C#等任意一種編程語言,設(shè)計(jì)并實(shí)現(xiàn)一個簡單的主題爬蟲,要求在輸入主題、設(shè)置爬行深度和初始網(wǎng)頁 URL 之后能夠?qū)崿F(xiàn)網(wǎng)頁搜索,輸出的網(wǎng)頁的 URL

4、 和網(wǎng)頁標(biāo)題,可以將爬取的網(wǎng)頁 URL 和網(wǎng)頁標(biāo)題包含到文件或者數(shù)據(jù)庫中。5. 使用任意一種編程語言實(shí)現(xiàn) Apriori 算法,并采用所寫程序提取以下購物籃數(shù)據(jù)中的頻繁項(xiàng)集和強(qiáng)關(guān)聯(lián)規(guī)則(參數(shù)設(shè)置:最小支持度計(jì)數(shù)= 4,最小置信度= 0.6)。6. 使用任意一種編程語言實(shí)現(xiàn) KNN 算法,并采用所寫程序解決如下問題【K 值可根據(jù)經(jīng)驗(yàn)規(guī)則確定】:的品質(zhì)好壞可由兩個變量決定,一個是“酸腐蝕的時間”,一個是“能承受的壓強(qiáng)”。樣本數(shù)據(jù)如下:耐酸時間(秒)圧強(qiáng)(公斤/平方米)品質(zhì)事務(wù) ID商品001面包,黃油,尿布,啤酒002咖啡,糖,小甜餅,鮭魚,啤酒003面包,黃油,咖啡,尿布,啤酒,雞蛋004面包,

5、黃油,鮭魚,雞005雞蛋,面包,黃油006鮭魚,尿布,啤酒007面包,茶,糖雞蛋008咖啡,糖,蛋009面包,尿布,啤酒,鹽010茶,雞蛋,小甜餅,尿布,啤酒某未知樣本:耐酸時間 = 3 秒,壓強(qiáng)= 7 公斤/平方米,其品質(zhì)如何?7. 使用任意一種編程語言實(shí)現(xiàn)K-means 算法,采用隨機(jī)函數(shù)隨機(jī)在二維平面上生成 100 個點(diǎn),然后使用所寫程序?qū)@ 100 個點(diǎn)進(jìn)行聚類【可以采用 SSE(Sum of the Squared Errors, 誤差平方和)來確定最佳聚類數(shù),即確定 K 值】。8. 運(yùn)用所學(xué)算法,結(jié)合選題設(shè)計(jì)并使用任意一種編程語言實(shí)現(xiàn)一個簡單的商品或信息推薦模型。【注意:模型不一定

6、要很復(fù)雜,關(guān)鍵是要能夠說明其合理性,鼓勵大家創(chuàng)新。以下兩種商品推薦模型(信息推薦模型思路相似)基本思想供參考,也可在此基礎(chǔ)上進(jìn)行改進(jìn): 分析用戶的,找出他經(jīng)常的商品的類型,然后在該類型中找出量或者量最大但是該買家之前并未的商品,并將這些商品推薦給該用戶。 找出與該用戶具有相似購物習(xí)慣的其他用戶,例如他們曾經(jīng)過一些相同的商品,然后將其他用戶購買過但是該用戶未曾的商品推薦給他?!咳?shí)驗(yàn)要求1. 提供實(shí)施SEO 之后的術(shù)。靜態(tài)首頁界面和 HTML 代碼,盡量多地使用所學(xué) SEO 技2. 請盡量采用自己的語言來介紹兩種中文分詞工具的實(shí)現(xiàn)原理及相關(guān)算法,必要時可以結(jié)合程序流程圖等圖形化方式來闡述算法及

7、原理;針對指定文檔,對兩種工具的分詞結(jié)果進(jìn)行客觀的比較和評價。3. 需提供 PageRank 算法的完整實(shí)現(xiàn)代碼,并準(zhǔn)確計(jì)算指定網(wǎng)頁P(yáng)ageRank 值。4. 需提供簡單主題爬蟲的完整實(shí)現(xiàn)代碼及實(shí)際運(yùn)行結(jié)果。關(guān)系圖中各頁面的5. 需提供 Apriori 算法的完整實(shí)現(xiàn)代碼,并準(zhǔn)確提取指定購物籃數(shù)據(jù)中的頻繁項(xiàng)集和強(qiáng)關(guān)聯(lián)規(guī)則。.需提供 KNN 算法的完整實(shí)現(xiàn)代碼,并合理解決指定分類問題。需提供 K-means 算法的完整實(shí)現(xiàn)代碼,并合理對指定問題進(jìn)行聚類分析。需提供簡單商品或信息推薦模型的設(shè)計(jì)思想說明和完整實(shí)現(xiàn)代碼。在實(shí)驗(yàn)過程中,嚴(yán)禁大面積拷貝互聯(lián)網(wǎng)上已有資料和代碼。四、實(shí)驗(yàn)步驟1.

8、 對實(shí)驗(yàn)二所設(shè)計(jì)的靜態(tài)首頁實(shí)施 SEO。77壞74壞34好14好2. 學(xué)習(xí)和研究兩種不同的中文分詞工具,理解它們的實(shí)現(xiàn)原理及相關(guān)算法,并使用這兩種分詞工具對指定文檔進(jìn)行分詞,比較這兩種分詞工具的分詞結(jié)果。3.4.5.規(guī)則。6.7.8.編程實(shí)現(xiàn) PageRank 算法,并計(jì)算指定網(wǎng)頁關(guān)系圖中各頁面的 PageRank 值。使用任意一種編程語言,設(shè)計(jì)并實(shí)現(xiàn)一個簡單的主題爬蟲。編程實(shí)現(xiàn) Apriori 算法,并采用所寫程序提取指定購物籃數(shù)據(jù)中的頻繁項(xiàng)集和強(qiáng)關(guān)聯(lián)編程實(shí)現(xiàn) KNN 算法,并采用所寫程序解決指定分類問題。編程實(shí)現(xiàn) K-means 算法,并采用所寫程序?qū)ζ矫嫔想S機(jī)生成點(diǎn)的進(jìn)行聚類分析。運(yùn)用所

9、學(xué)算法,結(jié)合選題設(shè)計(jì)并實(shí)現(xiàn)一個簡單的商品或信息推薦模型。五、實(shí)驗(yàn)結(jié)果1. 提供通過SEO 優(yōu)化之后的所采用的 SEO 技術(shù)總結(jié):首頁靜態(tài)效果圖和完整的 HTML 源代碼。<head><meta charset="utf-8"><meta http-equiv="patible" content="IE=edge"><meta name="viewport" content="width=device-width, initial-scale=1">

10、<!- The above 3 meta tags *must* come first in the head; any other head content must come *after* these tags -><title>博學(xué)商城</title><!-font -><linkhref="/css?family=Montserrat:400,500,700" rel="stylesheet"><!- Bootstrap -><link type="text

11、/css" rel="stylesheet" href="css/bootstrap.min.css"/><!- Slick -><link type="text/css" rel="stylesheet" href="css/slick.css"/><link type="text/css" rel="stylesheet" href="css/slick-theme.css"/>&

12、lt;!- nouislider -><link type="text/css" rel="stylesheet" href="css/nouislider.min.css"/><!- Font Awesome Icon -><link rel="stylesheet" href="css/font-awesome.min.css"><!- Custom stlylesheet -><link type="text/css&q

13、uot; rel="stylesheet" href="css/style.css"/><!- HTML5 shim and Respond.js for IE8 support of HTML5 elements and media queries -><!- WARNING: Respond.js doesn't work if you view the page via file:/ -><!-if lt IE 9><script src="http/html5shiv/3.7.3/

14、html5shiv.min.js"></script><script src="http/respond/1.4.2/respond.min.js"></script><!endif-></head><body><!- HEADER -><header><!- TOP HEADER -><div id="top-header"><div class="container"><ul c

15、lass="header-links pull-left"><li><ahref="#"><iclass="fafa-phone"></i>+021-95-51-84</a></li><li><ahref="#"><iclass="fafa-envelope-o"></i></a></li><li><a href="#&

16、quot;><i class="fa fa-map-marker"></i> 1734 StonecoalRoad</a></li></ul><ul class="header-links pull-right"><li><a href="#"><i class="fa fa-dollar"></i> USD</a></li><li><a href=

17、"#"><i class="fa fa-user-o"></i> My Account</a></li></ul></div></div><!- /TOP HEADER -><!- MAIN HEADER -><div id="header"><!- container -><div class="container"><!- row -><div

18、class="row"><!- LOGO -><div class="col-md-3"><div class="header-logo"><a href="#" class="logo"><img src="./img/logo.png" alt=""></a></div></div><!- /LOGO -><!- SEARCH BAR

19、 -><div class="col-md-6"><div class="header-search"><form><select class="input-select"><option value="0">All Categories</option><option value="1">Category 01</option><option value="1">

20、;Category 02</option></select><input class="input" placeholder="Search here"><button class="search-btn">Search</button></form></div></div><!- /SEARCH BAR -><!- ACCOUNT -><div class="col-md-3 clearfix&qu

21、ot;><div class="header-ctn"><!- Wishlist -><div><a href="#"><i class="fa fa-heart-o"></i><span>Your Wishlist</span><div class="qty">2</div></a></div><!- /Wishlist -><!- Cart -&

22、gt;<div class="dropdown"><aclass="dropdown-toggle" data-toggle="dropdown" aria-expanded="true"><i class="fa fa-shopping-cart"></i><span>Your Cart</span><div class="qty">3</div></a><di

23、v class="cart-dropdown"><div class="cart-list"><div class="product-widget"><div class="product-img"><imgsrc="./img/book1.jpg"alt=""></div><div class="product-body"><h3class="product-n

24、ame"><ahref="#">product name goes here</a></h3><h4 class="product-price"><spanclass="qty">1x</span>$980.00</h4></div><button class="delete"><i class="fafa-close"></i></butto

25、n></div><div class="product-widget"><div class="product-img"><imgsrc="./img/book2.jpg"alt=""></div><div class="product-body"><h3class="product-name"><ahref="#">product name goes h

26、ere</a></h3><h4 class="product-price"><spanclass="qty">3x</span>$980.00</h4></div><button class="delete"><i class="fafa-close"></i></button></div></div><div class="cart-summa

27、ry"><small>3 Item(s) selected</small><h5>SUBTOTAL: $2940.00</h5></div><div class="cart-btns"><a href="#">View Cart</a><ahref="#">Checkout<iclass="fafa-arrow-circle-right"></i></a>&

28、lt;/div></div></div><!- /Cart -><!-Toogle -><div class="-toggle"><a href="#"><i class="fa fa-bars"></i>1)2)3)網(wǎng)頁 title 優(yōu)化的選取元以及網(wǎng)頁描述的優(yōu)化,meta的 description 和 robots4)5)網(wǎng)頁結(jié)構(gòu)和 URL 優(yōu)化,采用三層目錄,合理的 html 命名規(guī)范網(wǎng)頁優(yōu)化,采用錨文字,合理的 html 命名

29、規(guī)范6)Heading的優(yōu)化,合理使用 H1<span></span></a></div><!- /Toogle -></div></div><!- /ACCOUNT -></div><!- row -></div><!- container -></div><!- /MAIN HEADER -></header><!- /HEADER ->7)圖片優(yōu)化,設(shè)置了 alt 并且合理使用 URL 文件命名8)

30、網(wǎng)頁減肥,js 文件封裝2. 所選取兩種中文分詞工具的名稱,它們的實(shí)現(xiàn)原理及相關(guān)算法說明(可采用表格形式),使用這兩種分詞工具對朱自清的荷塘月色一文進(jìn)行分詞的結(jié)果及比較分析。這 幾天 心里 頗 不 寧靜 。 今晚 在 院子 里 坐 著 乘涼 , 忽然 想起 日日 走過 的荷塘 , 在 這 滿月 的 光里 , 總該 另 有 一番 樣子 吧 。 月亮 漸漸 地 升高 了 , 墻外 馬路上 孩子 們 的 歡笑 , 已經(jīng) 聽不見 了 ; 妻在 屋里 拍 著 閏兒 , 迷迷糊糊 地 哼 著 眠 歌 。 我 悄悄地 披 了 大衫 , 帶上 門 出去 。沿著 荷塘 , 是 一條 曲折 的 小 煤屑 路 。

31、這是 一條 幽僻 的 路 ; 白天 也 少人走 , 夜晚 更加 寂寞 。 荷塘 四面 , 長著 許多 樹 , 蓊蓊郁郁 的 。 路 的 一旁 , 是 些 楊柳 , 和 一些 不 知道 名字 的 樹 。 沒有 月光 的 晚上 , 這 路上 陰森森的 , 有些 怕人 。 今晚 卻 很 好 , 雖然 月光 也 還是 淡淡的 。路上 只 我 一個 人 , 背著手 踱 著 。 這 一片 天地 好像 是; 我 也 像 超出 了 平常 的 自己 , 到 了 另 一 世界 里 。 我 愛 熱鬧 , 也 愛 冷靜 ; 愛 群居 , 也 愛 獨(dú)處 。 像 今晚 上 , 一個 人 在 這 蒼茫 的 月 下 , 什么

32、 都 可以 想 , 什么 都 可以 不想 , 便覺 是 個 自由 的 人 。 白天 里 一定 要 做 的 事 , 一定 要說 的話 , 現(xiàn)在 都 可 不理 。 這是 獨(dú)處 的 妙處 , 我且 受用 這 無邊 的 荷香 月JiebaSnownlp速度快慢準(zhǔn)確性(粗略比較)高低其他功能具有搜索引擎的分詞方式情感分析(現(xiàn)在訓(xùn)練數(shù)據(jù)主要是東西時的評價,所以對其他的一些可能效果不是很好,待解決)色 好 了 。曲曲折折 的 荷塘 上面 , 彌望 的 是 田田 的 葉子 。 葉子 出水 很 高 , 像 亭亭 的的 裙 。 層層 的 葉子 中間 , 零星 地 點(diǎn)綴著 些 白花 , 有 裊娜 地開 著 的 ,有

33、 羞澀 地 打著 朵兒 的 ; 正如 一粒 粒 的 明珠 , 又 如碧天 里 的 星星 , 又 如剛 出浴 的 美人 。 微風(fēng) 過處 , 送來 縷縷 清香 , 仿佛 遠(yuǎn)處 高 樓上 渺茫 的 歌聲似的 。這時候 葉子 與 花 也 有 一絲 的 顫動 ,像 閃電般 ,霎時 傳 過 荷塘 的 那邊 去 了 。葉子 本是 肩并肩 密密 地 挨著 ,這 便 宛然 有 了 一道 凝碧 的 波痕 。jieba 分詞:葉子 底下 是 脈脈 的 流水 , 遮住 了 , 不能 見 一些 顏色 ; 而 葉子 卻 更 見 風(fēng)致 了 。月光 如 流水 一般 ,靜靜地 瀉 在 這 一片 葉子 和 花 上 。薄薄的 青霧

34、 浮起 在 荷塘 里 。葉子 和 花 仿佛 在 牛 洗 過 一樣 ;又 像 籠 著 輕紗 的 夢 。雖然 是滿月 ,天上 卻 有 一層 淡淡的 云 ,所以 不能 朗照 ;但 我 以為 這恰 是 到 了 好處 - - 酣眠 固 不可 少 , 小睡 也 別有風(fēng)味 的 。 月光 是 隔 了 樹 照過來 的 , 高處 叢生 的 灌木 , 落下 參差 的 斑駁 的 黑影 , 峭 楞楞 如鬼 一般 ; 彎彎的 楊柳的 稀疏 的 倩影 , 卻 又 像是 畫 在 荷葉 上 。 塘 中 的 月色 并 不 均勻 ; 但 光與影 有著 和諧 的 旋律 , 如 梵婀玲 上 奏 著 的 名曲 。荷塘 的 四面 , 遠(yuǎn)遠(yuǎn)

35、近近 , 高高低低 都 是 樹 , 而 楊柳 最 多 。 這些 樹 將 一片 荷塘 重重圍住 ; 只 在 小路 一旁 , 漏著 幾段 空隙 , 像是 特為 月光 留下 的 。樹色 一例 是 陰陰的 ,乍看 像 一團(tuán) 煙霧 ;但 楊柳 的 豐姿 ,便 在 煙霧 里 也 辨得出 。 樹梢 上 隱隱約約 的 是 一帶 遠(yuǎn)山 , 只 有些 大意 罷了 。 樹 縫里 也 漏 著一兩點(diǎn) 路 燈光 , 沒精打采 的 , 是 渴睡 人 的 眼 。 這時候 最 熱鬧 的 , 要數(shù) 樹上 的 蟬聲 與 水里 的 蛙聲 ; 但 熱鬧 是 它們 的 , 我 什么 也 沒有 。忽然 想起 采蓮 的 事情 來 了 。 采

36、蓮 是 江南 的 舊俗 , 似乎 很 早就 有 , 而 六朝 時為 盛 ; 從 詩歌 里 可以 約略 知道 。 采蓮 的 是 少年 的 女子 , 她們 是 蕩著 小船 , 唱 著 艷歌 去 的 。 采蓮人 不用說 很多 , 還有 看 采蓮 的 人 。 那 是一個 熱鬧 的 季節(jié) , 也 是 一個的 季節(jié) 。 梁元帝 采蓮賦 里 說得好 : 于是 妖童媛 女 , 蕩舟 心許 ; 鷁 首 徐回 , 兼 傳羽杯 ; 欋 將 移而藻 掛 , 船欲動 而萍 開 。 爾 其 纖腰 束素 , 遷延 顧步 ; 夏始 春余 , 葉嫩 花初 , 恐沾裳而 淺笑 , 畏 傾船 而斂 裾 。可見 當(dāng)時 嬉游 的 光景

37、 了 。 這 真是 有趣 的 事 , 可惜 我們 現(xiàn)在 早已 無福消受了 。于是 又 記起 西洲 曲 里 的 句子 :采蓮 南塘 秋 , 蓮花 過 人頭 ; 低頭 弄 蓮子 , 蓮子 清如水 。 今晚 若有 采蓮人 , 這兒 的 蓮花 也 算 得 ' 過 人頭 ' 了 ; 只 不見 一些 流水 的, 是 不行 的 。這令 我 到底 惦著 江南 了 。 - - 這樣 想著 , 猛一 抬頭 , 不覺 已 是 自己 的 門前 ; 輕輕地 推 門 進(jìn)去 , 什么 聲息 也 沒有 , 妻已 睡熟 好久 了 。Snownlp 分詞這 幾 天 心里 頗 不 寧靜 。 今晚 在 院子 里 坐

38、著乘涼 , 忽然 想起 日日 走過 的荷塘 , 在 這 滿月 的光 里 , 總 該 另 有 一番 樣子 吧 。 月亮 漸漸 地 升高 了 , 墻 外 馬路 上 孩子 們 的 歡笑 , 已經(jīng) 聽 不 見 了 ; 妻 在 屋里 拍 著閏 兒 , 迷迷糊 糊 地 哼 著眠 歌 。 我 悄悄 地 披 了 大衫 , 帶 上門 出去 。沿著 荷塘 ,是 一 條 曲折 的 小 煤屑 路 。這 是 一 條 幽僻 的 路 ;白天 也少 人走 , 夜晚 更加 寂寞 。 荷塘 四面 , 長 著 許多 樹 , 蓊蓊郁郁 的 。 路 的 一旁 , 是 些 楊 柳 , 和 一些 不 知道 名字 的 樹 。 沒有 月光 的

39、 晚上 , 這路 上 陰森森的 , 有些 怕 人 。 今晚 卻 很 好 , 雖然 月光 也 還是 淡淡 的 。路上 只 我 一個 人 ,背 著 手 踱 著 。這 一 片 天地 好像 是;我 也 像 超出 了 平常 的 自己 , 到 了 另 一 世界 里 。 我 愛 熱鬧 , 也 愛 冷靜 ; 愛 群居 , 也 愛 獨(dú)處 。 像 今晚 上 , 一個 人 在 這 蒼茫 的月 下 , 什么 都 可以 想 , 什么 都 可以 不 想 , 便覺 是 個 自由 的 人 。 白天 里 一定 要 做 的 事 , 一定 要說 的 話 , 現(xiàn)在 都 可不 理 。 這 是 獨(dú)處 的 妙處 , 我且 受 用 這 無邊

40、 的 荷 香月 色 好 了 。曲 曲折 折 的 荷塘 上面 , 彌望 的 是 田田 的 葉子 。 葉子 出 水 很 高 , 像 亭亭 的的裙 。層層 的 葉子 中間 ,零星 地 點(diǎn)綴 著些 白花 ,有 裊娜 地 開 著的 , 有 羞澀 地 打 著朵 兒 的 ; 正 如 一粒粒 的 明珠 , 又 如 碧天 里 的 星星 , 又 如 剛 出浴 的 美人 。 微 風(fēng)過 處 , 送 來 縷縷 清香 , 仿佛 遠(yuǎn)處 高樓 上 渺茫的 歌聲 似 的 。 這時候 葉子 與 花 也 有 一 絲 的 顫動 , 像 閃電 般 , 霎時 傳過 荷塘 的 那 邊 去 了 。 葉子 本 是 肩 并肩 密密地 挨著 ,

41、這 便 宛然 有 了 一道 凝 碧 的 波痕 。 葉子 底下 是 脈脈 的 流水 , 遮住 了 , 不 能 見 一些 顏色 ; 而 葉子 卻 更 見 風(fēng) 致 了 。月光 如 流水 一般 , 靜靜 地瀉 在 這 一 片 葉子 和 花 上 。 薄薄的 青霧 浮 起 在荷塘 里 。葉子 和 花 仿佛 在 牛洗 過 一樣 ;又 像 籠 著 輕 紗 的 夢 。雖然 是 滿月 , 天上 卻 有 一 層 淡淡 的 云 , 所以 不 能朗 照 ; 但 我 以為 這 恰是 到 了 好處 - 酣眠 固 不可少 , 小 睡 也 別 有 風(fēng)味 的 。 月光 是 隔 了 樹照過來 的 , 高處 叢生 的 灌木 , 落

42、下 參差 的 斑駁 的 黑 影 , 峭楞 楞 如 鬼 一般 ;彎彎 的 楊 柳 的 稀疏 的 倩影 ,卻 又 像 是 畫 在 荷 葉 上 。塘 中 的月 色并 不 均 勻 ; 但 光 與 影 有著 和諧 的 旋律 , 如 梵婀 玲 上 奏 著 的 名曲 。荷塘 的 四面 , 遠(yuǎn)遠(yuǎn) 近 近 , 高高 低 低 都 是 樹 , 而 楊 柳 最 多 。 這些 樹 將一 片 荷塘 重重 圍住 ; 只 在 小路 一旁 , 漏 著 幾段 空隙 , 像 是 特為 月光 留下 的 。 樹 色 一 例 是 陰陰 的 , 乍 看 像 一 團(tuán) 煙霧 ; 但 楊 柳 的 豐姿 , 便在 煙霧 里 也 辨 得出 。 樹梢

43、 上 隱隱約約 的 是 一帶 遠(yuǎn) 山 , 只 有 些大 意 罷了 。 樹縫 里 也 漏 著 一兩點(diǎn)路 燈光 , 沒 精打 采 的 , 是 渴 睡人 的 眼 。 這時候 最 熱鬧 的 , 要 數(shù) 樹上 的蟬 聲 與水 里 的 蛙聲 ; 但 熱鬧 是 它們 的 , 我什么 也 沒有 。忽然 想起 采蓮 的 事情 來 了 。 采蓮 是 江南 的 舊俗 , 似乎 很 早 就 有 , 而 六朝 時 為 盛 ; 從 詩歌 里 可以 約 略 知道 。 采蓮 的 是 少年 的 女子 , 她們 是蕩 著 小船 , 唱 著艷 歌去 的 。 采蓮人 不用 說 很多 , 還有 看 采蓮 的 人 。 那是 一個 熱鬧

44、的 季節(jié) , 也 是 一個 的 季節(jié) 。 梁 元帝 采蓮 賦 里 說 得好 :于是 妖童 媛 女 , 蕩 舟 心 許 ; 鷁 首 徐 回 , 兼 傳 羽杯 ; 欋 將 移 而藻 掛 , 船欲動 而萍 開 。 爾 其纖 腰束 素 , 遷 延顧 步 ; 夏始 春 余 , 葉嫩 花 初 , 恐沾裳 而 淺笑 , 畏 傾 船 而斂 裾 ??梢?當(dāng)時 嬉游 的 光景 了 。 這 真是 有趣 的 事 , 可惜 我們 現(xiàn)在 早已 無 福 消受 了 。于是 又 記 起 西洲 曲 里 的 句子 :采蓮 南塘 秋 , 蓮花 過 人頭 ; 低頭 弄 蓮子 , 蓮子 清 如 水 。 今晚 若 有 采蓮人 , 這兒 的

45、 蓮花 也 算 得 ' 過 人頭 ' 了 ; 只不見 一些 流水 的 , 是 不行的 。 這 令 我 到底 惦 著 江南 了 。- 這樣 想 著 , 猛 一 抬頭 , 不覺 已 是 自己 的 門前 ; 輕輕 地 推門 進(jìn)去 , 什么 聲息 也 沒有 , 妻已 睡熟 好久 了 。import jiebafrom snownlp import SnowNLPdef loadFile(fileName):file = open(fileName,encoding="utf-8") text = for line in file.readlines(): text.

46、append(line.replace("n","")file.close() return textdef dealWithJieba(text): newText = for line in text:line = jieba._lcut(line) newText.append(line)3. PageRank 算法的完整實(shí)現(xiàn)代碼,指定網(wǎng)頁結(jié)果。1)PR(A)=0.048166 PR(B)=0.064118 PR(C)=0.043647PR(D)=0.119851關(guān)系圖中各頁面的 PageRank 值的計(jì)算return newText;def de

47、alWithSnowlp(text): newText = for line in text:s = SnowNLP(line) newText.append(s.words)return newText;if name= ' main ': fileName = "text.txt"text = loadFile(fileName) jiebaWords = dealWithJieba(text) print(jiebaWords)snownlpWords = dealWithSnowlp(text) print(snownlpWords)file1 =

48、open("jiebaText.txt","a+",encoding="utf-8") for line in jiebaWords:for words in line: file1.write(words+" ")file1.write("n") file1.close()file2 = open("snownlpTest.txt","a+",encoding="utf-8") for line in snownlpWords:for

49、 words in line: file2.write(words + " ")file2.write("n")file2.close()package .csu;public class PageRank public static void main(String args) / 定義阻尼系數(shù)double damp = 0.85;/linkij表示j節(jié)點(diǎn)指向i節(jié)點(diǎn)int link = 0, 1, 0, 0, 0, 1, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 0, 1, 1, 1, 1, 0;dou

50、ble init_pr =1,1,1,1;double pr=pagerank(link, init_pr, damp);System.out.println("第一次迭代");for (double d : pr) System.out.println(d);boolean flag = false; int max_iteration = 100; double pr0 = null;while(!flag | max_iteration>0) pr0=pagerank(link, pr, damp);for(int i=0;i<pr.length;i+)i

51、f(pri!=pr0i) break;if(i=pr.length-1) flag=true;for(int i=0;i<pr.length;i+) pri=pr0i;System.out.println("第"+(102-max_iteration)+"迭代");for (double d : pr) System.out.println(d);max_iteration-;/* 計(jì)算pagerank的函數(shù)* param link 頁面的圖* param damp 設(shè)置的阻尼系數(shù)* param linkout 每個頁面的總數(shù)*/public st

52、atic double pagerank(int link, doubleinit_pr,double damp) / 各點(diǎn)的總鏈出數(shù)量int linkOut = new intlink.length; for (int i = 0; i < link.length; i+) for (int j = 0; j < link.length; j+) linkOuti += linkji;/ 定義一個初始數(shù)組并初始化,設(shè)所有的頁面初始PR值都為1;double pr = new doublelink.length;/for(int i=0;i<link.length;i+)/p

53、ri=1.0;/計(jì)算PR(pj)/L(pj)矩陣4. 簡單主題爬蟲的完整實(shí)現(xiàn)代碼及實(shí)際爬取結(jié)果(需提供至少 10 個所抓取網(wǎng)頁的 URL和標(biāo)題)。double m = new doublelink.length; for(int i=0;i<link.length;i+)for(int j=0;j<link.length;j+) mi=new doublelink.length;for(int i = 0;i<link.length;i+)for(int j=0;j<link.length;j+)if(linkij=1)mij=init_prj/linkOutj*dam

54、p;/計(jì)算pr值for(int i=0;i<m.length;i+)for(int j=0;j<m.length;j+) pri+=mij;pri+=(1-damp)/link.length;boolean flag = false;for(int i =0;i<link.length;i+)if(pri!=init_pri) flag = true; break;return pr;import requestsfrom bs4 import BeautifulSoup import re#爬取豆瓣所有的分類頁面,并且提供每一個頁面的 URLdef getTitle(url

55、):responds =requests.get(url) responds.encoding = 'utf-8'# html 為獲得響應(yīng)的頁面內(nèi)容html = responds.text #頁面soup = BeautifulSoup(html, "lxml")# 選取頁面中的需要的 a,從而提取出其中的所有if soup.title is not None: title = soup.title.stringelse:title="" return titledef provide_url():# 以http 的get 方式請求豆瓣頁

56、面(豆瓣的分類頁面)responds = requests.get("http/") # html 為獲得響應(yīng)的頁面內(nèi)容5. Apriori 算法的完整實(shí)現(xiàn)代碼,指定購物籃數(shù)據(jù)中的頻繁項(xiàng)集和強(qiáng)關(guān)聯(lián)規(guī)則(按照置信度由高到低排序)。html = responds.text #頁面soup = BeautifulSoup(html, "lxml")result = count = 15for div in soup.find_all('div',id='main'): for a in div.find_all('a&#

57、39;):url = a.get("href")if url is None or len(url) < 4 or url0:4 != "http": continueprint(url) title=""title=getTitle(url)if title is None or title = "": continueprint(title)s = "標(biāo)題:" + title + " " + url result.append(s)count=count -1 if

58、 count = 0:breakreturn resultif name= ' main ': result = provide_url()file = open("url",'a+',encoding="utf-8") for line in result:file.writelines(line)file.close()package .csu;import java.awt.List; import java.util.ArrayList; import java.util.HashMap; impor

59、t java.util.Map; import java.util.Set;public class Apriori private String ITEM_SPLIT = ""private int SUPPORT = 4;/ 支持度閾值private double CONFIDENCE = 0.6; / 置信度閾值private String CON = "->" / 項(xiàng)之間的分隔符public String getITEM_SPLIT() return ITEM_SPLIT;public void setITEM_SPLIT(String i

60、TEM_SPLIT) ITEM_SPLIT = iTEM_SPLIT;public int getSUPPORT() return SUPPORT;public void setSUPPORT(int sUPPORT) SUPPORT = sUPPORT;public double getCONFIDENCE() return CONFIDENCE;public void setCONFIDENCE(double cONFIDENCE) CONFIDENCE = cONFIDENCE;public String getCON() return CON;public void setCON(St

61、ring cON) CON = cON;public Apriori() / TODO Auto-generated constructor stub/* * 算法主程序 * param dataList * return */public Map<String, Integer> apriori(ArrayList<String> dataList) Map<String, Integer> stepFrequentSetMap = new HashMap<>();/獲得頻繁1項(xiàng)集stepFrequentSetMap.putAll(findFr

62、equentOneSets(dataList);Map<String, Integer> frequentSetMap = new HashMap<String, Integer>();/ 頻繁項(xiàng)集frequentSetMap.putAll(stepFrequentSetMap);while (stepFrequentSetMap != null && stepFrequentSetMap.size() > 0) /根據(jù)上一項(xiàng)集找出候選集Map<String, Integer> candidateSetMap = aprioriGen(stepFrequentSetMap);/獲取項(xiàng)集Set&

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論