




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1/1數(shù)學之美讀書筆記
數(shù)學中有個很有意思的東西,他的名字叫莫比烏斯環(huán),為什么說他很有意思呢?下面是xx精心收集的,希望能對你有所幫助。
【1】
最近看了這本《數(shù)學之美》,不得不感嘆一句,可惜早已身不在起點。
我讀書的時候,數(shù)學成績一直都很好,雖然離開學校已經(jīng)10多年,自覺當初的知識還是記得很多,6~7年前再考線性代數(shù)和概率論,還是得到了很高的分數(shù)。不過我也和大部分人一樣,覺得數(shù)學沒有太多用處,特別是高中和大學里面學的,那些三角函數(shù),向量,大數(shù)定律,解析幾何,除了在考試的題目里面用一下,平時又有什么地方可以用呢?
看了《數(shù)學之美》,驚嘆于數(shù)學的浩瀚和簡單,說它浩瀚,是因為它的分支涵蓋了科學的方方面面,是所有科學的理論基礎(chǔ),說它簡單,無論多復雜的問題,最后總結(jié)的數(shù)學公式都簡單到只有區(qū)區(qū)幾個符號和字母。
這本書介紹數(shù)學理論在互聯(lián)網(wǎng)上的運用,平時我們在使用互聯(lián)網(wǎng)搜索或者翻譯功能的時候,時常會感嘆電腦對自己的了解和它的聰明,其實背后的原理就是一個個精美的算法和大量數(shù)據(jù)的訓練。那些或者熟悉或者陌生的數(shù)學知識(聯(lián)合概率分布,維特比算法,期望最大化,貝葉斯網(wǎng)絡(luò),隱形馬爾可夫鏈,余弦定律,etc),一步步構(gòu)建了我們現(xiàn)在所賴以生存的網(wǎng)上世界。
之所以覺得自己早已身不在起點,是因為上面這些數(shù)學知識,早已經(jīng)不在我的知識框架之內(nèi),就算曾經(jīng)學過,也不過是囫圇吞棗一樣的強記硬背,沒有領(lǐng)會過其中的真正意義。而今天想重頭在來學一次,其實已經(jīng)不可能了。且不說要花費多少的精力和時間,還需要的是領(lǐng)悟力。而這一些,已經(jīng)不是我可以簡單付出的。
不像物理、化學需要復雜的實驗來驗證,很多數(shù)學的證明,幾乎只要有一顆聰明的頭腦和無數(shù)的草稿紙,可是光是這顆聰明的頭腦,就可以阻攔掉很多人。有人說多讀書就會聰明,我不否認,書本的確會提供很多知識,可是不同的人讀同一本書也會有不同的收貨,這就限制于每個人的知識框架和認知水平。就如一個數(shù)學功底好過我的人,看這本書,就會更容易理解里面的公式和推導出這些公式的其他運用點,而我,只能站在數(shù)學的門口,感嘆一句,它真的好美吧。
當然,我暫時無法在實際生活中運用這些數(shù)學公式,可是書中提到的一些方法論,還是很有幫助的
1)一個產(chǎn)業(yè)的顛覆或者創(chuàng)新,大部分來自于外部的力量,比如用統(tǒng)計學原理做自然語言處理。
2)基礎(chǔ)知識和基礎(chǔ)數(shù)據(jù)是很重要性,只有足夠多和足夠廣的數(shù)據(jù),才可以提供有效的分析,和驗證分析方法的好壞。
3)先幫用戶解決80%的問題,在慢慢解決剩下的20%的問題;
4)不要等一個東西完美了,才發(fā)布;
5)簡單是美,堅持選擇簡單的.做法,這樣會容易解釋每一個步驟和方法背后的道理,也便于查錯。
6)正確的模型也可能受噪音干擾,而顯得不準確;這時不應(yīng)該用一種湊合的修正方法加以彌補,而是要找到噪音的根源,從根本上修正它。
7)一個人想要在自己的領(lǐng)域做到世界一流,他的周圍必須有非常多的一流人物。
【2】
讀完本書,第一感受:次奧!原來數(shù)學如此多的原理模型概念都可以用去解決各種IT技術(shù)問題啊。特別是語言識別和自然語言處理這類問題完全就是建立在數(shù)學原理之上的??傊?,這本書就是用非常深入淺出的話去說明如何用數(shù)學方法去解決計算機的各種工程問題。這是一本講道,而不是術(shù)的書。要完全讀懂這本書,我覺得至少需要掌握這三門課:高等數(shù)學,離散數(shù)學,還有概率論與數(shù)理統(tǒng)計。唉..我當初數(shù)學學得太水了,還掛了高數(shù)啊...有好的概念沒看懂,以后有時間在好好看吧。如果想搞計算機研究的話,數(shù)學基礎(chǔ)必不可少,別總在抱怨各種數(shù)學課上的東西一輩子都用不著。
發(fā)現(xiàn)作者對人類自然發(fā)展的認識非常深,其從語言,文字,數(shù)學的產(chǎn)生發(fā)展,信息的傳播記錄得出了這個結(jié)論:信息的產(chǎn)生傳播接收反饋,和今天最先進的通信在原理上沒有任何差別。就算是科學上最高深的技術(shù),那也是模擬我們生活中的一些基本原理。
我們今天使用的十進制,就是我們扳手指扳了十次,就進一次位。而瑪雅文明他們數(shù)完了手指和腳指才開始進位,所以他們用的是二十進制。實際上阿拉伯數(shù)字是古印度人發(fā)明的,只是歐洲人不知道這些數(shù)字的真正發(fā)明人是古印度,而就把這功勞該給了“二道販子”阿拉伯人。
語言的數(shù)學本質(zhì)
任何一種語言都是一種編碼方式,比如我們把一個要表達的意思,通過語言一句話表達出來,就是利用編碼方式對頭腦中的信息做了一次編碼,編碼的結(jié)果就是一串文字,聽者則用這語言的解碼方法獲得說話者要表達的信息。
自然語言處理模型
計算機是很笨的,他們唯一會做的就是計算。自然語言處理在數(shù)學模型上是基于統(tǒng)計的,說一個句子是否合理,就看看他出現(xiàn)的可能性大小如何,可能性就是用概率來衡量,比如一個句子,出現(xiàn)的概率為1/10^10,另一個句子出現(xiàn)的概率為1/10^20,那么我們就可以說第一個句子比第二個句子更加合理。當然這要求有足夠的觀測值,他有大數(shù)定理在背后支持。
最早的中文分詞方法
這句話:“同學們呆在圖書館看書”,如何分詞?應(yīng)該是這樣:同學們/呆在/圖書館/看書.最先的方法是北航一老師提出的方法,就是把句子從左道右掃描一遍,遇到字典里面出現(xiàn)的詞就標示出來,遇到復合詞如(北京大學)就按照最長的分詞匹配,遇到不認識的字串就分割成單個字,于是中文的分詞就完成了。但是這只能解決78成的分詞問題,但是“像發(fā)展中國家”這種短語它是分不出來的。后來大陸用基于統(tǒng)計語言模型方法才解決了。
隱含馬可夫模型(沒這么看懂)
一直被認為是解決打多數(shù)自然語言處理問題最為快速有效的方法,大致意思是:隨機過程中各個狀態(tài)的概率分布,只與他的前一個狀態(tài)有關(guān)。比如對于天氣預報,我們只假設(shè)今天的氣溫只與昨天有關(guān)而與前天沒有關(guān)系,這雖然不完美,但是以前不好解決的問題都可以給出近視值了。
一個讓我印象深刻的觀點:
小學生和中學生其實沒有必要花那么多時間去讀書,其覺得最主要的是孩子們的社會經(jīng)驗,生活能力,和那時候樹立起來的志向,這將幫助他們一生。而中學生階段花很多時間比同伴多讀的課程,在大學以后可以用非常短的時間就可以讀完。因為在大學階段,人的理解能力要強很多,比如中學要花500小時才能搞明白的內(nèi)容,大學可能花100小時就搞定了。學習和教育是一個人一輩子的事情,很多中學成績好的人進入大學后有些就表現(xiàn)不太好了,要有不斷學習的動力才行。
余弦定理和新聞分類
我在新浪干過一年多新聞,這篇認真看了一篇,很吃驚原理cosx與新聞分析也有關(guān)系啊。google的新聞服務(wù)是由計算機自動整理分類的。而傳統(tǒng)的媒體如門戶網(wǎng)站是讓xx讀懂新聞,找到主題,再分類分級別的,真苦逼啊...計算機自動分類原理是這樣:如一篇新聞有10000個詞,組成一個萬維向量,這個向量就代表這篇新聞,可以通過某種算法表達這個新聞主題的類型,如果兩個向量的方向一致,說明對應(yīng)的新聞用詞一致,方向可用夾角表示,夾角可用余弦定理表示,所以當夾角的余弦值接近于1時,這兩篇新聞就可以歸為一類了。
沒看懂的東西:
布爾代數(shù):布爾代數(shù)把邏輯學和數(shù)學合二為一,給了我們一個全新的視角看世界...
網(wǎng)絡(luò)爬蟲的基本原來是利用了圖論的廣度優(yōu)先搜索和深度優(yōu)先搜索...
搜索引擎的結(jié)果排名用了稀疏矩陣的計算...
地圖最基本的計算是利用了有限狀態(tài)機和圖論的最短路徑...
密碼學原理,最大熵模型,拼音輸入法的數(shù)學模型,布隆過濾器,貝葉
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 勞動合同范本及審查
- 七年級人教版上冊教學設(shè)計第三課 IT新城班加羅爾教學設(shè)計
- 個人租房合同范本樣書
- 公墓購銷協(xié)議合同范本
- 內(nèi)裝箱合同范本
- 萬科電纜合同范本
- 事故二手車買賣合同范本
- 2024年廣州市天河區(qū)體育西幼兒園聘用制專任教師招聘考試真題
- 買地皮出售合同范本
- 保潔公司加盟合同范本
- DeepSeek1天開發(fā)快速入門
- 2025書記員招聘考試題庫及參考答案
- 2024-2025年第二學期數(shù)學教研組工作計劃
- 2025輔警招聘公安基礎(chǔ)知識題庫附含參考答案
- GB/T 44927-2024知識管理體系要求
- 2025年環(huán)衛(wèi)工作計劃
- 2024年07月山東省泰山財產(chǎn)保險股份有限公司2024年夏季校園招考29名工作人員筆試歷年參考題庫附帶答案詳解
- 品質(zhì)巡檢培訓課件
- 醫(yī)療器械生產(chǎn)企業(yè)并購合同
- 2025版新能源汽車充電站建設(shè)合同含政府補貼及稅收優(yōu)惠條款
- 初驗整改報告格式范文
評論
0/150
提交評論