當前位置:股票大全官網 - 資訊咨詢 - 關於數學美的思考

關於數學美的思考

閱讀後的數學之美1看到吳軍的另壹本書《數學之美》引起了很深的興趣,於是很快就把書看完了,普及了很多基礎知識,同時啟發了很多想法,感覺很爽。

我在交通大學學的是工科(雖然課不多)。小學初中高中壹路參加數學競賽,名次還不錯。所以我沒有參加中考和高考,壹路走來。我對數學有很深的感情。同時,我女朋友的大學也是數學系,我很後悔大學選了壹個我不感興趣的專業(交通大學當時允許我選任何專業,但是我沒有和父母商量就選了造船)。在看這本書的過程中,我發現了很多高中看競賽書的感受。裏面提到的概率論(不等式)、圖論、數論的很多知識是高中數學聯賽復試的重點。高中的時候學過很深,大學荒廢後就差不多忘了。書中提到的很多定理還是很貼心的。

書名叫《數學之美》,好像有點太大了。畢竟更多的是對吳軍在谷歌搜索相關工作中使用的數學模型的介紹和總結。提到的數學大多集中在概率論、圖論、數論等領域,所以題目太大。也許哈克斯是對的,也許出版社得了賣書的名。

不得不說,吳軍是個了不起的人,他的話能透露出大家的氣勢。書中不斷穿插歷史上偉大科學家和科技領域人士的故事甚至八卦。從字裏行間,我能感覺到吳軍是他們這個層次的人(即使他會自嘲說自己是二流工程師)。

書上具體型號我就不介紹了,不過我學了幾個東西(只是粗淺的知識),看完可以全部列出來。

1.在互聯網的世界裏,信息是如何量化的,信息熵是什麽?有什麽用?

2.在搜索領域,語言是如何統計的,尤其是如何通過概率模型分詞?

3.搜索引擎是如何工作的?網絡爬蟲是怎麽回事?

4.4怎麽了?PageRank?解決什麽問題?

5.密碼學和解密領域的數學模型,尤其是二戰時期各種關於解密的趣事,還有提到的電視劇《暗殺》是要抽空看的。

6.拼音輸入法的數學模型

7.自動文本分類模型

……

看完之後最大的感受就是:

1.數學模型對新技術的發展起著巨大的推動作用。

2.攻城師是壹個很棒的職業,能夠用這些知識轉化為生產力是很棒的。

3.書中提到,很多數學模型都是在不斷進化、改進、升級的,也就是說有人在不斷優化,會有更好的模型、更新的技術出現,跟上技術的發展可能更重要,否則很多人壹直在某壹點上做持續的優化,沒有意義。

但與此同時,技術在解決實際問題中發揮著巨大的作用。書中提到的各種數學模型和方法,都是為了解決人的需求或者業務需求。公司畢竟不是科研院所,所以追求通過技術直接解決用戶需求或者為業務人員和運營人員制作易用的工具間接解決用戶需求是非常重要的。可能不是技術人員認為80分就夠了,而是用戶和使用工具的用戶認為80分是壹個重要的衡量標準。

說到工具,我想起了趙昭的壹句話:妳沒有用好工具,就意味著妳沒有工具,這可能就是重點。同時,使用工具的人必須善用工具。如果不好好利用它們,那就太對不起技術了。

數學之美反思2《數學之美》,壹個工作多年的谷歌研究員眼中的數學。讓我大飽眼福的是,大學裏的數學知識竟然可以如此廣泛地應用於計算機行業。

在語音識別、翻譯和密碼學領域,有很多基於概率統計的模型和思想。當然貝葉斯公式是基礎,應用於隱馬爾可夫鏈模型和神經網絡模型。

在搜索中,概率的知識被用於壹些相關計算。在新聞分類中,利用了矩陣特征值和相似對角化的壹些知識。當然,在圖像處理中,矩陣變換可謂無處不在。另外,在識別中,還有壹些通信模型,涉及到信道、誤碼率、信息熵。

最近剛開學,就想找幾本書看看,不過最好不要太難太晦澀的。從8月到現在,由吳軍執筆,65438+2002年5月出版的《數學之美》壹直在JD.COM、亞馬遜等各大網上商城的科技類書籍排行榜上高居榜首。當然,更早發表的《潮之巔》也處於非常高的位置。我以為市場的力量應該可以幫我挑出好書,於是我從圖書館借了壹本,壹直讀到今晚才看完。

所以,我想寫點東西總結反思壹下。反正剛開完班會也沒什麽事。

寫在前面的建議:如果妳不討厭數學,我強烈推薦這本書,網上可以下載到電子版,但是感覺還是很不壹樣。

《數學美》不用多說,其實是科普讀物,針對的是受過普通高等教育的人。不需要在某個具體領域有很深的造詣就能看懂,最好懂壹點線性代數、概率統計、組合數學、信息論、計算機算法、模式識別(雖然單子那麽多,但有人看不懂也沒關系...),所以特別適合理科的人。大部分內容都和人工智能、計算機有關,不是我的專業,但是作者善於用簡潔的語言表達看似復雜的原理,所以可讀性還是很好的。

吳軍畢業於清華大學,之前就職於谷歌,之後去了騰訊。這些文章發表在谷歌黑板上,後來被重寫,所以網上下載的內容和書上的不壹樣。因為吳軍本人是研究自然語言處理和語音識別的,所以統計語言模型可能會多壹點,但我覺得這不會妨礙整本書對數學之美的展示...感覺自己收獲了很多,有了壹些知識,但更多的還是在思維方式上。作者舉了很多例子試圖讓人明白,很多看似復雜的高科技技術背後的基本原理其實是出乎意料的簡單(當然必須承認,第壹個想到這些方法的人還是很了不起的...).比如準確率很高的機器翻譯,看似是計算機能聽懂各國語言,但背後是很多大學理科學歷的人都很清楚的統計模型和概率模型;再比如拼音輸入法的數學原理。早期的研究主要集中在縮短平均編碼長度上,比如曾經流行的五筆輸入法,但今天真正實用的輸入法是拼音輸入法,冗余信息很多,編碼長度很長。筆者從信息論和市場的角度做了簡單的解釋。再比如新聞的自動分類。很多非IT領域的人可能會認為計算機可以閱讀新聞並進行分類,但實際上只是多維空間中特征向量的提取和向量角度的計算,非常非常簡單,但只要學過壹點線性代數的人肯定壹眼就能看懂...當然,完美的實現還是需要考慮很多細節和現實情況,但這不是本書的重點。數學的美在於簡單而不在於瑣碎。

除了具體的信息技術的分析,作者還花了大量的時間講述了壹些優秀人士的成長歷程,特別是將他們的成長經歷與中國學生的成長經歷進行了對比。雖然作者沒有明說,但是字裏行間都有關於中國高等教育和很多中國企業的批評。壹是教育的功利性,缺乏寬松的獨立思考環境,即使學了壹堆理論,也難以運用,自然缺乏創新成果;第二,中國企業目光短淺,大多不願意投資開發新的框架,而是享受學術界和國外企業的研究成果。

綜上所述,“數學之美”並不能真正提高妳的編程能力,也不能顯著提高妳的數學水平,但很大程度上可以讓妳跳出教科書式繁瑣細節的束縛,從更宏觀的角度去思考信息世界背後數學引擎的“運行原理”,讓人明白看似很高級很復雜的東西其實並沒有我們想象的那麽復雜,而我們所學的“枯燥”的數學卻真的可以。

看完《數學之美》,我有壹種強烈的感覺:工具壹定是先進的。數學是壹個強大的工具,計算機也是。這兩種工具的結合創造了強大的公司,如谷歌、百度、亞馬遜、阿裏、JD.COM和滕循。他們不是百年老店,卻掌握了先進的工具。

掌握先進的工具壹定會獲得競爭優勢。如果妳知道壹群軟件工程師在哪裏維護壹個更大的計算機群,不要猶豫使用他們的服務,因為這會給妳帶來優勢。於是我們使用谷歌搜索和電子郵件,在亞馬遜、JD.COM和淘寶上購物,用QQ和微博聯系朋友,使用銀行卡和網上銀行,使用交易終端在全球市場進行各種交易...

人類的歷史就是壹部工具的進化史。石器、青銅、鐵、火藥、蒸汽機、內燃機、電報、電話、電視、電腦、衛星、互聯網、工具的進步引領著文明的進步。新工具在不斷淘汰舊工具,就像互聯網視頻點播在淘汰電視,微博在淘汰報紙,電子書在淘汰紙質書。

但是有壹些古老的工具,今天人們仍然在研究和使用,甚至在上面花費大量的時間。畫筆就是這樣壹個例子。今天學習掌握毛筆這種落後的工具有什麽意義?其實我們在使用壹些落後的工具時,主要是學習它們背後的思想。書畫所蘊含的藝術審美的壹般原理,是經得起具體工具變化的考驗的。甲骨文、金文和石鼓文對空間構成的理解仍然值得現代人學習。思想工具是比物理工具更強大的工具。

工具組合起來就形成了更強大的新工具。雖然《數學之美》裏提到的馬爾可夫鏈是壹個強有力的工具,但是我從來沒有聽老師在數學課上提起過。這本書裏印象最深的例子是余弦定理和新聞分類。余弦定理是中學數學,加上壹些並不難的多維向量知識,實際上解決了計算機新聞分類的難題!

每個工具的背後都是人們對世界的理解。蒸汽機和內燃機的背後是力學的世界。在電報、電話、電視、電腦和互聯網的背後是信息世界。數學是壹種抽象的工具,是其他工具背後的工具。數學是每壹門學科成為科學必不可少的。也許有壹天人們會習慣用數學工具來分析藝術,數學是壹種語言,源於具體世界,高於具體世界。如果語言是對世界的理解和描述,數學是語言,那麽它壹定是最接近上帝的語言。看似無關緊要,卻能描述壹切。

學數學有什麽用?物理學家費曼大壹就提出了這個問題,他哥哥建議他轉到物理系。今天,這個問題已經不是問題了。數學基礎紮實的人才正在進入各行各業,比如金融。我認識壹家出版社的老板。他招應屆畢業生有壹個條件:數學好。

工具雖然好,但關鍵是要會用。最後,我們還得回到那些掌握先進工具的人身上。軟件算法工程師和計算機集群是目前壹流企業的必備設備。就像馬克壹樣。安德森說,各行各業的壹流公司都是軟件公司。優秀的軟件算法工程師是人才競爭的焦點。這樣我們就很容易理解谷歌對招聘工程師的要求了。

處理和傳遞信息的能力不斷增強是知識經濟的特征。《數學之美》展示了谷歌如何利用數學和計算機網絡帶領我們進入雲計算和大數據時代。

知識經濟時代的工作是在各自的領域進行科學研究。科學研究要大膽假設,仔細求證。科研要量化。科學研究要有對比實驗。科學研究要有數學模型。科學研究應該有實地調查。科學研究要用文獻來驗證。科學研究應該有同行評議。《數學之美》向我們介紹了自然語言分析領域的科學研究方法和過程。

任何領域都有數不清的細節。感興趣的人不僅不會被這些細節嚇倒,反而會懷著極大的興趣去研究,從而達到令人欽佩的高度。吳軍老師給我們展示了數學和算法上的這些細節,也展示了他達到的高度。值得學習。

在網上看到有人推薦吳軍博士的《數學之美》。雖然我是搞社會科學研究的,但是我壹直很尊重數學,所以我買了看。我的真實經歷,就像吳軍博士在書的後記裏說的,把我的境界提升了壹個層次。

那麽,對我來說,提高了什麽水平呢?

首先肯定是思想境界。在看這本書之前,我就知道人類對於這個世界上的事件所形成的信息集的表達方式只有兩種,壹種是數字,壹種是語言。整組實數是無限的,每個數都是唯壹的;整個世界有無限個事件,每個事件都是唯壹的,所以數學中的數集合和世界上的事件集合構成了壹壹對應的關系,所以研究數之間的關系實際上就是研究世界上事件之間的關系。語言中的概念與世界上的事件也可以有對應關系,但問題是語言中的概念集合是有限的,所以它與數的集合的對應顯然只能是部分的。

隨著計算機科學的發展,人類需要將語言處理成數字。因為計算機只能識別數字信號,所以語言的數字化成為計算機產生以來發展最快、最具創新性的領域。許多中國科學家已經成為該領域的頂級專家,如李開復和吳軍博士,他們都是傑出的科學家。在這壹點上,我感覺在計算機主導的世界裏,信息化就是數字化,最難也是最成功的數字化就是人類自然語言的數字化,因為人類的信息幾乎100%都是由語言承載和傳播的。計算機要想與人對話,成為智能機器,首先要解決的就是語言的數字化。然而,當我們在電腦上自由輸入文字,或者拿著手機說話的時候,我們並沒有意識到,那些傑出的語言科學家早已將我們的語言轉換成數字信號,通過輸入、處理、解碼,讓我們無障礙地交流和工作。

我好像覺得語言和數字的關系就是人和自然的界面。套用古希臘畢達哥拉斯學派,加上我的理解,即數是萬物之源,語言是人類之源!

吳軍博士似乎也在提高我對方法的理解。科學研究的思維方式習慣於遵循本質的、規律的、連續的思維。在語言學研究的早期,人類為了讓計算機識別語言,采用了建立語言規則和語言規則數據庫的方法,但都以失敗告終(20世紀50-70年代)。20世紀70年代後,科學家采用了語言統計模型,研究進展迅速。語言統計模型的勝利再次證明了宇宙量子模型的信念,即世界是由不連續的隨機粒子組成的,人類幾千年文明演化出來的語言系統是壹個動態的隨機概率事件。其次,物理思維已經無法逃脫牛頓經典的本質思維方法,即尋找100%確定性的規律,而信息論思維則是研究如何把握不確定的現象,運用概率統計是必由之路。第三,語言本質上是信息傳播。只有從通信模型的角度,才能真正理解計算機的功能。語言的編碼、處理、傳輸、解碼是計算機的強項,計算機永遠無法理解語言的含義。

在《數學之美》中,吳軍博士講述了他的老師、師兄弟、同事們的經歷和軼事,讓我們了解了這些世界級學者和技術精英的生活品質、鮮明個性、科學素養和管理風格。比如Jarinik對博士生的苛刻淘汰,馬庫斯對學生的慷慨,但我感覺他們有壹個共同點,就是對科學創造、頂尖人才的認可和推崇,甚至是無條件的包容。這樣的人性境界是根本,因為偉大的科學創造畢竟是人做出來的,只有在崇高的人文精神下,才能創造出頂尖的人才,壹流的科技。

放眼國內學術界,盛行的官風、腐敗、人情,與這些壹流的學術團體對科學創造的欣賞、對個人才華的包容、對科學探索的熱情相去甚遠。

看來只能寄希望於年輕壹代了。希望吳博士的數學之美能讓我們的學生初步體會到科學精英的卓越才華和情懷。