那麽今後,爭取在這裏,養成記錄思維的習慣吧。
言歸正傳,如果妳是壹名文科生,建議妳有空嘗試閱讀這本書,它不單屬於工程師,這個世界不光有有風花雪月和雞湯狗血,還有壹些值得沈思探索的事物。
大學時期,我對股票投機產生了濃厚的興趣,天天琢磨著如何在這個近乎零和遊戲的市場中壹夜暴富,翻查了大量不知名人士的各種錦囊妙計,結果妳們也能猜到,毫無卵用。這壹切直到我閱讀到了幾本講述美國對沖基金如何運作的書籍,才恍然大悟:臥槽!
世界上最牛逼的股票市場參與者早已不再單純依賴人腦對信息的攝取和判斷來做出投資決策,他們依賴的是先進的計算機及交易模型來攫取利潤,如果妳也對這個領域有所涉獵,應該聽聞過“文藝復興技術公司”的鼎鼎大名,而這種先進交易方式的核心就是:數學。或者更貼近時代壹點,叫大數據。
吳軍先生結合自身深厚的數學功底以及長期在Google、騰訊等壹線互聯網公司的項目開發經驗,用極其簡約的語言講述了我們日常中使用的搜索、翻譯、導航、語音識別、網絡爬蟲、網頁排名與反作弊等互聯網功能的數學原理,將那些在平常人眼裏只屬於工程師和科學家的工作進行了壹次平易近人的科普,往往只用壹個數學方程便揭示了很多我們日常感覺高大上的名詞,比如“人工神經網絡”、“信息熵”、“貝葉斯網絡"等等。
於我而言,壹開始是抱著發掘興趣的心態來看的,卻不想歪打正著讀到了壹些跟自動化交易相關的內容。
和最大熵模型同樣對如今的自動化交易貢獻巨大的還有馬爾科夫鏈、貝葉斯網絡和人工神經網絡,這些數學模型與思想從上世紀90年代起逐漸進入美國的投資市場,而他們取得的成績就連伯克希爾哈撒韋這樣的公司也望塵莫及。
壹個人腦能處理的信息終歸太過有限,即使是幾名傳統基金經理的***同智慧,也難以和整個市場的能量相匹配。但是,借助於數學,以及如今強大的數據獲取與計算能力,我們就可能將數之不盡的影響因素進行量化,從而準確判斷。
另外壹個讓我思考的問題,是如何在沒有數據或僅有少量數據的情況下,訓練數學模型的參數,以及用數據促進功能叠代。因為最近工作中碰到了壹個的問題,我們手中的壹個產品開發已接近完成,但是這個產品的核心功能需要壹批數據,如果我們有足夠的用戶流量,我們就可以基於用戶的數據反饋來不斷叠代產品的核心功能,但是,由於我們產品的設計問題,如果完全依賴用戶貢獻內容(UGC)會嚴重影響用戶體驗,這是壹個冷啟動的問題。我們自己充當第壹批用戶(或雇人)去在相應場景下做UGC,成本又太大。這就迫使我思考如何在數據較少的情況下,有沒有可能利用某些算法去盡快改進產品。《數學之美》也給出了壹些“無中生有”的案例,比如幫助Google壹戰成名的PageRank算法。
最後記述兩個簡單的概念。什麽是編碼和解碼?在剛參加工作的那段時間裏,文科生出身的我對這兩個概念及其相關的問題非常頭痛,在這本書裏我找到了答案。舉個通俗的例子,我們將腦海中所想的東西用語言表達出來,這就是編碼,壹個聽我們說話的人將我們說的話吸收並在腦袋中理解,就是解碼。可能大家看起來這是壹個很平常的過程,這不是很自然的事情嗎?仔細想想,大腦中所思考的東西為什麽可以通過語言說出來,或者可以通過文字寫出來,說出來的話和寫在紙上的文字所存信息和腦海中所存信息的存在形式是完全不同的,這壹套轉化規則其實就是編碼和解碼,而英語和漢語,就是兩套不同的編碼解碼規則。同樣的,我們在打電話時,發出的聲學信息需要轉化成電信號,通過無線電傳輸至另壹方,然後再轉化成人能明白的聲信號,這也是壹次編碼和解碼的過程。而對所有形式信息的編碼與解碼,在本質上也都是數學工作。更直接的表現是,我們通過計算機鍵入信息時,最常見的方式就是打字,然而這些信息經過編碼交給計算機時,都是以二進制來存儲和傳輸的。
總體而言,數學在我們世界中的作用非常非常之大,我們日常的所有工作都離不開數學,這是我近期工作和讀書很大的壹個體會,慢慢學會培養自己的數學的興趣,積累數學的理論和知識,大概是這壹輩子都要認真做的事情了。