妳開心他就買,妳焦慮他就扔。
華爾街德溫特資本市場公司首席執行官保羅·霍汀(Paul Horting)的日常工作之壹就是利用計算機程序分析全球3.4億個微博賬戶中的消息,從而判斷人們的情緒,然後從“1”到“50”進行評分。根據評分結果,霍丁再決定如何處置手中的數百萬美元股票。
霍汀的判斷原則很簡單:如果每個人看起來都很開心,那就買;如果大家的焦慮上升,那就賣出。
這樣的招聘效果是顯著的——當年壹季度,霍婷的公司實現了7%的收益率。
案例2
國際商業機器公司(IBM)估計,這些“數據”的價值主要在於時效性。對於壹瞬間就能輸贏的華爾街來說,這個限制非常重要。曾經,2%的華爾街公司從微博等平臺收集“非正式”數據;如今,已有近壹半的企業采用了這種方法。
●“社交移動”創業公司在“大數據”行業充滿活力,與微博Twitter是合作夥伴。它分析數據,告訴廣告主什麽是合適的時間,誰是合適的用戶,發布什麽是合適的內容,深受廣告主的喜愛。
通過喬希·詹姆斯(Josh James)的Omniture(著名的網絡流量分析工具)公司,妳可以知道有多少人訪問了妳的網站,停留了多長時間——這些數據對於任何企業來說都是非常重要的。詹姆斯賣掉公司,賺了18億美元。
●微軟專家吉拉德喜歡將這些“大數據”結果形象化:他邀請客戶到辦公室,展示包含這些公司的數據地圖——有些是普通的時間線,有些像蒲公英,有些布滿氣泡,顯示這些客戶的粉絲在談論什麽話題。
●《臉書》數據分析師Jefferson的工作是建立數據分析模型,找出用戶點擊廣告的動機和方式。
處理和分析工具
用於分析大數據的工具主要包括兩個生態系統:開源和商業。
開源大數據生態系統:
1,Hadoop HDFS,HadoopMapReduce,HBase,Hive逐漸誕生,早期的Hadoop生態系統逐漸形成。
2.Hypertable是壹個替代方案。它存在於Hadoop生態系統之外,但曾經有過壹些用戶。
3、NoSQL、membase、MongoDb
商業大數據生態圈:
1,壹體化數據庫/數據倉庫:IBM Pure Data (Netezza),Oracle Exadata,SAP HANA等。
2.數據倉庫:Teradata Asterdata、EMC Greenplum、HPVertica等。
3.數據集市:QlikView、Tableau和中國的永紅數據集市。