當前位置:股票大全官網 - 資訊咨詢 - 值得崇拜的三個數據分析案例

值得崇拜的三個數據分析案例

值得崇拜的三個數據分析案例

今天給大家分享三個數據分析的經典案例,主要是學習其中的思路。把它們當做故事來看,不要拘泥於文中故事的真實性。讓我簡單地對每個故事做壹個評論。

1,數據分析高手在民間。

這壹天,新上任的縣長邢去大排檔吃早飯。剛找了個板凳坐下,就聽那個壹邊忙壹邊炒油條的老胡曼說:“大家都吃好喝好。城管要來趕攤了。至少妳抓不到油條三天!”

邢縣長大吃壹驚:省衛生廳的領導最近要來視察。昨天下午,該縣決定在未來兩天開展突擊整治。這老頭怎麽今天這麽早就知道了?

這件事我沒搞明白,但另壹件事讓縣長腦袋裏的問號更大了。有壹天,他像往常壹樣去胡老頭家吃油條。沒想到,老人居然又放出消息:“師傅馬上就要上天了!誰有什麽委屈就去縣賓館等著!”

邢縣長又驚又怒。省高院工作組將於周三來清理積壓案件。這個消息是昨晚常委會上才傳達的。這個老兒怎麽這麽快就知道了?更讓他吃驚的是,這個老家夥不僅對大領導的行程了如指掌,就連絕密行動,誰要被派出所突擊檢查娛樂場所,都知道得壹清二楚。

毫無疑問,壹個不識字的老人能知道這麽多政府內部消息。肯定是某些政府工作人員保密意識差,守口如瓶。於是,他立即召開會議,嚴厲批評了董事和理事們。與會領導都低著頭,不敢出聲。

還是公安局長膽子大,問“興縣,這個老胡曼妳是親眼看到的,還是道聽途說的?”

邢縣長聲色俱厲地壹拍桌子:“我都親耳聽到了!我問妳,妳們城關派出所今晚是不是要去查娛樂城?”

公安局長壹臉尷尬,站在那裏。興縣長馬上憤怒地命令道:“妳親自去查查這老頭的背景是什麽,明天向我匯報!”“公安局長趕緊換上便裝,馬上跑到胡老頭那裏暗訪。沒想到,老家夥正在給大家發布消息:“城關鎮鎮長最近要倒黴了。大家拭目以待,不會小的..."

公安局長壹聽,非常吃驚。於是,他松了壹口氣,不好意思地笑了笑,問:“妳怎麽知道的?”妳兒子是紀委書記嗎?"

胡老笑:“我怎麽知道?那個孫子以前經常吃我的油條,但是他總是讓司機開專車去買。這兩天,他竟然自己走著去吃它們,總是壹臉愁容。那年他父親去世的時候,他從來沒有這麽難受過。除了失去官職,還有什麽能讓那個孫子比死去的父親更難受?”

主任壹聽,暗暗吃驚。這位老人真的有兩個兒子。於是他悄悄繼續問:“妳怎麽知道昨天派出所檢查了娛樂城?”

老胡曼又笑了:“妳沒看見那些娛樂中心壹大早就掛出了停業整頓的牌子嗎?人家有眼線,新聞比那個好看!”

“妳怎麽知道衛生廳領導來視察了?”

老胡曼說:“除了從上面檢查,妳什麽時候見過灑水車出來?”。

最後,局長問了壹個他最想不通的問題:“上次省高院工作組來指導工作,妳們怎麽這麽快就得到消息?”

老胡撇著嘴說:“這容易些。鄰居家有個案子,法院拖了八年。那天,辦案的法官突然主動來訪,微笑著問問題,反復承諾馬上破案。這不是明擺著上面有人來,怕他們上訪嘛!”

局長佩服之余,小跑著回去把情況匯報給了興縣。縣長壹聽,大發脾氣,馬上又召集會議,訓話四個小時:“同誌們,壹個油條匠,從壹些簡單的現象就能看出我們的工作動向。這是什麽意思?說明我們形式主義太多了。如果這種陋習不改,政府的形象又如何提升呢?從今天起,如果再有哪個部門因為這個原因泄密,讓老頭子‘知諭’,我就不客氣了!”

第二天早上,邢縣長又來到胡老頭家吃油條,試圖驗證會議的效果。沒想到胡先生又放出了最新消息:“今天會有壹個大領導從上面下來,而且不止壹個!”

邢縣長壹驚,真是非同小可。下午,市長將陪同省領導視察工作。他昨晚才得到通知。為什麽老人會提前知道?

邢縣令壓住怒火,問老:“妳說要來大領導的事有多大?”

老胡頭也不擡地回答:“反正比縣長大!”

邢縣長又問:“妳說來的不止壹個人。妳能告訴我確切的數字嗎?妳要來幾個人?”

老胡曼擡起頭想了壹會兒,肯定地回答:“四個!”

興遠縣縣長目瞪口呆,上級領導要來四個!他的心怦怦直跳,他問,“胡...胡大師,妳是怎麽知道這些事情的?而且我知道得如此準確。”

老胡淡淡壹笑:“這還不容易?早上從地攤出來,看到縣城賓館的保安都戴著白手套,壹個個都很緊張。他們壹定是從上面來的。看看停車場。書記和縣長的車都停在角落裏。他們肯定比他們的神仙大。仔細看看。書記和縣長停車的車位是5號和6號,也就是說上面有四個領導。妳信不信?做官和做普通人不壹樣。上廁所要講究個層次和順序!”

興縣長聽著,滿嘴油條的嘴張著,壹動不動,好像僵了……

(這個故事來自網絡)

啟示:

與其說專家來自民間,不如說生活是我們數據分析的基礎素材。善於觀察和整理相關信息,是我們作為數據分析師應該掌握的基本功。但是,很多人忽略了身邊的生活常識,不去想。就像網上的這個全國離婚率排名數據,很多人首先感嘆這個世界變得越來越糟糕,而不是去思考數據的準確性。

妳想想,在妳的生活圈裏,每3對夫妻就有1對離婚夫妻?如果答案是“是”,我只能說妳的圈子真的很亂!哈哈哈

2.林彪的數據挖掘技巧。

1948遼沈戰役開始後,東北野戰軍前方指揮所每天晚上都要舉行例行的“每日軍情匯報會”:值班人員通過廣播宣讀下屬縱隊、師、團上報的每日戰鬥情況和俘虜情況。

幾乎是在重復同樣無聊的數據:每個單位消滅了多少敵人,俘虜了多少人;繳獲了多少槍支、車輛、槍支和物資...

林彪司令員的要求很詳細。俘虜要區分官兵,繳獲的槍支要清點機槍、長槍、短槍。銷毀、扣押還能使用的汽車,也要分大小、分類別。

經過壹天緊張的作戰指揮,人們都很疲憊。估計只有制定這個規定的林彪司令和看電報的倒黴參謀在關註。

1948 10 6月14日,東北野戰軍僅用30個小時就攻克了對手認為可以長期堅守的錦州,殲滅守敵十余萬。不顧疲勞,壹路向北,在遼西與來自沈陽的二十余萬精銳廖耀湘團相遇,壹度形成混戰。戰局瞬息萬變,很難預測誰勝誰負。

在戰爭的緊急關頭,無論林彪有多忙,他仍然堅持每天晚上都要做的“功課”。壹天深夜,值班參謀正在閱讀下面某師上報的所屬部隊戰報。他們說,他們領導下的部隊遭遇了壹場小規模的遭遇戰,消滅了壹些敵人,其余的都逃跑了。和之前看的其他戰報沒有明顯區別,於是值班人員看著看著,林彪突然大喊壹聲“停!”他眼睛壹亮,問道:“妳聽到妳剛才讀到的關於胡家窩棚戰鬥被俘的消息了嗎?”

大家睡眼惺忪的臉不知所措,因為每天都有幾十場戰鬥,不都是差不多的無聊數字嗎?林彪掃視了壹周,見沒人回答,便問了三句:

“為什麽那裏繳獲的短槍和長槍的比例比其他戰役略高?”

“為什麽那裏繳獲和摧毀汽車的比率比其他戰役略高?”?

為什麽那裏的官兵被俘陣亡比例比其他戰役略高?

人們還沒來得及細想,心急的林彪司令員大步走到貼滿軍用地圖的墻邊,指著地圖上的點說:“我猜,沒有,我確定!敵人指揮所到了!”

然後林彪口授命令,追擊從胡加窩棚裏逃出來的敵人,堅決把他們打出去。各部隊要采取分割包圍的方法,把失去指揮中心後會變得混亂的幾十萬敵軍切成小塊,逐個殲滅。指揮官的命令通過無線電波發送給參戰部隊。

此時,廖耀湘慶幸自己剛剛從壹次偶然的遭遇中安全脫險,加入了自己的另壹個單位。還沒來得及休息,他就急著指示部隊盡快調整部署,為下壹階段做準備。然而好景不長。緊隨其後的人民解放軍迅速包圍了他的新總部,並拼命進攻。在漫山遍野的解放軍戰士中,人們不停地喊:“又矮又胖,白臉;金絲眼鏡湖南口音,別放了廖耀湘!”

把對方指揮官的細節想得如此精妙,又變成如此震撼人心的順口溜,壹身油膩廚師服的廖耀湘不得不從俘虜中脫穎而出,無奈地說出“我是廖耀湘”,沮喪地投降。

廖耀湘覺得不可思議的是,靠打坐隱藏起來的精益野戰司令部,這麽快就被發現並流產了。他以為是意外,不願意輸。當得知林彪是如何作出判斷的時候,這位黃埔軍校出身、曾就讀於法國著名的聖西裏爾軍校、參加過滇緬戰役的新六軍軍長說:“我被他說服了,打敗了。”

打贏這場重要戰役的關鍵因素之壹,是勝利壹方的總司令在壹次普通的午夜遭遇戰後,居然分析出了壹份戰報的數據,這份數據來自於他“從紅軍帶兵開始,他身上就有壹個小本子,上面記錄著每場戰役俘虜和殲滅敵人的數量”的過硬軍事素養。

(這個故事來自黃勇馮沃華的博客)

啟示:

林彪問的三個問題,其實都是基於自己的數據庫進行對比、細分和溯源。我們很多人把數據分析完全交給機器,忘記了我們自己的大腦也是壹臺嚴密的數據分析機器。

數據積累、數據挖掘、分析、歸納、整理是數據分析師必須具備的基本素質。沒有它,妳永遠是勇敢的。

3.蛋撻和曼城隊

2011夏天,曼城助理教練大衛-普拉特決定用數據分析來解決球隊表現中的壹個棘手問題。普拉特發現,球隊陣容中雖然有很多高大強壯的球員,但他們的角球都不盡如人意。

在咨詢了俱樂部內部數據分析師後,球隊增加了內部角球的使用(球轉向門將的方向)。戰術轉變產生了驚人的效果。整個賽季,曼城以15的角球進球成為英超角球進球效率最高的球隊,其中2/3的進球來自內角。

這種做法為數據驅動的決策提供了強有力的支持。然而,還有壹個額外的因素需要考慮:主教練曼奇尼最初對這些數據的實際價值持懷疑態度。其實早在兩年前,曼奇尼就已經向俱樂部的數據分析師咨詢過角球的使用問題。這位分析師回應說,他憑直覺更喜歡的戰術——外部角球(球飛離門將)在統計上並不理想。

曼奇尼選擇相信自己的直覺,而不是數據分析的指導性建議。因為直覺告訴他,球旋轉遠離門將,降低了門將觸球的概率,增加了進攻者在頭球攻門時贏得頭球的概率。但當曼奇尼發現這兩個變量之間存在某種聯系時,直覺模糊了他判斷兩者相關程度的能力。換句話說,外角球和進球數之間可能存在壹定的相關性,但數據顯示內角球和進球數之間存在更直接的因果關系。

這個案例研究給我們提升經營決策帶來了哪些啟示?壹家美國零售商最近發現,兩個不同的變量之間存在有趣的聯系。天氣變冷的時候,肉桂葡萄牙蛋撻的銷量增加了500%——不是所有的葡萄牙蛋撻,而是肉桂。面對這樣零星的數據,零售商不得不做出選擇。每當預測天氣要轉冷的時候,應該儲備多少肉桂葡萄牙蛋撻?另壹家零售商發現,山羊奶酪的折扣似乎促進了紅酒的銷售。當妳想減少紅酒的庫存時,是否應該考慮山羊奶酪打折的方法?

這兩個問題的答案取決於大數據分析的核心問題:搞清楚相關性和因果性的區別。人類善於發現事物的相關性——這是進化的特點——但在發現直接相關的事物之間的關系上有點笨拙。把相關性曲解為因果關系而做出的決策是危險的,可能會遭遇慘敗,因為妳所期待的影響可能不會發生。

最近的壹項研究表明,某個國家的巧克力銷量與諾貝爾獎的人均比例有明顯的相關性。是不是所有國家都應該鼓勵公民增加巧克力的消費來增加獲得諾貝爾獎的人數?

為了有效利用大數據,相關性分析應該僅被認為是壹個起點。如果兩個變量有關聯,我們該怎麽辦?當然,政府在推行“巧克力另類教育”政策前,應先考慮其他因素。比如我們看那些諾貝爾獎獲得者數量多的國家的相對教育水平和科研預算,相比於巧克力消費,這兩個變量與獲得諾貝爾獎的因果關系顯然更大。

同樣,葡萄牙蛋撻和山羊奶酪的零售商需要在完全確定之前測試他們的假設。比如,在確定因果關系存在之前,調查部分店鋪肉桂葡萄牙蛋撻的“庫存積壓”;或者打折賣山羊奶酪,看看紅酒銷量是否真的增加。

事物之間可能存在壹些簡單的因果關系,但公司需要明確的是,每壹種因果關系都可能產生意想不到的結果。肉桂葡萄牙蛋撻銷量的增加是否意味著其他產品銷量的減少?紅酒銷量增加是否也意味著啤酒銷量減少或者牛排銷量增加?影響現代供應鏈的因素有很多,而且越來越多:天氣、社交媒體、特殊商品、食品安全新聞等。,所有這些都會影響消費者的行為以及零售商應該購買多少庫存。這基本上是壹個混沌系統,完全準確地預測未來會發生什麽是不可能的。但是模型越完善,預測就越準確,預測越準確,行動結果就越好。

數據分析就像壹幅印象派油畫。當妳退後壹步,從整體上看每壹個部分,這幅畫的意境就開始顯現出來,細看是無法理解其內涵的。這可以幫助我們解釋為什麽曼城的新角球戰術在很長壹段時間內都不太可能取得好的效果。實施壹個簡單的戰術變化,從外旋角球到內旋角球:多開內旋球,少開外旋球。這種簡單的戰術變化也會忽略每場比賽中每次有進球機會時的壹些獨特變量。

(這部分來源:商業價值)

結尾:

很多人認為數據分析非常困難。事實上,數據分析存在於我們生活和工作的每壹個角落。給妳幾個建議:

1,多觀察,好積累,勤思考。

2.不懂業務就不要做數據分析。

3.不要貪分析工具,精通1-2工具即可。

4.數據分析是良心工程(自我理解)