機器學習模型可解釋性的重要性和必要性

不管妳管理的是自己的資金還是客戶的資金，只要妳在做資產管理，每壹個投資決策都意義重大。做技術分析或者基本面分析的朋友很清楚每壹個決策的細節，但是通過機器學習和深度學習建模的朋友可能會很苦惱，因為直接產生決策信號的模型可能是黑箱，很難理解為什麽模型會產生某種信號，甚至很多保守的私募基金都把模型的可解釋性放在事前的風險控制中。其實模型的可解釋性很容易實現，難點在於研究者對模型是否有深入的思考和理解。

介紹

在過去的十年裏，機器學習領域發生了巨大的變化。從壹個純粹的學術和研究領域出發，我們看到了機器學習在各個領域的廣泛應用，比如零售、科技、醫療、科學等等。在21世紀，數據科學和機器學習的重要目標已經轉變為解決實際問題和自動完成復雜任務，讓我們的生活變得更加輕松，而不僅僅是在實驗室做實驗和發表論文。機器學習、統計學或者深度學習的模型工具已經基本成型。膠囊網絡等新模式不斷被提出，但這些新模式要被業界采用還需要幾年時間。所以在工業界，數據科學或者機器學習的主要關註點更多的是應用而不是理論。這些模型能夠有效地應用於修正數據以解決實際問題是非常重要的。

機器學習模型本質上是壹種算法，它試圖從數據中學習潛在的模式和關系，而不是通過代碼建立不可改變的規則。因此，在解釋壹個模型如何在商業中運作時，總會有壹系列的挑戰。在壹些領域，尤其是金融領域，比如保險和銀行，數據科學家通常最終不得不使用更傳統、更簡單的機器學習模型(線性模型或決策樹)。原因是模型的可解釋性對企業解釋模型的每壹個決策都非常重要。但是，這通常會導致犧牲性能。復雜的模型，如集成學習和神經網絡，通常會表現出更好、更準確的性能(因為真實的關系在自然界中很少能被線性劃分)，然而，我們最終無法對模型的決策做出恰當的解釋。為了解決和討論這些差距，在本文中，我將著重闡述模型可解釋性的重要性和必要性。

動機

作為壹個在企業工作，經常指導別人的數據科學家，我發現數據科學仍然經常被認為是壹個黑匣子，它可以用“魔法”或“煉金術”提供人們想要的東西。然而，殘酷的現實是，如果沒有對模型的合理和充分的解釋，現實世界的項目很少會成功。如今，數據科學家為企業構建模型並提供解決方案。企業可能不知道模型實現的復雜細節，但他們不得不依賴這些模型來做出決策。他們確實有權利問這樣的問題:“我怎麽能相信妳的模式？”或者“妳的模型是怎麽做決策的”？回答這些問題是數據科學從業者和研究人員多年來壹直在嘗試的事情。

數據科學家知道，在模型可解釋性和模型性能之間有壹個權衡。在這裏，模型性能不是運行時間或執行性能，而是模型在進行預測時的準確性。有幾種模型(包括簡單的線性模型，甚至基於樹的模型)，它們的預測原理很容易直觀地理解，但它們需要犧牲模型性能，因為它們的結果有很高的偏差或方差(欠擬合:線性模型)或容易過擬合(基於樹的模型)。最近發展迅速的更復雜的模型，如集成模型和深度學習，通常會產生更好的預測性能，但它們被視為黑箱模型，因為很難解釋這些模型真正如何做出決策。

雖然有人說知道模型性能好就夠了，為什麽要知道背後的原理？但是，作為人類，大部分決策都是基於邏輯和推理的。因此，人工智能(AI)的決策模式無疑會受到懷疑。在許多實際情況下，有偏見的模型可能會產生真正的負面影響。這包括潛在犯罪的預測、司法量刑、信用評分、欺詐檢測、健康評估、貸款、自動駕駛等。，其中對模型的理解和解釋最為重要。數據科學家兼作家凱茜·奧尼爾(Cathy O' Neil)在她的名著《數學毀滅的武器》中也強調了這壹點。

著名學者、作家凱特·克勞福德(Kate Crawford)在NIPS 2017主題演講《偏差帶來的麻煩》中談到了機器學習中偏差的影響及其對社會的影響。

有興趣的讀者還可以看看她在《紐約時報》發表的著名文章《人工智能的白人問題》，向我們展示了機器學習應用的案例，包括圖像分類、犯罪風險預測、服務可用性等。這些應用對黑人極其不友好。如果我們想用機器學習來解決這些問題，所有這些真實世界的場景都在告訴我們模型解釋是多麽重要。

在過去的壹年裏，我看到了在解決工業問題的同時對模型解釋的需求，我也在用Python 2寫我的新書《實用機器學習》。在此期間，我有機會與DataScience.com的優秀員工互動，他們非常清楚機器學習模型中人類可解釋性的必要性和重要性。他們也壹直在積極研究解決方案，並開發了流行的python框架Skater。後面我們會深入研究滑手，在這壹系列文章中做壹些實際的模型解釋。

理解模型解釋

機器學習(尤其是深度學習)是近幾年才被廣泛采用的。因此，模型解釋作為壹個概念仍然主要是理論性和主觀性的。

任何機器學習模型都有壹個響應函數，它試圖映射和解釋自(輸入)變量和因(目標或響應)變量之間的關系和模式。

模型解釋試圖理解和解釋響應函數做出的這些決定。模型解釋的關鍵在於透明度以及人們理解模型決策的難易程度。模型解釋的三個最重要的方面解釋如下。

模型預測的主導因素是什麽？我們應該找出特征之間的相互作用，以了解哪些特征在模型的決策策略中可能是重要的。這樣就保證了模型的公平性。

為什麽模型會做出特定的決定？我們還應該能夠驗證為什麽壹些關鍵特征會在預測過程中驅動模型做出壹些決策。這就保證了模型的可靠性。

如何才能相信模型預測？我們應該能夠評估和驗證任何數據點以及模型如何做出決策。對於直接的利益相關者來說，這應該是可證明的並且容易理解的，即模型按預期運行。這保證了模型的透明性。

可解釋性是指人們(包括機器學習領域的非專家)能夠理解模型在其決策過程中做出的選擇(如何、為什麽和什麽)。

在比較模型的時候，除了模型的性能，如果壹個模型的決策比另壹個模型的決策更容易被人類理解，就說這個模型比另壹個模型更具有可解釋性。

模型解釋的重要性

在解決機器學習問題時，數據科學家通常傾向於關註模型的性能指標，比如準確率、精度和召回率(無疑，這是非常重要的！)。但是，度量只能解釋模型的部分預測決策。隨著時間的推移，由於環境中的各種因素導致的模型概念漂移，性能可能會發生變化。因此，了解是什麽讓模型做出壹些決策是極其重要的。

我們中的壹些人可能會認為這個模型已經很好了，那麽為什麽還要深入研究呢？壹定要記住，在現實世界中解決數據科學問題時，為了讓企業相信妳的模型預測和決策，他們會不停地問“我為什麽要相信妳的模型？”這是非常合理的。如果壹個人得了癌癥或者糖尿病，如果壹個人可能對社會造成風險，甚至客戶流失，妳會滿足於壹個只做預測和決策的模型嗎？也許另壹個會更好。如果我們能更多地了解模型的決策過程(為什麽和如何)，我們可能會更喜歡它。這為我們提供了更多的透明度，解釋了為什麽模型會做出壹些決定，並且在某些情況下可能會出錯，並且隨著時間的推移，它可以幫助我們對這些機器學習模型建立壹定程度的信任。

這壹部分的重點是，是時候停止把機器學習模型當作黑匣子，而不僅僅是嘗試和分析數據，還要分析模型是如何做出決策的。事實上，走向這條道路的壹些關鍵步驟是由著名的論文“我為什麽要相信妳？(解釋任何分類器的預測)”，LIME(局部可解釋模型不可知解釋)的概念是由MT Ribeiro、S. Singh和C. Guestrin在SIGKDD 2016中引入的。

他們在論文中提到了壹些值得記住的要點。

然而，理解預測背後的原因對於評估信任非常重要。如果您計劃根據預測采取行動，或者選擇是否部署新模型，信任該模型非常重要。無論人類是直接使用機器學習分類器作為工具，還是在其他產品中部署模型，都還有壹個至關重要的問題:如果用戶不信任模型或預測，他們就不會使用它們。

這是我們在本文中多次討論過的，也是決定行業內數據科學項目成功的關鍵因素之壹。這促進了模型解釋的必要性和重要性。

模型解釋方法標準

模型解釋方法的分類有具體的標準。Christoph Molnar的《可解釋的機器學習，制作黑盒模型解釋指南》提到了壹個很好的指導標準:

內在的還是事後的？內在解釋是關於使用機器學習模型，本質上是解釋性的(像線性模型、參數模型或者基於樹的模型)。事後解釋是指選擇並訓練壹個黑盒模型(集成方法或神經網絡)，並在訓練後應用可解釋的方法(特征重要性、部分依賴圖)。在我們的系列文章中，我們將更多地關註可以用事後模型解釋的方法。

是針對某個型號的還是通用的？特定於模型的解釋工具非常特定於固有的模型解釋方法，這些方法完全依賴於每個模型的能力和特征。這可以是系數、p值、與回歸模型相關的AIC分數、決策樹的規則等等。壹般的模型解釋方法仍然依賴於事後對模型的分析，在任何機器學習模型中都可以使用。它通常通過分析要素輸入和輸出對來運行。根據定義，這些方法不能訪問任何模型內部，例如權重、約束或假設。

本地還是全球？這種解釋的分類將討論解釋方法是解釋單個預測還是整個模型行為。或者範圍是否介於兩者之間？我們將盡快討論更多的本地和全球解釋。

這並不是壹套完整的標準來對可解釋的方法進行分類，因為它仍然是壹個新的領域，但它可以成為在各種方法之間進行比較和對比的壹個很好的標準。

模型解釋的範圍

我們如何定義解釋的範圍和界限？壹些有用的方面可以是模型的透明性、公平性和可靠性。局部或全局模型解釋是定義模型解釋範圍的壹種清晰的方式。

全局解釋

這是為了試圖理解“模型是如何做出預測的？”以及“模型子集如何影響模型決策？”。為了立刻理解和解釋整個模型，我們需要對它進行全局解釋。全局可解釋性是指基於完整數據集上的因變量(響應變量)和獨立特征(預測特征)之間的條件交互來解釋和理解模型決策的能力。試圖理解特性的交互和重要性通常是理解全局解釋的好步驟。當然，當試圖分析交互時，在超過兩個或三個維度之後，可視化特征變得非常困難。因此，經常查看可能影響全局知識模型預測的模塊化部件和特征子集有助於全局解釋。完整的模型結構知識、假設和約束對於全局解釋是必要的。

本地解釋

這是為了理解“為什麽模型為單個實例做出特定的決策？”以及“為什麽模型為壹組實例做出特定的決策？”。對於局部可解釋性，我們不關心模型的內部結構或假設，我們把它看作壹個黑箱。為了理解單個數據點的預測決策，我們特別關註這個數據點，並在這個點附近的特征空間中查看局部子區域，試圖根據這個局部區域來理解這個點的模型決策。局部數據分布和特征空間可能表現完全不同，並且提供比全局解釋更準確的解釋。局部可解釋的模型不可知解釋(LIME)框架是壹種很好的方法，可以用於模型不可知性的局部解釋。我們可以用全局解釋和局部解釋來解釋壹組例子的模型決策。

模型透明度

這是為了理解“從算法和特征創建模型的過程是怎樣的？”。正如我們所知，典型的機器學習模型都是關於使用算法來建立數據特征的表示，並將輸入映射到潛在的輸出(響應)。模型的透明性可以嘗試理解模型如何構建的更多技術細節以及影響其決策的因素。這可以是神經網絡的權重，CNN濾波器的權重，線性模型的系數，節點和決策樹的分割。但是，由於企業可能並不十分熟悉這些技術細節，因此嘗試用不可知的局部和全局解釋方法來解釋模型決策，有助於顯示模型的透明性。

結論

對於現實世界的機器學習項目來說，模型可解釋性是壹件非常重要的事情。讓我們嘗試研究人類可解釋的機器學習，讓大家打開機器學習模型的黑匣子，幫助人們增加對模型決策的信任。

寫在最後:模型解讀很重要，可以加深我們對模型的信心，尤其是在金融市場，當模型持續撤退的時候，信心比黃金更重要。之前，壹個私募股權團隊使用了StockRanker策略，但為時已晚，無法提出確定的報價。後來搞清楚了模型的理論原理，每個步驟的細節和處理流程，終於有了壹個放心的實盤。事務所前期遇到回撤很正常，不是模型預測失敗，而是前期回撤後策略凈值開始上漲。所以，機器學習模型是可以解釋的，模型也是可以解釋的，這壹點很重要，但是需要研究者付出更多的努力。