前沿文獻分享：使用圖像度量投資者情緒

讀完了這篇文章，感悟頗深，實乃結合深度學習與行為金融之佳作。其創新的投資者情緒度量，和以BW為基礎的精彩實證研究設計，從新的數據源上有力地驗證了De Long等行為金融學者的提出的噪音交易者理論中的反轉效應。精彩，精彩！

在行為金融兩大支柱中的心理學方面，投資者情緒是永恒的話題，投資者情緒的度量也隨著信息的變革不斷的發展。Baker and Wulger ( 2006 ) 時代用PCA方法從6個市場指標合成情緒拉開了投資者情緒度量的帷幕，大數據時代使用搜索引擎、財經論壇、社交媒體等多源數據中提取投資者情緒實現了更高頻的衡量。然而，Khaled Obaid (2021)等人在JFE發表的A picture is worth a thousand words: Measuring investor sentiment by combining machine learning and photos from news，提出了壹種刻畫投資者情緒的新方法——圖像信息。

1.數據來源

2.情緒指標的計算

使用TensorFlow中已經訓練好的Google Inception (v3) model可以使用CNN方法識別任何圖像並且輸出許多特征，但由於本文的目標只需要投資者情緒的消極或積極特征，因此使用 遷移學習 把該 圖像識別通用領域的知識遷移到單壹的情緒識別上 。實現的原理是(Yang et al., 2013)的方法，把Google Inception (v3) mode最後的 全連接層替換成只輸出積極或消極情緒結果2種類別 的新層，同時為了讓模型具有識別情緒的能力，用DeepSent提供的情緒圖像數據集去 訓練新的最後的全連接層 ，最後就能得到識別圖像情緒的神經網絡。

主要是機器學習領域的指標：accuracy(87.1%), recall(86.2%), precision (94.3%), and F1 (90.1%)

參考指標：1.Campos et al. (2017) 比較在DeepSent上訓練的CNN模型，提出了accuracy 78.3% - 83.0%的範圍，以此作為參考依據。；2.為了衡量在本文的目標數據集上的特定表現，隨機抽取了100張圖像並在第三方MTurk打好標簽，然後重新測試模型的分類效果，accuracy(76.0%), recall(92.8%), precision (77.1%), and F1 (84.2%)，接近You et al., (2015)的結果。

圖像分類的閾值超過50%被認為是消極情緒圖像，計算當天消極情緒圖像占當天新聞中出現的所有圖像的比例得到對圖像悲觀情緒的測度。