以下開源的人工智能應用是人工智能研究的前沿。
1.咖啡
它是賈在加州大學伯克利分校攻讀博士學位時發明的。Caffe是基於表達式架構和可擴展代碼的深度學習框架。讓它出名的是它的速度,這讓它很受研究人員和企業用戶的歡迎。據其網站介紹,僅壹個NVIDIA K40 GPU壹天就可以處理超過6000萬張圖像。它由伯克利視覺和學習中心(BVLC)管理,並由NVIDIA和亞馬遜等公司提供支持。
2.CNTK
是計算機網絡工具包的縮寫,CNTK是微軟的開源人工智能工具。它在單個CPU、單個GPU、多個GPU或多臺具有多個GPU的機器上都具有出色的性能。微軟主要用於語音識別研究,但在機器翻譯、圖像識別、圖像字幕、文本處理、語言理解、語言建模等方面都有很好的應用。
3.深度學習4j
Deeplearning4j是java虛擬機(JVM)的開源深度學習庫。它運行在分布式環境中,集成在Hadoop和Apache Spark中。這使得配置深度神經網絡成為可能,並且兼容Java、Scala等JVM語言。
4.DMTK
DMTK分布式機器學習工具包的縮寫,和CNTK壹樣,是微軟的開源人工智能工具。作為壹個為大數據設計的應用,它的目標是更快地訓練人工智能系統。它包括三個主要組件:DMTK框架、LightLDA主題模型算法和分布式(多義詞)單詞嵌入算法。為了證明自己的速度,微軟聲稱,在壹臺八集群機器上,它可以“訓練壹個主題模型,其詞匯量為654.38+000萬個主題,654.38+00萬個單詞(總* * * 654.38+00萬億個參數),並在壹個文檔中收集654.38+000億個符號”。這壹成就是其他工具無法比擬的。
5.H20
相比科研,H2O更註重為企業用戶服務AI,所以H2O有大量的企業客戶,比如第壹資本金融、思科、尼爾森卡特琳娜、PayPal、泛美等。它聲稱任何人都可以使用機器學習和預測分析的力量來解決商業問題。它可用於預測建模、風險和欺詐分析、保險分析、廣告技術、醫療保健和客戶智能。
它有兩個開源版本:標準版H2O和火花水版本,它集成在Apache Spark中。還有付費企業用戶支持。
6.象夫
它是Apache基金會的項目,Mahout是壹個開源的機器學習框架。根據其網站介紹,它有三個主要特點:壹個用於構造可擴展算法的編程環境,像Spark和H2O這樣的預制算法工具,以及壹個名為Samsara的向量數學實驗環境。使用Mahout的公司包括Adobe、埃森哲咨詢公司、Foursquare、英特爾、LinkedIn、Twitter、雅虎和許多其他公司。其網站列出了第三方的專業支持。
7.MLlib
由於速度快,Apache Spark已經成為最受歡迎的大數據處理工具。MLlib是Spark的可擴展機器學習庫。它集成了Hadoop,可以與NumPy和r互操作,包含分類、回歸、決策樹、推薦、聚類、主題建模、函數轉換、模型評估、ML流水線架構、ML持久化、生存分析、頻繁項集和序列模式挖掘、分布式線性代數和統計學等多種機器學習算法。
8.努皮克
NuPIC由Numenta管理,是壹個基於分層臨時記憶理論的開源人工智能項目。本質上,HTM試圖創造壹個計算機系統來模仿人類大腦皮層。他們的目標是創造壹種“在許多認知任務中接近或超過人類認知能力”的機器。
除了開源許可,Numenta還為NuPic提供商業許可協議,它還提供技術專利的許可。
9.OpenNN
作為壹個為開發者和研究人員設計的具有高級理解能力的人工智能,OpenNN是壹個實現神經網絡算法的c++編程庫。它的主要特性包括深層架構和快速性能。在其網站上可以找到豐富的文檔,包括解釋神經網絡基礎知識的入門教程。
10.OpenCyc
Cycorp開發的OpenCyc提供了對Cyc知識庫和常識推理引擎的訪問。它有超過239,000個條目,大約2,093,000個三元組和大約69,000個owl:它是壹種類似於鏈接到外部語義庫的名稱空間。它在豐富的領域模型、語義數據集成、文本理解、特定領域專家系統和遊戲人工智能等方面都有很好的應用。該公司還提供另外兩個版本的Cyc:壹個是科研免費但不開源,另壹個是企業免費但需要付費。
11.大羚羊2
Oryx 2基於Apache Spark和Kafka構建,是壹個專門針對大規模機器學習的應用開發框架。它采用獨特的三層λ架構。開發人員可以使用Orys 2創建新的應用程序,它也有壹些預構建的應用程序,可以用於常見的大數據任務,如協同過濾、分類、回歸和聚類。大數據工具供應商Cloudera創建了最初的Oryx 1項目,並壹直積極參與可持續發展。
12.預測
今年2月,Salesforce收購了PredictionIO,隨後在7月將平臺和商標貢獻給了Apache Foundation,後者將其列為孵化計劃。因此,當Salesforce使用PredictionIO技術來提高其機器學習能力時,效果也會出現在開源版本中。它可以幫助用戶創建壹個具有機器學習功能的預測引擎,用於部署可以實時動態查詢的Web服務。
13.SystemML
SystemML最初由IBM開發,現在是Apache大數據項目。它為高級數學運算提供了壹個高度可擴展的平臺,它的算法是用R或類似python的語法編寫的。企業壹直在使用它來跟蹤汽車維修的客戶服務,規劃機場交通,並將社交媒體數據與銀行客戶聯系起來。它可以運行在Spark或Hadoop上。
14.張量流
TensorFlow是谷歌的開源人工智能工具。它提供了壹個使用數據流圖進行數值計算的庫。它可以在許多具有單個或多個CPU和GPU的不同系統上運行,甚至可以在移動設備上運行。它具有深刻的靈活性,真正的可移植性,自動微分功能,並支持Python和c++。它的網站上有壹個非常詳細的教程列表,幫助開發人員和研究人員沈浸在使用或擴展其功能中。
15.火炬
Torch將自己描述為“壹個廣泛支持以GPU為主的機器學習算法的科學計算框架”,其特點是靈活性和速度。此外,它還可以通過軟件包方便地用於機器學習、計算機視覺、信號處理、並行處理、圖像、視頻、音頻和網絡。它依賴於壹種叫做LuaJIT的腳本語言,這種語言基於Lua。
歡迎關註~
微信微信官方賬號:IT程序員,免費提供人工智能、大數據、雲計算等資料~ ~無論妳在地球的哪個角落,歡迎妳的關註!