我們知道,雲計算的十年為產業轉型升級提供了歷史性機遇,但變革仍在繼續。隨著雲計算的普及,數據庫市場發生了根本性的變化,雲廠商打破了傳統商業數據庫的堡壘,成為數據庫領域的新生力量。其中,連續六年入選Gartner領導者象限的亞馬遜雲技術是其中的代表。讓我們壹起來探討壹下:亞馬遜雲技術為何能始終保持創新力?放眼雲原生時代,亞馬遜雲技術數據庫未來還有哪些更多可能?
01面對四大數據庫發展趨勢,亞馬遜雲技術打造了五大數據庫概念。
後疫情時代,多個行業的線上化、數字化運營加速,企業對數據價值挖掘的需求日益強烈。亞馬遜雲技術大中華區產品部總經理顧凡詳細介紹了四大趨勢:
首先,隨著互聯網和移動互聯網的發展,電子商務、視頻、社交網絡和旅行等新應用場景的出現,不僅數據量大,而且對數據的實時性要求很高,傳統的關系型數據庫無法滿足需求,因此推動了雲原生數據庫的出現。
二是開源數據庫的廣泛應用。
第三,應用程序的現代化對數據庫提出了更高的要求,期望數據庫具有更高的性能、可擴展性、可用性和更低的成本,使開發人員可以專註於核心業務的應用開發,而不必關註與核心業務無關的代碼。
第四,軟件架構經歷了PC、互聯網、移動互聯網,再到現在的萬物互聯時代,其中的叠代和轉型正在推動數據庫選擇的變化。
在這四大趨勢下,企業的業務量越來越大、越來越復雜,對數據庫的要求也越來越高。亞馬遜雲技術洞察客戶需求,在雲上構建數據庫產品時提出了五個概念:
壹是專庫專用,性能極致;第二,無需服務器,敏捷創新;第三是全球架構,壹鍵部署;第四是平滑遷移加速上雲;第五是AI賦能和深度融合。
經過真正的錘煉和五大數據庫概念,我們繼續賦能企業實現數字智能轉型。
顧凡表示,隨著數據的爆炸式增長以及微服務架構和DevOps的日益普及,數據庫主宰的時代已經過去。我們需要為開發人員和企業提供專門構建的工具,用於不同應用場景中的不同數據類型和不同數據訪問特征。
於是亞馬遜雲科技提出了第壹個核心數據庫概念:專用庫。在此概念下,推出了專門為關系數據、鍵值數據、文檔數據、內存數據、圖形數據、時間數據、分類帳數據、寬列等構建數據庫的產品系列。
這些數據庫產品經歷了亞馬遜內部核心業務的真正錘煉,並取得了顯著成效:
亞馬遜電子商務是甲骨文的客戶之壹。隨著亞馬遜電商的應用重構和業務量發展,亞馬遜電商決定將業務遷移至亞馬遜雲技術。超過100個團隊參與了這項龐大的遷移工作,亞馬遜電子商務采購、目錄管理、訂單執行、廣告、財務系統、錢包和視頻流等所有關鍵系統都移出了甲骨文。2019年,亞馬遜將存儲在近7500個Oracle數據庫中的75 PB內部數據遷移到亞馬遜雲技術的多個數據庫服務中,包括亞馬遜DynamoDB、亞馬遜Aurora和亞馬遜ElastiCache,因此亞馬遜電子商務成為亞馬遜雲技術在全球的“最大客戶”。
從Oracle轉換到亞馬遜雲技術後,亞馬遜電子商務節省了60%的成本,為消費者減少了40%的應用程序延遲,並減少了70%的數據庫管理支出。
以亞馬遜Aurora為例,它被稱為“亞馬遜雲技術史上增長最快的雲服務”。它具有與高端商業數據庫相當的速度和可用性,以及開源數據庫的簡單性和成本效益。亞馬遜Aurora可以讓客戶滿足“魚和熊掌兼得”的需求。
據顧凡稱,Amazon Aurora的性能是標準MySQL的5倍,吞吐量是PostgreSQL的3倍。同時,它提供高可用性,並且可用區域的高可用性(AZ)+1。全球數據庫可以完成跨區域災難恢復。它可以擴展到15個只讀副本,成本僅為商業數據庫的1/10。
醫藥公司九州通為醫藥公司和供應商提供供應鏈,為醫藥公司、供應商和消費者構建供應鏈。其B2B系統的業務特點是多讀少寫。受促銷活動和工作時間的影響,高峰和低谷之間往往有很大的差距,閱讀和寫作的比例為7: 2或8: 3。采用亞馬遜Aurora後,九州通實現了讀寫分離和按需擴容,數據庫整體性能提升5倍,TCO降低50%。它實現了跨可用性部署、負載平衡、自動故障轉移、精細監控和按需自動擴展。
根據權威機構的預測,到2022年,75%的數據庫將被部署或遷移到雲平臺。在這個過程中,亞馬遜雲技術如何通過技術幫助客戶加速雲的應用?這離不開上面提到的“專庫專用”,以下四個概念:
第二個概念是無服務器和敏捷創新。亞馬遜雲技術大中華區產品部數據產品高級經理王表示,當企業業務總有高峰和低谷時,如何按照企業80-90%的高峰業務來規劃數據庫的存儲容量和計算資源,會給應用帶來壹定的業務連續性。妥協和挑戰。因此,大多數企業根據峰值選擇數據庫的計算資源,這將造成成本的浪費。無服務器數據庫服務可以完成任意復雜的工作和自動化擴展。
Amazon DynamoDB是亞馬遜雲技術自研的無服務器數據庫。它的誕生可以追溯到2004年。當時,亞馬遜電商作為甲骨文的客戶,雖然在零售場景中對關系數據庫的需求並不頻繁,但其中70%是鍵值操作。這時,亞馬遜電子商務被迫思考:為什麽要如此大量地使用關系數據庫?我們能否設計壹個支持讀寫並可水平擴展的分布式數據庫?後來的故事大家都知道了。這個數據庫就是Amazon DynamoDB,並於2007年發表了壹篇論文,從而在業界掀起了NoSQL分布式數據庫的技術創新浪潮。
Amazon DynamoDB可以為大型應用程序提供支持,並支持亞馬遜的許多高流量網站和系統,例如亞馬遜電子商務網站和全球442個物流中心。在亞馬遜電子商務的年度黃金日,僅DynamoDB API的調用次數就達到了數萬億次,最高峰值請求達到了每秒8920萬次。因此,DynamoDB具有高吞吐量、可伸縮性、壹致性、可預測的響應延遲和高可用性等優勢。
智能可穿戴設備制造商華米科技在全球70多個國家擁有近6543.8億用戶。僅2020年上半年,其手表出貨量就超過了654.38+0.74萬臺。截至2021年2月,華米科技可穿戴設備累計記錄的步數為654.38+0.51.00萬步,累計記錄的睡眠時間為654.38+0.28億個夜晚,記錄的總心率為654.38+0.208。如此龐大的數據必須同時保證高安全性和低延遲。如何確保穩定是壹個巨大的挑戰。
DynamoDB幫助華米科技提供壹致的響應時間,在任何規模下的延遲都不超過10毫秒。華米科技健康雲的P0和P1故障減少約30%,整體服務可用性提升0.25%,系統可用性指數達到99.99%,為華為科技的全球擴張提供了有力支撐。
最新的不可服務數據庫產品是亞馬遜極光無服務器V2,它提供即時擴展能力,並真正最大限度地提高了擴展能力,在不到壹秒鐘的時間內將數百筆交易擴展到數十萬筆。與此同時,擴張期間每次調整的增量都得到非常精細的管理。如果按照峰值規劃數據庫資源,可以實現約90%的成本節約。目前,亞馬遜極光無服務器V2在世界上預覽。
第三個概念是全球架構和壹鍵式部署。在全球化的今天,如何支持全球客戶業務擴展的連續性和壹致性,並以最低的延遲將其帶給最終客戶,這對數據庫提出了新的挑戰。
亞馬遜雲技術提供了Amazon Aurora關系數據庫全局數據庫、Amazon DynamoDB、Amazon ElastiCache內存數據庫和Amazon DocumentDB文檔數據庫,這些數據庫都可以利用亞馬遜雲技術的骨幹網絡提供比互聯網更穩定的網絡支持。通過壹鍵式部署,幫助客戶實現數千公裏跨區域數據庫的災難恢復,恢復可在1分鐘左右完成,而跨區域數據復制的延遲通常小於1秒。
第四個概念是平滑遷移和加速訪問雲。目前,通過亞馬遜雲技術數據庫遷移服務,有45萬+數據庫被遷移到亞馬遜雲技術,並且這個數字每年都在增加。亞馬遜雲技術為開發者和企業提供Amazon DMS和Amazon Database Migration Service等工具進行自助式雲遷移。此外,對於遷移過程中可能需要的支持,我們可以通過專業服務團隊和合作夥伴網絡成員為客戶提供專業支持,還可以通過數據庫自由項目幫助客戶減少顧慮。
今年6月5438+065438+10月,最新產品Babel Fish for Amazon Aurora PostgreSQL正式在全球和中國上市,該產品可以加速企業向雲的遷移,並使企業能夠利用原有的技術堆棧和原有的SQL Server T-SQL人員使用雲數據庫進行創新。
第五個概念是AI賦能和深度融合。我們觀察到,ML技術為數據庫開發人員賦能,他們可以在不具備機器學習專業知識的情況下執行機器學習操作。在這種趨勢下,亞馬遜雲技術推出了Amazon Neptune,由Deep Graph Library和Amazon SageMaker驅動圖神經網絡。
今年8月,Neptune ML在中國正式投入使用,數據工程師無需掌握機器學習的技能即可直接從圖數據庫中導出數據、轉換格式、訓練模型並發布。訓練好的模型由gremlin語句調用,在數據庫中實現推理,進行欺詐檢測並推薦商品。
目前,亞馬遜雲技術在中國加速服務,自2021以來已發布60多個數據庫服務和功能。正是通過以上五大數據庫理念,亞馬遜雲科技構建了豐富的數據庫產品家族,在全球智能化發展趨勢下為企業提供更快更好的數字智能服務,釋放數據價值,並連續六年入選Gartner領導者象限,得到了行業和客戶的深度認可。