其實一直關注我們的朋友,或許在此之前就不難推測出,華為如此鄭重的“周五之約“,應該是要發布去年HC大會中已經披露定位和規格的昇騰910芯片。
果不其然,華為輪值董事長徐直軍在上周五發布了這款屬于Ascend-max系列、號稱地表最強算力的AI芯片。一時間關于AI、關系芯片的話題又重回大眾視野,提振了社會心氣。
對于昇騰910這個名字,AI愛好者可能已經不再陌生,那么我們接下來的問題或許應該是,“周五”之后怎樣?換句話說,大家都已經從各種信息渠道了解到,這此發布的昇騰910是華為的AI大招,目前世界上最大算力的AI芯片。
但或許大家會好奇,這個大招對產業,對你我有什么價值?它的能力將如何投放給廣闊的企業智能市場需求
所以在“后周五時代”,或許有必要進入昇騰910背后,窺探這片多米諾骨牌的釋放,可能會在AI與計算產業中引發連鎖反應。首當其沖受到影響的,必然是公有云市場。
昇騰910落地后,AI之風正向何處奔涌,云計算產業會蕩起哪些漣漪?這是一個值得花費我們更多時間來思考的話題。
云與AI之變
了解昇騰910的產業價值之前,我們必須回顧云計算產業近幾年在遭遇怎樣的變化。
我們知道,從2012年到2018年,全球AI算力的需求增長了30萬倍。而今天隨著AI算力從科研與開發走向產業應用,這個曲線更加筆直地向上攀升。
深度學習為代表的第三次AI崛起,基礎技術邏輯是以某一目標訓練算法模型,然后進行推理部署,達成所期待的耦合效果。
這就意味AI應用的流程包括訓練和推理兩大部分。企業想要獲取AI技術,要么自己訓練,要么使用廠商提供已訓練好的AI能力。
而無論是AI的訓練、開發,還是能力調用、場景部署,都是建立在計算基礎上的。而且AI任務本身需求大吞吐量、高并發、高延展性的算力,所以云計算是AI效率最高、貼合方式最緊密的主要算力提供方案。
這一點帶給云計算產業本身以非常強大的變化。過去云計算的價值,更多是對已有互聯網任務進行支撐,而現在云計算成為了獲取AI能力、開發AI能力的主要載體。從“支撐”到“獲取”,這完全改變了公有云對于客戶和市場的價值。
于是我們看到,AI開始作為云計算廠商的主要增長點。今天全球云計算市場的主要趨勢,是傳統老大哥AWS正在增速放緩,今年第二季度其增速有史以來第一次低于40%。而從去年開始大規模重組整合,以一系列AI能力、AI工具,以及部署靈活性為賣點的微軟Azure,異軍突起以極快的速度成為第二,云+AI成為了微軟最賺錢的生意。為了繼續鞏固這一優勢,不久前微軟十億美元投資了OpenAI,意在與谷歌持續競爭未來的AI市場。
而以AI算法能力著稱,坐擁TPU和TensorFlow框架的谷歌云成為第三,今年谷歌預計在云計算業務營收超過80億美金,這將成為谷歌體系的最重要增長點。
而在國內市場,以AI技術著稱的百度云、華為云成為了崛起最快的兩朵云。不難看出的是,全球公有云市場中,AI正在成為當之無愧的王牌。AI能力的強弱,也在成為云增長的核心能力標準。
那么什么是云+AI的核心能力呢
從歐美云巨頭的發展軌跡看,專項AI算力、框架、能力、開發生態是構成云服務商與企業AI需求結合的四大聯接點。
而其中算力與框架,又是整個體系的支撐,是讓用戶可以自行研發AI模型的基礎,價值格外重要。比如谷歌云這兩年的快速增長,其實是以其自研的訓練用AI芯片TPU為核心戰略,再將開發社區和TensoFlow的用戶捆綁到自己的云服務中,達成短期快速增長。
而為了應對谷歌樹立的AI開發者之墻,微軟、Facebook等巨頭聯手打通旗下開發框架,并發布了ONNX等跨框架工具。
由此可見,專項訓練AI算力和開發框架,是如今構筑云計算企業未來增長點的核心。而華為發布昇騰910以及自研框架MindSpore,最直接受惠的當然就是直接應用其價值的華為云。由于業界其他云計算廠商都使用英偉達的板卡作為AI算力來源,所以華為云即將成為谷歌云之外,唯一擁有自研訓練芯片和自研框架的云服務廠商。
這意味著芯片和框架這場云+AI的國際頂層競爭里,加入了華為云的坐席。而華為云在昇騰310和邊端場景的應用布局,甚至構成了比谷歌云更加完整的全棧AI能力。這一信息背后,預示著此刻已經風起云涌的云計算產業,必將更加不平靜。
在明晰了云+AI的產業格局之后,我們需要換個角度,從企業用戶的視角看看,昇騰910與華為云的結合,到底將帶來什么價值。
針對AI訓練的暴力計算,是不可或缺的產業基石
對于AI技術的應用者來說,AI分為兩個部分,也就是大家熟知的訓練和推理。這二者之間的關系就像培養一個人。訓練就像上學接受教育,推理就是開始找工作。
每個人都知道,換下工作比較容易,學校教育上個若干年可就成本很高了。不僅是要磨練學生,更是考驗家長和老師。對于AI來說也是如此,企業用戶應用AI能力并不難,但是想要自己訓練一個專屬的深度學習模型,把AI變成自己的專有競爭力,那可就困難了。
其中最困難的一項,就是訓練專項算力不足。我們曾經采訪過一位科研界的朋友,他設計了一個深度學習應用于生物醫療領域的算法模型。但是用研究所采購的專項算力,申請一次四個月,訓練一次兩個月,出了錯誤就重來。這種算力情況,直接導致他到畢業也不可能完成研發。
大型深度學習模型訓練,是耗時、耗能、消耗算力最大的AI開發環節,但這一環節也是AI開發與創新的基礎。如果企業用戶和開發者不能獨立訓練大型模型,那么AI將永遠停留在表層應用,無法產生差異化創新與深度結合行業的應用。
而解決方案也很簡單,用徐直軍的描述,就是對AI訓練進行暴力計算。只用當AI算力強到一定程度,用不講道理的姿態碾壓數據訓練,AI才能真正被千行萬業應用,成為眾智創新的新高地。
目前來看,昇騰910芯片就符合“暴力不講道理”的這個芯片“人設”。根據公布數據,測試結果表明昇騰910算力達到了半精度 (FP16): 256 Tera-FLOPS;整數精度 (INT8) : 512 Tera-OPS。并且合規算力所需功耗僅有310W。更直接的對比是,運用在實際AI訓練任務中,在典型的ResNet-50 網絡的訓練中,昇騰910與MindSpore配合,與現有主流訓練單卡配合TensorFlow相比,顯示出接近2倍的性能提升,每秒訓練的圖片數量從965張提升到1802張。
或許我們可以說得更直白一點,華為所指的主流訓練單卡,就是英偉達的V100。事實上,目前能夠基于云服務獲取的AI訓練算力,只能來自谷歌的TPU和英偉達的V100。后者基本要通過亞馬遜的AWS來獲取。而根據英偉達方面的指摘,TPU2.0僅有V100二分之一的算力,并且限量出租。
于是我們能看到,基于云服務的AI訓練算力是十足的稀缺資源,價格昂貴且難以預約。這樣的產業條件,顯然是無法促進AI行業真正向前發展的。
而現在,昇騰910部署到華為云之后,全球開發者擁有了第三個選擇,中國公有云市場迎來了首個全棧云+AI解決方案。加之昇騰910算力比V100更強,華為云始終堅持普惠定價策略和充足能力供給,訓練這個天梯,或許真正能夠擁抱算力層的解決方案。
云服務+AI訓練算力,是一顆名副其實的產業基柱。但是通往這個基柱的走廊,過去非常狹窄——企業和開發者要忍受各種成本限制,當昇騰910接入華為云,這個走廊瞬間被拓寬,甚至打開了一條全新通衢。
從廣泛布局企業EI,到昇騰310和ModelArts的應用與生態建設,直到今天迎來昇騰910和MindSpore,華為云的產業智能化賦能能力,也迎來了質的提升。
補完AI重器,華為云凝鑄產業賦能三叉戟
順著昇騰910的產業邏輯再往下看,會發現華為云即將獻給市場的差異化能力,是全鏈條、無兼容成本的AI培育。
AI訓練算力對于云服務之所以重要,一方面是因為它本身對應著AI產業發展中的重要需求,另一方面,它也是全棧AI鏈條中極重要的上游支撐。當昇騰910被應用于華為云體系,華為云也就具備了完全基于達芬奇架構,提供從訓練、開發到場景部署和體系化應用的全面支撐。
在AI能力部署領域,華為云已經基于昇騰310芯片,提供圖像分析服務、OCR服務、視頻分析等服務,有超過50個 API基于昇騰310,日均調用量超過1億次,并且在快速增長。
在開發者使能領域,華為云基于ModelArts開發平臺,為AI開發者提供全流程的模型生產服務,打通、覆蓋了從數據獲取-模型開發-模型訓練-模型部署的全鏈條,ModelArts已經積累超過3萬名AI開發者。
在場景推理部署和簡便開發之外,開始補完大規模AI算力,以及模型訓練的頂層環節,意味著企業用戶即將可以基于華為云,完成從訓練-開發-推理-部署的全部生產到應用環節。這一鏈條的主要受益用戶,更多是自身有大量可訓練數據,并且要求AI技術滿足差異化、行業垂直化需求的企業用戶。
如果我們按照這個需求在市場中框定用戶,會發現補完昇騰910這個AI重器后,華為云即將向三類客戶提供全棧AI賦能:
1、對AI研發有重度需求的互聯網企業、高科技企業,以及有AI創新渴望的科研機構、開發者。
2、需要訓練大量數據,并進行穩固部署,對AI安全有高度要求的大型政、企、研究機構。
3、對行業AI能力有深度研發、訓練需求的傳統行業+AI場景,其中尤其以工業場景為重心。
在公有云市場競爭激烈的今天,這三種客戶很可能構成接下來華為云的企業智能三叉戟,從而撬動人工智能成為社會生產力,實現真正的普惠AI。
偉大的咖啡機:從全棧AI到普惠AI之路
以上所說,或許可以看作昇騰910芯片與華為云的短期改變與目標。如果我們把視線拉長,或許可以來回答這樣一個問題:芯片和框架這些基礎設施,挑戰如此之多,為什么華為依舊堅持要做
不知為什么,今天華為云對AI所作的一切,讓我想起了一種我們已經習以為常的設備:咖啡機。
千萬別小看這臺機器,把咖啡從研磨到煮沸、沖泡的全流程,集成在一臺設備里,是人類非常偉大的發明。它改變了咖啡原本的制作規則和制作門檻,讓咖啡隨手可得,咖啡館開遍大街小巷。
口味更多、等待時間更少、操作更簡單,咖啡機讓這種飲料真正普惠化了——甚至從一種少數人的貴族雅好,變成提高社交效率和工作效率的生產力工具。
華為云今天在做的,其實就是把研磨、沖泡等各種AI流程,集中在公有云這臺設備里。讓開發者和應用者不需要去三大街磨咖啡豆,五大街請人幫忙煮咖啡,再回家花三天三夜等待——而集成的前提,是每一項關于AI咖啡的能力必須完整。
這個完整度,也就是華為所說的全棧AI,是指包括芯片、芯片使能、訓練和推理框架和應用使能在內的全堆棧方案。具體到軟硬件體系,華為全棧AI包括:基于統一、可擴展架構的系列化昇騰芯片和IP;芯片算子庫和高度自動化算子開發工具CANN;支持端、邊、云獨立的和協同的統一訓練和推理框架MindSpore;開發者使能工具ModelArts,以及大量多層次API。
當這些能力和技術搭建成了完整可閉環的結構,華為云才可能不斷壓縮其中的過度與兼容成本,不斷迭代和提供更多能力。基于機械化高效率的AI咖啡,最終才能被端到千行萬業面前。
或許有人會好奇,在框架諸強林立的情況下,華為為什么要做自己的框架MindSpore。答案在于,MindSpore主要努力方向是開發態友好和運行態高效,并且能適應端、邊、云的不同場景。換言之MindSpore是一種強烈指向降低開發成本,提高開發成果可用性的深度學習框架,與華為云為開發者提供ModelArts平臺的思路一脈相承。
通過自研芯片降低成本,提升算力;基于開發框架和開發工具降低開發難度,提升應用效率;基于全棧架構降低兼容門檻;基于全云服務提供靈活可控、高集成度的AI基礎設施。最終的指向,是盡可能的成本壓縮與效率提升,讓AI從科研環境下的理論可用,轉化為工業生產環境下的產業可行。
徐直軍在昇騰910發布會后回答記者時明確,昇騰會像麒麟一樣走向“不歸路”。換言之,全棧全場景AI能力將會不斷迭代滾動發展,這意味著華為云將AI推向普惠的路,也是一條不達目標不會停下的路。
所以說,昇騰910真正指向的目標,是華為云的普惠AI戰略,“+智能,見未來”的決心;是用戶-云計算-AI能力之間的市場與服務重構;是AI門檻的規則改寫。
普惠AI任重路遠,山水迢遙自是題中之義。但基于華為的全棧全場景AI創造,云+AI的基礎規則已經改變。
人類這種生物,從無在技術和生產力上退后的先例和可能。