Arm推出Ethos-U85、Corstone-320,加速推動邊緣AI系統落地
近年來,伴隨著Transformer與大模型的發展,AI模型的普適性、多模態支持,以及模型微調效率都有了質的突破,加上低功耗的AI加速器和專用芯片被集成到終端設備中,邊緣智能正變得越來越自主和強大。
邊緣AI潛力巨大,有望助力多個領域的持續智能化演進與轉型。Arm的客戶與生態伙伴在智能家居、智能零售與智能制造等領域不斷創新,進而實現感知、決策與行動的閉環,提高自動化水平。為了加速AI系統的快速落地,Arm近日推出了全新AI微加速器Arm Ethos-U85,以及全新的智能物聯網參考設計平臺Corstone-320。
Arm物聯網事業部業務拓展副總裁馬健(Chloe Ma)介紹道,Arm為了實現AI算子延展與部署簡化,在過去十年中進行了大量投資并優化性能。
Arm在邊緣AI領域的厚積薄發
圖1:Arm賦能邊緣AI持續創新
起初,Arm聚焦在優化各類傳感器必需的嵌入式處理器上,致力于實現超低成本、低功耗和小面積,并支持控制級代碼的開發;隨著萬物互聯的發展,連接使邊緣算力和安全性變得越來越重要,該公司順勢推出了Armv8-M和Arm TrustZone等技術來增強算力與安全;當邊緣與端側AI推理需求增長, Arm在嵌入式領域引入了Armv8.1-M,Arm Helium技術使CPU能夠執行更多計算密集型的AI推理算法;緊接著,Arm又推出了業界首款 AI 微加速器 Arm Ethos NPU,來滿足更高性能和更復雜的AI工作負載。
馬健評價說:“Arm在AI時代的演進中起到了至關重要的作用。諸多基于Arm架構的邊緣AI解決方案的成功部署,讓我們更加堅信AI需要硬件和軟件之間的緊密結合。”當然,當系統變得愈加強大,其復雜度也隨之提升。軟硬件必須協同工作才能釋放AI處理的最大潛能。因此,Arm不僅聚焦處理器IP,也在軟件與工具鏈方面加強投資,確保滿足高性能邊緣AI系統的開發需求。
為了達成“軟硬件緊密結合”的目標,Arm與生態合作伙伴正齊心協力合作。據馬健介紹,目前在 Arm軟硬件計算平臺上涌現了大量創新,包括:恩智浦半導體(NXP)的i.M系列、瑞薩電子(Renesas)的RA8系列、英飛凌(Infineon)的PSoC Edge、Alif Semiconductor的Ensemble等邊緣AI芯片方案。同時,Arm也在與一系列軟件算法與工具伙伴合作,以確保為邊緣AI系統開發者提供工具和技術支持。
為了進一步推動邊緣 AI 的落地,Arm近日又更新了智能物聯產品組合,此次的新產品組合包括——全新AI微加速器Arm Ethos-U85和全新智能物聯網參考設計平臺Corstone-320。
·全新AI微加速器Arm Ethos-U85
Arm Ethos-U NPU系列是業界首款AI微加速器,英飛凌、恩智浦半導體、奇景光電(Himax)、Alif Semiconductor和Synaptics等企業均已推出搭載Ethos-U的量產芯片。全新的Arm Ethos-U85屬于Arm Ethos-U NPU系列,它為高性能邊緣AI應用帶來了四倍的性能提升,20%的能效提升,并保持了一致工具鏈,可實現無縫的開發者體驗。Arm Ethos-U85支持從128到2048個MAC單元的配置,在最高性能配置下提供4TOPs的AI算力。據介紹,Ethos-U85的目標應用場景是智能家居、零售、工業等新興邊緣AI應用場景。
圖2:Arm Ethos-U85提供卓越的神經網絡加速功能
此外,Ethos-U85增加了Transformer架構網絡的支持,這是優化大模型邊緣落地微調時間、提升模型泛化的一個關鍵特性。具體來看,Ethos-U85不僅提供卷積神經網絡(CNN)所需的權重矩陣乘的運算,還支持矩陣相乘——這是Transformer架構網絡的一個基本組成部分。基于Transformer的模型具有優異的泛化功能,它將更快地驅動新AI應用的發展。
Transformer在視覺和生成式AI用例中,比如視頻理解、圖文結合、圖像增強與生成、圖像分類和目標檢測等方面都極有價值。Transformer架構網絡的注意力機制容易利用并行計算來實現,提高硬件使用效率,這些模型能夠部署在計算資源有限的邊緣設備上。開發者可通過選用針對Transformer架構網絡優化的設計,使邊緣AI應用享有更快的推理、更優化的模型性能和可擴展性。
Ethos-U85不僅支持低功耗MCU系統中的AI加速,還支持在高性能邊緣計算系統中的應用處理器、標準操作系統和高級開發語言的部署,這種模式更有利于云原生開發和云邊端負載調度。而Arm Ethos-U85和Armv9 Cortex-A CPU的組合,可為基于應用處理器的智能物聯網平臺上運行的AI任務實現加速,給工業機器視覺、邊緣網關、可穿戴設備和消費類機器人等應用帶來高效能的邊緣推理。
·全新智能物聯網參考設計平臺Arm Corstone-320
Arm為了幫助合作伙伴簡化系統開發進而加快上市時間,還推出了最新的具備Ethos-U85的邊緣AI參考設計平臺——Arm Corstone-320。
Corstone-320包含了嵌入式處理器Cortex-M85,以及全新的Ethos-U85 NPU AI加速器。由于視覺在多模態感知中起到了關鍵作用,許多邊緣MCU和傳感器系統越來越依賴于視覺和圖像感知,Corstone-320還包含了Arm Mali-C55 ISP,以實現為視覺應用優化的低功耗系統。據悉,該參考設計針對實際工作負載開發,其參考用例包括部署在智能家居中的電池供電攝像系統,以及在工業和零售系統中的低幀率網絡攝像頭。
另外,Corstone-320參考設計還提供有安全保證的軟硬件組合,使得在此參考設計基礎上開發的合作伙伴,可順利地通過PSA Certified Level 2認證,實現對區域和全球安全標準的合規。馬健強調說:“通過Corstone-320預先集成、預先驗證的參考設計模版,Arm能幫助合作伙伴節省邊緣智能芯片的開發成本和時間。”
值得注意的是,Corstone-320不僅提供芯片計算子系統IP組合,還附帶了軟件、AI模型庫和開發工具,以實現軟件的復用。它附帶了仿真Corstone-320完整系統的Arm虛擬硬件,以及單獨的CPU和NPU的固定虛擬平臺(FVP)模型,以簡化開發并加速產品設計,支持軟硬件并行協同開發。馬健評價道,這種提供邊緣AI和智能物聯網計算子系統全套軟硬件和工具鏈的方法,使得其合作伙伴能夠在一系列性能點上,快速開發并聚焦于打造差異化價值。
助力生態伙伴加速邊緣AI設備部署
圖3:Arm助力加速邊緣AI設備部署進程
簡單易用才更適于普及推廣,隨著邊緣AI的持續擴展,物聯網生態鏈上下游的芯片與系統供應商、算法軟件開發者與集成商們越來越匯聚在Arm計算平臺。
馬健認為,是因為Arm計算平臺能提供AI從云到端、現代敏捷開發和部署流程中所需的特性和功能,實現基于量產驗證的一致架構,并采用統一工具鏈的AI轉型。包括開發者、數據科學家、學術界在內的AI研究開發社區,不僅持續受益于Arm生態系統與合作伙伴提供的豐富信息與知識,也圍繞Arm計算平臺構建日益增長的軟件和工具生態系統,以及開源軟件庫和AI框架。又得益于Arm特有的IP授權許可模式和開放生態,OEM和ODM可以有多種基于Arm架構和計算平臺的芯片與模組選擇,更靈活地開發適于最終應用的系統方案。
當下市場上邊緣用例繁多,傳統物聯網市場存在碎片化,為了更好地統一多樣化的應用要求,達到規模化效益,軟件定義和適于軟件移植的標準必不可少。全新的Ethos-U85和Corstone-320參考設計平臺,滿足了邊緣AI用例對更高性能計算的需求,為最新的AI模型、框架提供了原生支持,并沿用Arm軟件與AI開發者已經熟知的工具鏈,具有投資復用、上手容易等優勢。這些最新的產品與參考設計加入了Arm豐富的IP產品和技術組合中,使Arm技術能夠覆蓋更廣泛、多樣化的智能物聯網應用,并滿足最新邊緣AI市場的性能、成本和能效需求。
邊緣AI還將隨著大模型和生成式AI崛起,用戶體驗的持續提升、數據量激增,以及企業對數據價值的認可,將使行業經歷巨大變化,例如在設備上實現實時語言翻譯等。隨著大模型持續通過量化、剪枝和聚類技術來縮減優化模型,使大模型適于在邊緣和超級終端設備部署,大小模型云邊端結合成為未來AI產品的重要發展趨勢,也是AI應用賦能行業發展的重要方向。
馬健最后指出,邊緣部署大模型和生成式AI用例指日可待,而Arm已經為此做好準備,來挑戰物聯網與大模型、多模態AI結合的性能與效率極限。
