AI能為企業實現降本增收,但GPU價格勸退不少用戶,CPU能接手嗎?
近半年來,ChatGPT 所帶來的 AI 熱度是大家能直觀感受到的。
其實,在不那么直觀的地方,數據也在悄然發生變化:斯坦福大學發布的「2023 年 AI 指數報告」顯示,2022 年采用 AI 的公司比例自 2017 年以來翻了一番以上。這些公司報告稱,采用 AI 之后,它們實現了顯著的成本降低和收入增加。
雖然 2023 年的數據還沒出來,但僅憑被 ChatGPT 帶火的 AIGC 領域就不難推測,上述數字將在今年迎來新的拐點。AIGC 大有掀起第四次產業革命之勢。
但與此同時,這些企業在構建 AI 基礎設施方面也迎來了新的挑戰。
首先,就算力而言,AI 領域 算力需求激增和供給不足形成的矛盾在今年變得尤其激烈 ,就連 OpenAI CEO Sam Altman 都坦言自家公司正被算力短缺問題困擾,其 API 的可靠性和速度問題屢遭投訴。此外,大批公司還面臨這波需求高漲帶來的算力成本上升問題。
其次,在模型的選擇上,不少企業發現,當前討論熱度最高的 大模型其實還沒有一個成熟的商業模式 ,其安全性等方面還存在問題。以三星設備解決方案部門為例,他們在啟用 ChatGPT 不到一個月的時間內,就發生了三起數據泄露事件,這讓原本打算直接調用 OpenAI API 的企業打了退堂鼓。此外,自己訓練、部署超大模型同樣很勸退:想象一下,僅僅簡單地向一個大模型發送一次請求,可能就需要昂貴的 GPU 卡進行獨占性的運算,這是很多企業都難以承受的。
不過,話說回來,像 ChatGPT 那樣「無所不知」的超大模型真的是企業所必需的嗎?
性能與成本的艱難抉擇
如果要分析最早應用人工智能提升效益的行業,互聯網是繞不開的一個,其典型工作負載 —— 推薦系統、視覺處理、自然語言處理等 —— 的優化都離不開 AI。不過,隨著業務量的激增,他們也在性能和成本等層面面臨著不同的挑戰。
首先看 推薦系統 。
推薦系統在電子商務、社交媒體、音視頻流媒體等許多領域都有廣泛的應用。以電子商務為例,在每年的 618、雙十一等購物高峰,阿里巴巴等頭部電商企業都會面臨全球龐大客戶群發出的數億實時請求,因此他們希望滿足 AI 推理在吞吐量與時延方面的要求,同時又能確保 AI 推理精確性,保證推薦質量。
接下來看 視覺處理。
僅美團一家,我們就能找到智能圖片處理、商戶入駐證照識別、掃碼開單車、掃藥盒買藥等多個應用場景。AI 已經成為其業務版圖中很重要的一部分。不過,隨著美團業務與用戶量的高速增長,越來越多的應用需要通過視覺 AI 構建智能化流程,美團需要在保證視覺 AI 推理精度的同時,提升視覺 AI 推理的吞吐率,以支撐更多的智能化業務。
最后看 自然語言處理 。
得益于 ChatGPT 帶來的熱度,自然語言處理正獲得前所未有的市場關注與技術追蹤。作為國內 NLP 技術研究的先行者,百度已在該領域構建起完整的產品體系與技術組合。ERNIE 3.0 作為其飛槳文心?NLP 大模型的重要組成部分,也在各種 NLP 應用場景,尤其是中文自然語言理解和生成任務中展現出卓越的性能。不過,隨著 NLP 在更多行業中實現商業化落地,用戶對 ERNIE 3.0 也提出了更多細分需求,例如更高的處理效率和更廣泛的部署場景等。
所有這些問題的解決都離不開大規模的基礎設施投入,但困擾這些企業的共同問題是: 獨立 GPU 雖然可以滿足性能所需,但是成本壓力較大,因此一味擴充 GPU 規模并不是一個最佳選項 。
CPU也能搞出大模型
AMD在CES上宣布了一系列以AI為核心功能的新芯片。這些產品將人工智能功能與去年早些時候收購Xilinx時獲得的技術相結合。
公司XDNA架構中的產品具有適應性,并允許公司將人工智能“從PC擴展到智能終端、邊緣設備和云”。她補充說,加速器可以適應應用和功率效率。
同時還宣布該公司正在測試其第一款推理加速器,名為Alveo V70。它基于AMD的XDNA技術,可以插入服務器。
Alveo V70旨在加速視頻分析和客戶推薦引擎等應用程序。該卡以較小的外形尺寸提供了性能效率。該加速器每秒提供400萬億次人工智能計算性能,支持PCIe 5.0,并消耗75瓦功率。
蘇博士聲稱其Alveo V70在圖像分類和物體檢測等應用中提供了比英偉達T4 GPU加速器更好的性能。芯片制造商共享模擬到最佳條件的性能數據,以使其芯片優于競爭對手產品。真實世界的性能數字通常與供應商提供的數字非常不同。
AMD正在進行Alveo V70預購,芯片將在今年春季上市。
Alveo V70 AI芯片的核心技術也在AMD最新的筆記本電腦芯片Ryzen 7040中,該芯片在CES上發布。“這是業界第一個集成了專用片上AI引擎的移動x86處理器,我們稱之為Ryzen AI。”
Ryzen 7040芯片同時運行四個AI流,每秒提供多達12萬億次操作。該芯片有八個基于Zen 4架構的CPU內核,運行速度高達5.2GHz。該芯片采用臺積電的4nm制造工藝制造。這些芯片將用于三月份上市的筆記本電腦。
微軟首席產品官Panos Panay表示,用戶將能夠在Ryzen CPU內部的AI引擎上運行大規模模型,而只需要一小部分功率,在這之前需要GPU功率。例如,在Windows 11上提供的Windows Studio Effects中,Ryzen AI將對視頻進行增強,以減少背景模糊、改善肖像、抑制背景噪音和自動設置視頻幀。“這些體驗每秒需要數萬億次的運算……它們現在可以在AMD的AI引擎上運行,而不會對CPU或GPU造成負擔,同時只消耗100毫瓦。”
AI大模型會怎樣改變B端企業生態
從高速生成圖像和視頻到全方位增強客戶的體驗,生成式AI已經被證明是跨越各個行業的工具。
以下是我們探討出可能會使企業利用AI實現巨大增長的一些方式。
內容的極大豐富:目前的主流AI模型及其應用,能夠讓企業快速和高效的創建內容,無論是文章,圖片還是視頻,從效率和質量上都可以獲得相當好的性價比,這有利于率先采用AI的企業在擁擠的市場中脫穎而出。例如善用Stable diffusion生成高質量的圖像和圖形,能極大的提升企業自身出圖的生產效率和質量。自動化創意過程也能極大的節省時間和資源。只需要合理的提示詞+預先微調好適合自己企業的模型,企業就可以生成大量的圖像和文本,無論這些是用于內部還是用于對客戶。
加速自動化: 相當多的軟件工程AI可以有效的提升企業的工程能力,提高公司開發人員的效率。copilot這樣的ai提供了可靠的自動化支持,降低了企業內部的運營成本。很多補充功能也有利于讓沒那么經驗豐富的工程師獲得極大的能力提升。
個性化營銷:我們總說要進行個性化營銷,但最多也就做到按照有限的客戶Tag分類來進行分類營銷,并不是完全的個性化。而AI讓真正的千人千面形成了可能,提供超級個性化的營銷活動。甚至通過分析客戶的數據,可以根據用戶獨特的喜好來創建動態內容,從而優化參與度和轉化率,能提高營銷投資的回報率。
聊天機器人和虛擬助理:AI支持的聊天機器人和虛擬助理可以對客戶的查詢提供即時,準確的響應。傳統的客服機器人只能應對有限和預設的問題,而且從效果來看越來越低效。而全新的AI智能系統可以“理解”客戶的需求并提供個性化的支持,增強客戶的服務,減少等待時間,這樣可以極大的提升客戶的滿意度和忠誠度。而還有一點很重要,即完全沒有技術背景的員工和團隊也可以用ai來構建屬于自己的機器人來為自己的團隊和客戶提供服務,而這些成本會非常低。
更強大的翻譯能力:全球經濟越來越緊密的如今,語言障礙將會隨著AI的發展迅速弱化。企業可以越來越容易的面對全球客戶,無論所處的行業是電商,游戲,還是開發。曾經的翻譯模式無法很好的融合進業務本身,但生成式AI的速度和能力都遠遠超過了傳統的翻譯模式,你的交流甚至不需要預先去選擇對方的語言是什么。跨境無縫溝通會讓更多的企業更容易的全球化。
信息和網絡安全:生成式AI會讓信息安全更加快速的響應,通過分析大數據的模式,企業或組織可以迅速檢測和防止欺詐、保護敏感信息和數據資產。當然這里會有很大的挑戰,但我們有理由相信這已經是一種不可阻擋的趨勢。
準確的預測和分析:相比于傳統的數據分析系統和數據分析模式,生成式AI所帶來的預測分析方面表現更為出色。企業可以利用AI做出準確的市場預測和及時的決策,從而優化供應鏈管理、庫存和需求規劃。例如曾經需要月甚至季度才能處理的市場情形,在AI加持下可以提升到天,甚至小時級的突發情況,這極大的提升了很多傳統企業的運營效率。
學術研究:有相當多的企業(醫療,科技,工程等)擁有自己的學術研究部門或與大學合作展開的科研項目,諸多學術方面的AI模型會極大的提升科研效率,從而讓企業更快的進行研發迭代和市場投放。
以上的每一種方法都是AI可能會給B端帶來的助力,一定會有一些企業率先摸索到了AI的正確打開方式從而獲得本行業的巨大發展優勢。無論是內部流程的簡化,還是對客戶體驗的增強,數據驅動的決策和創新等等,都會提升效率,盈利能力和競爭力。而重要的是,對企業有利的事情同時也對企業服務的客戶更有利,無論是更低的成本還是更好的體驗,都會再當今快速發展的數字環境中獲得競爭優勢。
