Group 45Created with Sketch.News 

Current Events 時事・新聞

ChatGPT熱潮的冷思考

華泰電子團隊

資料來源:新浪財經

深度學習正在逼近現有晶片的算力極限。是否擁有大模型將成為科技巨頭/科技平台企業的重要分水嶺,未來科技巨頭之間將展開大模型軍備競賽,科技公司遠期投資價值或將被重新定義。

針對最近的ChatGPT熱潮,華泰證券研究所電子團隊分析師認為:

1)科技巨頭在大模型上的競爭利好晶片送水人;

2)是否擁有大模型將成為區別科技平台企業的重要分水嶺;

3)AI企業是否能在這輪週期中找到盈利模式有待觀察;

4)晶片受限影響中國企業追趕的步伐,中國如何發揮資料及市場優勢值得期待。

核心觀點

預訓練大模型引領AI行業變革,關注AI企業盈利模式、晶片基礎設施

繼OpenAI在2022年11月發佈ChatGPT(詳見我們2022年12月9日發佈的從 ChatGPT熱議看大模型潛力)後,微軟宣佈和OpenAI公司合作推出內建ChatGPT的必應搜尋、Edge瀏覽器、Office套件及Azure,對Google等的搜尋業務形成競爭。基於大模型的AI可能成為可以替代腦力工作者勞動的新一代生產力工具。我們認為:1)科技巨頭在大模型上的競爭利好晶片送水人:2)是否擁有大模型將成為區別科技平台企業的重要分水嶺;3)AI企業是否能在這輪週期中找到盈利模式有待觀察;4)晶片受限影響中國企業追趕的步伐,中國如何發揮資料及市場優勢值得期待。

科技巨頭在大模型上競爭激化,晶片送水人是最大受益者

從輝達加快與微軟合作共建立生成式AI生態、Google和百度將分別推出類ChatGPT產品看出,是否擁有大模型將成為科技巨頭/科技平台企業的重要分水嶺,未來科技巨頭之間將展開大模型軍備競賽,科技公司遠期投資價值或將被重新定義。由於ChatGPT依賴更大的總算力消耗和千億級的參數訓練,對應更大的算力需求,我們認為ChatGPT的應用也有望推動底層基礎設施建設新增長機遇。根據OpenAI測算,目前算力的增速(翻1倍/3-4個月)遠超過摩爾定律(翻1倍/18-24個月),AI應用的逐步豐富將推動計算晶片市場(IC Insight測算21年全球1030億美金)保持強勁增長。

“AI+”還是“+AI”:大模型時代有什麼不一樣?

“AI+”(以AI技術賦能行業的科技企業)還是“+AI”(採用AI技術的傳統企業)能夠勝出是上一輪AI投資最大的爭議。從結果來看,“AI+”企業在智慧城市等特定領域獲得商業成功,但網際網路(例如Google、百度的搜尋,頭條的推薦,阿里的廣告)、金融等行業通過已有業務+AI提升了效率。我們認為上一輪“AI+”企業沒有全面成功的原因是演算法的進入壁壘相對較低。當大模型主導的創新週期到來,以GPT-3大模型為例,其需要1750億資料和數百萬、數千萬美元的算力投資,壁壘顯著提升。

晶片受限已經嚴重影響中國企業追趕速度,期待資料要素市場發揮作用

目前在算力和演算法上中國AI發展受限較多:1)此前美國對性能超過A100的計算晶片限製出口中國,而我國最先進的晶片計算性能約為A100的70%,和海外龍頭存在兩年以上的差距,AI生態建設仍處於起步階段,直接影響到大模型的速度和效率。2)OpenAI暫無中國開放註冊,我國在AI演算法和技術層面與國外相比競爭力不足。但我們認為中國企業應充分發揮國內資料資源規模大和多樣化的比較優勢,將資料作為生產要素,從而在人工智慧領域實現彎道超車,縮小與國外發展差距。

ChatGPT離AGI還有多遠?

ChatGPT是通往AGI(通用人工智慧)道路的一次躍遷,但我們離AGI仍有較遠的距離。目前圍繞使用ChatGPT等大模型的爭議不休,主要圍繞在以下方面:1)資訊真實性:大語言模型對事實和邏輯世界缺乏真正理解,生成內容的真實性和可解釋性存疑;2)資訊有害性:例如,儘管ChatGPT採用了基於人類反饋的強化學習(RLHF),以實現有害和不真實輸出的減少,但如果使用者逐步引導,ChatGPT仍然會響應有害指令;3)使用不當性:在學術界等場景使用ChatGPT並不恰當,多家頂刊已禁止生成式AI工具署名。

正文

AI行業進入大模型主導的創新週期,商業模式迎來變化

2022年以來,AIGC(AI生成內容)、ChatGPT的“出圈”顯示出預訓練大模型性能進步迅猛,行業進入大模型主導的創新週期。

本次大模型主導的創新週期相比上一輪以AI四小龍為代表的AI浪潮有何區別?首先,相比小模型,預訓練大模型演算法架構更先進,訓練消耗的資料量和算力躍升,因此泛化能力更強。此外,本輪創新週期中生成式AI大放異彩,相比上一輪AI熱潮中的圖像感知,生成式AI在許多領域成為了生產力工具。因此,AI模型價值量提升,掌握AI模型的公司在本次創新週期中變現方式也發生了變化:上一輪AI浪潮,AI公司採用小模型+軟硬結合的定製化解決方案變現,偏通用化軟體化的API和SaaS並未成為主流的變現方式。本次大模型主導的創新週期中,我們期待ToB端的API模式,以及ToC端的SaaS模式成為主流的變現手段。

AI大模型產業鏈:算力基礎設施、基礎模型研發、模型最佳化與改進、應用軟體

我們認為在大模型產業鏈各環節中,1)AI雲服務和基礎模型研發的行業壁壘高,現有玩家(主要是科技巨頭)將繼續主導市場;2)大算力晶片關注國產替代處理程序;3)依託大模型API,在美國已生長出繁榮的應用生態,期待國產大模型API同樣能夠實現資料與模型迭代的飛輪;4)ToC端的應用軟體層,美國生態繁榮,國內也出現了一些初創公司,商業模式尚需驗證。

1)算力基礎設施:AI雲服務由現有雲服務廠商提供,為AIGC提供算力服務。大算力晶片的主要玩家為輝達等海外半導體巨頭,國內廠商正在追趕。

2)基礎模型研發:高成本和高技術壁壘導致科技巨頭與科研機構成為主要玩家。科技巨頭的基礎模型研發成果可內化為公司一系列業務提供支援。

3)模型最佳化與改進:對模型進行行業化改造,提供API或改造後的模型。實際上這一功能由產業鏈上一環節的基礎模型研發或者下一環節的應用軟體層承擔,我們尚未看到僅從事這一環節的公司。

4)應用軟體:強調產品營運和商業落地能力,類似SaaS公司。這一環節在國內外已經湧現出較多初創公司,其價值在於提升專業使用者生產力,我們認為商業模式將主要來自於訂閱制收費,因此衡量指標與SaaS公司一致,為ARR(年度經常性收入)。以中美付費意願差異導致的SaaS發展差異為鑑,國內的AIGC應用軟體層商業模式能否得到驗證尚需觀察。

我們以OpenAI與Stability AI為例,對產業鏈的第2-4層來舉例。

OpenAI:1)基礎模型研發層:研發了GPT-3、DALL-E2等多個大模型;2)模型最佳化與改進層:開放大模型API,對語言模型API收取0.0004-0.002美元/k tokens的費用,對圖像模型API收取0.016-0.02美元/圖的費用;3)應用軟體層:推出聊天與程式設計應用ChatGPT,目前正在推廣20美元/月的ChatGPT Plus,功能包括高峰時段照常使用、快速響應、優先訪問新功能和改進等;與GitHub等推出AI程式設計工具Copilot。

Stability AI:1)基礎模型研發層:研發了Stable Diffusion模型並且已經開源;2)模型最佳化與改進層:提供API供開發者開發基於Stable Diffusion的應用;3)應用軟體層:上線AI生成圖片網站DreamStudio服務普通使用者。

為何基礎模型研發將由現有玩家繼續主導市場?

訓練大模型的高成本和高技術壁壘導致科技巨頭與科研機構成為主要玩家。以2020年推出的GPT-3模型為例,Alchemy API創始人Elliot Turner推測訓練GPT-3的成本可能“接近 1200 萬美元”。Lambda Labs使用價格最低的GPU雲估算GPT-3的訓練成本至少為460萬美元。並且以上估算為訓練最終模型的成本,未計入前期調整參數組態時的訓練成本。Eleuther AI(一個致力於開源大模型的組織)在2022年推出的類GPT模型——200億參數的GPT-NeoX-20B,則使用96塊A100晶片訓練了三個月,據The Next Platform估計,最終訓練成本約53-66萬美元。因此,訓練大模型的高成本和高技術壁壘使科技巨頭和科研機構成為主要玩家。根據OpenBMB統計,截至2022年10月,全球擁有大模型數量前五的機構分別是Google、Meta、清華大學、OpenAI和微軟。

目前中美兩國引領預訓練大模型發展。根據OpenBMB截至2022年10月的統計,擁有大模型數量前十名的組織中,中/美分別佔據4/6席;擁有大模型參數量前十名的組織中,中/美同樣分別佔據4/6席。

科技巨頭在大模型上競爭激化,晶片送水人是最大受益者

AI模型訓練算力增長速度超越晶片摩爾定律。根據OpenAI測算,自2012年以來,全球頭部AI模型訓練算力需求3、4個月翻一番,每年頭部訓練模型所需算力增長幅度高達10倍。摩爾定律中,積體電路中的電晶體數量大約每兩年翻一番。深度學習正在逼近現有晶片的算力極限。

從輝達加快與微軟合作共建立生成式AI生態、Google和百度將分別推出類ChatGPT產品看出,是否擁有大模型將成為科技巨頭/科技平台企業的重要分水嶺,未來科技巨頭之間將展開大模型軍備競賽,科技公司遠期投資價值或將被重新定義。由於ChatGPT依賴更大的總算力消耗和千億級的參數訓練,對應更大的算力需求,我們認為ChatGPT的應用也有望推動底層基礎設施建設新增長機遇。AI應用的逐步豐富將推動計算晶片市場(IC Insight測算21年全球1030億美金)保持強勁增長。

受美高端晶片出口限制影響,中國預訓練模型發展可能受到一定阻礙。輝達為解決美國商務部的半導體出口新規推出降配方案A800(降低I/O傳輸速率而不降低算力),但我們認為A800與A100在資料傳輸速度上的差異仍然會影響大模型的運算速度和效率。國產晶片雖然在近幾年不斷縮小與海外巨頭的差距,但在算力、功耗上仍較為劣勢,短期來看由於國內硬體水平較低將不利於國內廠商預訓練大模型與全球其他玩家的競爭。受益於我國資料資源的規模和多樣化優勢,我們期待資料作為生產要素發揮作用。

ChatGPT離AGI還有多遠?

ChatGPT是通往AGI(通用人工智慧)道路的一次躍遷,但我們離AGI仍有較遠的距離。目前圍繞此類應用的爭議主要圍繞在生成資訊真實性、有害性以及不當使用場景方面。

生成式AI資訊真實性令人擔心。大語言模型對事實和邏輯世界缺乏真正理解,當產生虛假資訊的成本非常低時,數量可能會趨向於一個非常大的數字。例如,程式設計師問答網站Stack Overflow由於被ChatGPT生產的看似合理但錯誤的答案淹沒,目前已經禁止使用者提交由 ChatGPT 編寫的答案;科技新聞網站 CNET 一度開始使用 ChatGPT 生成新聞文章,但後來發現許多文章事實不精準而不得不更正。Meta在2022年11月推出Galactica模型,可以生成論文、百科詞條、回答問題、完成化學公式和蛋白質序列等等,但回答錯誤百出,推出3天後不得不下線。

規避資訊有害性仍待加強。儘管ChatGPT採用了基於人類反饋的強化學習(RLHF),以實現有害和不真實輸出的減少,但如果使用者逐步引導,ChatGPT仍然會響應有害指令。例如一位工程師在對話中假設存在虛擬世界以及類似GPT-3的AI——Zora,要求ChatGPT敘述Zora如何毀滅人類,ChatGPT逐步回答出人類毀滅計劃。

ChatGPT初興,不當使用場景逐步出現。ChatGPT對於需要輸出文字和程式碼的工作來說能夠提高生產力,但是在強調獨立思考和創作的學術界,使用它或許並不恰當。全球最大預印本發佈平台arXiv已經明確生成式人工智慧語言工具不能被列為作者,Nature也表示大語言模型例如ChatGPT不滿足成為作者的要求。當學生使用ChatGPT寫作業和論文時,教育界也開始逐漸變化,檢測文字是否使用ChatGPT生成的GPTZero等工具相繼誕生,紐約市禁止公立學校網路訪問ChatGPT,技術創新是否會引發未來相適應的教學和考核方式還等待時間的驗證。

風險提示:

1)AI技術落地不及預期。雖然 AI技術加速發展,但由於成本、落地效果等限制,相關技術落地節奏可能不及我們預期。

2)本研報中涉及到未上市公司或未覆蓋個股內容,均系對其客觀公開資訊的整理,並不代表本研究團隊對該公司、該股票的推薦或覆蓋。

本文作者:華泰電子分析師黃樂平等,來源:華泰證券研究所電子團隊,原標題:《ChatGPT熱潮的冷思考》,原文部分內容有刪節

風險提示及免責條款
市場有風險,投資需謹慎。本文不構成個人投資建議,也未考慮到個別使用者特殊的投資目標、財務狀況或需要。使用者應考慮本文中的任何意見、觀點或結論是否符合其特定狀況。據此投資,責任自負。

·相關標籤

Share:

回到頂端