Group 45Created with Sketch.News 

Stock Market 股市・新聞

從數據到晶元,開發AI越來越昂貴,只有科技巨頭能「玩得起」?

從數據到晶元,開發AI越來越昂貴,只有科技巨頭能「玩得起」?

2024年06月02日 19:08 第一財經

資料來源:新浪財經

更多的訓練數據、更大的模型、更多的晶元和數據中心,這些推動人工智慧(AI)進步的“基礎設施”,正推高科技公司的成本。

5月,OpenAI與美國新聞集團(News Corp)簽訂了一項五年內金額超過2.5億美元的內容授權協議,允許前者使用後者的新聞出版物內容來回答用戶查詢並訓練AI。 此前,圖片供應商Shutterstock與蘋果、Meta、谷歌、亞馬遜等大型科技公司簽訂了2500萬至5000萬美元的交易,提供其龐大的圖片和視頻庫用於AI訓練。

全球經濟分析公司BCA Research美國股票首席策略師唐克爾(Irene Tunkel)對第一財經記者表示,科技公司在AI領域開展了大量工作,但除非銷售的是AI相關的“工具和設備”或雲存儲,否則科技公司更多仍做的是AI資本支出,而不是靠AI掙錢。

然而,大量的資本開支需求無疑會將無力承擔相應成本的公司甩在後面,有能力在這場遊戲中競爭的玩家仍將是我們熟知的科技巨頭。

基礎設施很貴,資本支出很高

唐克爾介紹,在生成式AI的生態系統中,提供晶元和計算機硬體、雲平臺和服務、資料庫、網路和分析等產品和服務的屬於生成式AI的“基礎設施公司”,説明模型的順利開發和部署。 例如,OpenAI的研究員貝特克(James Betker)曾表示,訓練模型的數據是越來越複雜、強大的AI系統的關鍵。

但數據該從哪來? 據報導,生成式AI模型主要通過從公共網頁中獲取的圖像、文本、音訊、視頻和其他數據(其中一些是有版權的)進行訓練。 例如,OpenAI在未經某視頻社交網站或創作者許可的情況下,轉錄了超過一百萬小時的相關視頻,以供其旗艦模型GPT-4使用。 元公司(Meta)也一直在使用旗下公司照片牆(Instagram)上的圖片和視頻來訓練其模型,並只允許歐盟公民退出這一機制。

隨著法律訴訟的增多,AI公司開始選擇付費。 例如,線上社區Reddit稱,該公司已通過向谷歌和OpenAI等組織許可數據賺取了數億美元。 據報導,AI訓練數據市場預計將在十年內從現在的約25億美元增長到接近300億美元。

模型訓練也並不便宜。 OpenAI首席執行官奧爾特曼(Sam Altman)表示,訓練GPT-4的成本超過1億美元。 AI初創公司Anthropic首席執行官阿莫代(Dario Amodei)也稱,目前市場上的人工智慧模型的訓練成本約為1億美元。 他說:「現在正在訓練的模型,以及將在今年晚些時候或明年年初推出的模型,成本接近10億美元。 我認為在2025年和2026年,我們的成本將接近50億美元或100億美元。 ”

晶片支出更是一個大專案。 據報導,英偉達的H100圖形晶元售價約為30000美元。 元公司首席執行官紮克伯格(Mark Zuckerberg)此前曾表示,公司計劃在今年年底前購買35萬塊H100晶元,以支援其人工智慧研究工作。 此外,亞馬遜公司的雲計算部門以每小時約6美元的價格向客戶租用英特爾公司製造的大型主力處理器集群。

在雲服務中心方面,每一座數據中心的成本都以億來計算。 例如,微軟公司與阿聯酋AI公司G42宣布,雙方將合作投資10億美元在肯亞建設一個數據中心,投資40億歐元在法國建設AI數據中心和雲基礎設施。 過去兩年裡,亞馬遜也已承諾斥資1480億美元在全球建設和運營數據中心,以應對AI應用和其他數字服務需求的激增。

總的來看,微軟在4月表示,最近一個季度的資本支出為140億美元,比去年同期增長了79%,由於AI基礎設施投資,這些成本“大幅增加”。 谷歌母公司Alphabet也表示,上一季度支出為120億美元,比去年同期增長91%,並預計今年下半年的支出將“達到或超過”這一水準。 與此同時,Meta也上調了對今年投資的預期,目前認為資本支出將達到350億至400億美元,在這一區間的上限將增長42%。

反壟斷部門怎麼看

美國艾倫人工智慧研究所(AI2)高級應用研究科學家凱爾·洛(Kyle Lo)認為,高額的訓練成本將把小公司排除在“開發或研究AI模型”之外。

凱爾·洛表示,對大規模、高品質訓練數據集的日益重視,將把AI開發集中在少數擁有數十億美元預算、能負擔得起獲取這些數據集的公司。 合成數據或基礎架構方面的重大創新可能會打破現狀,但在近些年似乎都不會出現。

“總的來說,管理對AI開發潛在有用內容的實體有動力鎖定他們的材料。” 凱爾·洛說,「隨著數據訪問的關閉,我們基本上在為一些早期數據獲取者開綠燈,並且撤掉梯子,其他人無法獲得數據以趕上來。 ”

目前,歐美英的反壟斷機構也已經盯上了科技巨頭在AI領域的地位。

例如,英國競爭與市場管理局(CMA)在今年4月發佈的報告中稱AI基礎模型市場中主要參與者的合作關係可能通過其價值鏈加劇壟斷。 5月,美國司法部(DOJ)也宣佈加強對AI領域競爭情況的關注。 近日,美國司法部反壟斷部門主管坎特(Jonathan Kanter)表示,過去40年的反壟斷政策未能有效保護公眾利益,導致了少數公司對市場和資訊流的控制。 他強調,內容創作者和開發者在當前市場環境中面臨的高額費用,在大公司增加對內容創作和分發的控制時尤其如此。

當涉及大科技公司收購AI初創公司時,富而德律師事務所中國反壟斷業務部主管杜寧(Ninette Dodoo)對第一財經記者表示:「歐盟和美國的監管機構正越來越具有干預傾向,同時他們具備的執法工具也有能力對所有併購案件發起法律挑戰。 ”

金杜律師事務所合夥人吳涵律師告訴第一財經,中、美、歐在AI數位治理領域的監管在一定程度上均具有共性,比如都重點關注AI系統的透明度披露、訓練數據治理、智慧財產權保護、內容安全與倫理等。

(本文來自第一財經)

·相關標籤

Share:

回到頂端