文章來(lái)源:鈦媒體
作者:林志佳
編輯:馬金男
未來(lái)4000億美元規(guī)模的AI加速計(jì)算市場(chǎng)中,其中至少2000億美元將專用于AI推理計(jì)算的場(chǎng)景。因此,AI推理對(duì)于大模型發(fā)展起到非常關(guān)鍵的作用。
圖片來(lái)源:由無(wú)界 AI生成
隨著生成式 AI 技術(shù)加速演進(jìn),算力需求急劇增長(zhǎng),將促使2.8萬(wàn)億元 AI 加速芯片市場(chǎng)迎來(lái)一場(chǎng)新競(jìng)賽。
近日,芯片巨頭英特爾(Intel)發(fā)布基于Intel 7(10nm)制程的全新第五代英特爾至強(qiáng)可擴(kuò)展CPU(中央處理器)芯片Emerald Rapids,平均性能比上代提升21%,可微調(diào)最高200億參數(shù) AI 大模型,主要用于云數(shù)據(jù)中心和 AI 推理等場(chǎng)景。
除了英特爾,近期英偉達(dá)、AMD也在發(fā)布了多款數(shù)據(jù)中心GPU(圖形處理器)、CPU產(chǎn)品,以應(yīng)對(duì)新一輪 AI 熱潮下算力暴增需求。其中,英偉達(dá)于11月發(fā)布H200 GPU芯片,大模型推理速度比H100提高近2倍;AMD則發(fā)布Instinct MI300X AI芯片,稱MI300X在多項(xiàng)測(cè)試中均優(yōu)于英偉達(dá)H100,運(yùn)行8卡時(shí)AI性能提升60%。
然而近期,英偉達(dá)團(tuán)隊(duì)炮轟AMD,稱其沒(méi)有用開(kāi)源TensorRT-LLM大模型優(yōu)化軟件,如果用的話芯片速度會(huì)提高2倍多,但H100仍比MI300X快47%;對(duì)此,AMD“回懟”稱,即便用了英偉達(dá)軟件,MI300X也比H100快30%;英特爾CEO基辛格(Pat Gelsinger)也公開(kāi)稱,英偉達(dá)CUDA軟件護(hù)城河“太淺”,其在AI領(lǐng)域的成功純屬偶然、非常幸運(yùn)。
如今,面對(duì) AI 加速計(jì)算的巨大需求,美國(guó)芯片巨頭們正悄然展開(kāi)著一場(chǎng)爭(zhēng)奪大戰(zhàn)。
英特爾數(shù)據(jù)中心與人工智能集團(tuán)兼副總裁兼中國(guó)區(qū)總經(jīng)理陳葆立對(duì)鈦媒體App等表示,“AI 芯片用于大模型推理還處于早期階段,在當(dāng)前一些加速芯片非常短缺的情況下,我們給了很多用戶另外一個(gè)選擇。我們非??春脭?shù)據(jù)中心市場(chǎng)的蓬勃發(fā)展。2023年一些智算算力的需求是遠(yuǎn)遠(yuǎn)大于供給的,這個(gè)情況會(huì)延續(xù)到明年?!?/p>
據(jù)統(tǒng)計(jì),預(yù)計(jì)到2027年,基于 AI 需求帶動(dòng),全球數(shù)據(jù)中心加速芯片市場(chǎng)規(guī)模將達(dá)到2.8萬(wàn)億元。
截至2023年12月29日美股收盤(pán),英特爾(NASDAQ: INTC)股價(jià)報(bào)收50.25美元/股。
過(guò)去12個(gè)月內(nèi),英特爾股價(jià)累計(jì)漲幅達(dá)87.99%;英偉達(dá)(NASDAQ: NVDA)、AMD公司(NASDAQ: AMD)累計(jì)漲幅分別為245.94%、130.26%。
超2000億美金將投向AI芯片推理,AIGC或無(wú)需昂貴的GPU
過(guò)去一年,以ChatGPT為代表的生成式 AI 技術(shù),推動(dòng)了 AI 相關(guān)算力需求將不斷增長(zhǎng),并且可能成為 AI 芯片未來(lái)幾年內(nèi)非常重要的需求賽道。
據(jù)艾瑞咨詢報(bào)告顯示,2023年,AI 大模型相關(guān)行業(yè)需求占中國(guó)智能算力總需求的58.8%,接近60%,是智能算力的最大需求方。阿里、騰訊、百度等中國(guó)科技巨頭對(duì)GPU芯片需求強(qiáng)烈,英偉達(dá)也因此成為中國(guó) AI 大模型領(lǐng)域關(guān)鍵“軍火商”。
另?yè)?jù)世界半導(dǎo)體貿(mào)易統(tǒng)計(jì)協(xié)會(huì)(WSTS)預(yù)估,2024年,受益于 AI 芯片需求持續(xù)增長(zhǎng),全球半導(dǎo)體市場(chǎng)規(guī)模預(yù)計(jì)將達(dá)到5883.6億美元(接近6000億美元,約合4.16萬(wàn)億元),同比增長(zhǎng)13.1%。
阿里云創(chuàng)始人王堅(jiān)曾預(yù)測(cè),未來(lái)云計(jì)算的算力都將會(huì)被這些在智能時(shí)代的電動(dòng)機(jī)、所謂的大模型給消耗掉。
實(shí)際上,在生成式 AI(AIGC)時(shí)代下,算力正成為核心生產(chǎn)力。
數(shù)據(jù)顯示,2023年,全球 AI 加速計(jì)算市場(chǎng)規(guī)模將達(dá)450億美元。預(yù)計(jì)到2027年,全球數(shù)據(jù)中心AI加速芯片市場(chǎng)規(guī)模將達(dá)到4000億美元(約合人民幣2.8萬(wàn)億元),五年的年復(fù)合增長(zhǎng)率(CAGR)高達(dá)70%。
具體到案例中,生成式 AI 對(duì)算力的具體需求主要體現(xiàn)在搜索、辦公、計(jì)算機(jī)和游戲等核心場(chǎng)景中。
然而,在智能算力中心(服務(wù)器)環(huán)境下,AIGC不止需要GPU進(jìn)行訓(xùn)練,尤其隨著Llama 2這種超大參數(shù)規(guī)模的開(kāi)源模型廣泛使用,未來(lái)大模型不一定需要重復(fù)性數(shù)據(jù)訓(xùn)練。因此,大模型更大的算力工作負(fù)載或與 AI 推理計(jì)算有關(guān),所以無(wú)論是CPU,還是GPU、APU、IPU加速卡,都將會(huì)發(fā)揮更大作用。
字節(jié)跳動(dòng)旗下的火山引擎IAAS產(chǎn)品負(fù)責(zé)人李越淵向鈦媒體App介紹,“從CPU角度來(lái)說(shuō),在AI模型訓(xùn)練前,需要快速處理“臟數(shù)據(jù)”,變成為模型所用的高效數(shù)據(jù),這就要求高計(jì)算能力加持。同時(shí),模型訓(xùn)練涉及多種數(shù)據(jù)類型和多模態(tài)能力,那么對(duì)CPU的能力、內(nèi)存和帶寬提出了高要求。另外,隨著模型增大,芯片間的互聯(lián)互通能力也變得關(guān)鍵?!?/p>
據(jù)AMD首席執(zhí)行官蘇姿豐(Lisa Su)預(yù)估,未來(lái)價(jià)值4000億美元規(guī)模的AI加速計(jì)算市場(chǎng)中,其中超過(guò)一半的份額,即至少2000億美元將被專門(mén)用于 AI 推理計(jì)算場(chǎng)景的應(yīng)用。這凸顯了AI 推理在整個(gè)AI加速計(jì)算市場(chǎng)中的重要地位,以及 AI 推理計(jì)算在大模型發(fā)展中的關(guān)鍵作用。
12月14日,英特爾發(fā)布了第五代至強(qiáng)可擴(kuò)展處理器系列,在性能和能效方面都有重要提升,重點(diǎn)強(qiáng)調(diào)在AI大模型推理方面的性能表現(xiàn),內(nèi)置英特爾AMX(加速器),無(wú)需添加獨(dú)立加速器即可為AI加速,包括對(duì)參數(shù)量多達(dá)200億的模型進(jìn)行推理和調(diào)優(yōu),并將其模型推理性能提高42%。
英特爾表示,與上一代至強(qiáng)產(chǎn)品相比,在相同的熱設(shè)計(jì)功率范圍內(nèi),全新第五代英特爾至強(qiáng)處理器平均性能提升21%,并在一系列工作負(fù)載中將每瓦性能提升高達(dá)36%。對(duì)于遵循典型的五年更新周期的客戶來(lái)說(shuō),總體成本最多可降低77%。IBM表示,相比此前測(cè)試數(shù)據(jù),第五代至強(qiáng)處理器在其watsonx.data平臺(tái)上的網(wǎng)絡(luò)查詢吞吐量提高2.7倍。
英特爾數(shù)據(jù)中心與人工智能集團(tuán)副總裁兼中國(guó)區(qū)總經(jīng)理陳葆立
陳葆立對(duì)鈦媒體App表示,“近一、兩年,英特爾一直在以穩(wěn)健的執(zhí)行力推動(dòng)產(chǎn)品路線圖發(fā)展,并按四年五個(gè)節(jié)點(diǎn)的節(jié)奏如期推進(jìn)。至強(qiáng)更新速度越來(lái)越快,其實(shí)也是響應(yīng)了客戶對(duì)于算力需求?!?/p>
陳葆立指出,英特爾與中國(guó)企業(yè)合作非常緊密。例如,美團(tuán)采用英特爾第四代至強(qiáng)可擴(kuò)展處理器支持目標(biāo)識(shí)別、計(jì)算機(jī)視覺(jué)等 AI 推理工作負(fù)載;京東云則利用第五代至強(qiáng)處理器,使整機(jī)性能比上一代提升123%,Llama 2模型推理性能提升151%。
據(jù)悉,英特爾即將首次采用了“雙核并進(jìn)”的路線圖設(shè)計(jì),明年將推出基于Intel 3(3nm)制程的性能核和能效核處理器,對(duì)應(yīng)著下一代至強(qiáng)Granite Rapids和全新能效核至強(qiáng)處理器Sierra Forest,以滿足不同數(shù)據(jù)中心需求。
阿里云服務(wù)器研發(fā)事業(yè)部高級(jí)總監(jiān)王偉表示,由于大模型是顯存帶寬密集型和顯存容量密集型的,因此基于第五代至強(qiáng)可擴(kuò)展處理器,增加了內(nèi)存帶寬,在某種意義上來(lái)講,是有利于未來(lái)通過(guò)CPU來(lái)做生成式AI推理應(yīng)用的?!澳壳?,我們發(fā)現(xiàn)CPU可以輕松運(yùn)行各種生成式 AI 模型,如Stable Diffusion、通義千問(wèn)7B/14B/72B等,均可以在阿里云第八代ECS實(shí)例上進(jìn)行推理運(yùn)行。”
在陳葆立看來(lái),AI 已經(jīng)是當(dāng)今生活不可或缺的一部分,AI 無(wú)處不在,因此對(duì)于英特爾的 AI 芯片和解決方案需求在不斷增加,而非只有GPU才能做到。
“很多企業(yè)目前采用最新的至強(qiáng)處理器已經(jīng)可以處理許多工作。當(dāng)然,一些想要訓(xùn)練模型的公司需要加速卡,不管是來(lái)自英特爾還是友商,這確實(shí)是用戶需求,但我并不認(rèn)為所有公司都有這個(gè)需要,這超過(guò)了目前市場(chǎng)的實(shí)際需求?!标愝崃⒈硎荆拔覀兎浅?春脭?shù)據(jù)中心市場(chǎng)的蓬勃發(fā)展。因?yàn)椴还苁荂PU、GPU還是IPU,過(guò)去幾年每年都有不同火的點(diǎn),但數(shù)據(jù)中心整體算力需求始終在增加,需要去解決不同的問(wèn)題?!?/p>
陳葆立對(duì)鈦媒體App表示,他相信2024年,可能將會(huì)有更多 AI 大模型或AIGC應(yīng)用落地,會(huì)有更多應(yīng)用于創(chuàng)新,也會(huì)反哺到企業(yè)端。
“英特爾的策略是,憑借全棧的產(chǎn)品和解決方案,我們可以給客戶在不同的場(chǎng)景,不同的需求下,提供不同的解決方案,包括端、云、邊緣側(cè)等。”陳葆立強(qiáng)調(diào),長(zhǎng)遠(yuǎn)來(lái)看,未來(lái)更多 AI 應(yīng)用或?qū)⒉捎肅PU芯片進(jìn)行推理計(jì)算。
算力競(jìng)爭(zhēng)加速,芯片巨頭攻“生態(tài)”
AI 大模型引發(fā)算力需求增長(zhǎng),同時(shí)也帶來(lái)更大的競(jìng)爭(zhēng),尤其是英特爾這些芯片巨頭的競(jìng)爭(zhēng)對(duì)手、客戶、下游供應(yīng)商等企業(yè)都在自研服務(wù)器芯片。
12月7日,谷歌發(fā)布迄今為止功能最強(qiáng)大、最通用的多模態(tài) AI 大模型Gemini 1.0(中文稱“雙子座”)系列。在30項(xiàng)性能基準(zhǔn)測(cè)試中,超大杯Gemini Ultra超越了目前最強(qiáng)模型GPT-4,甚至在MMLU測(cè)試上得分高達(dá)90.0%,成為第一個(gè)超越人類專家水平的 AI 模型。
但谷歌表示,Gemini 1.0 并非用英偉達(dá)A100或者是AMD等產(chǎn)品進(jìn)行訓(xùn)練,而是用自研設(shè)計(jì)的TPUs v4 和 v5e芯片上進(jìn)行大規(guī)模 AI 訓(xùn)練推理的,稱因此Gemini的運(yùn)行速度明顯快于早期規(guī)模更小、性能更弱的模型。
更早之前,微軟也公布用于數(shù)據(jù)中心的兩款自研芯片,一是專門(mén)用于云端訓(xùn)練和推理的AI芯片(ASIC)Microsoft Azure Maia 100;二是微軟自研的首款CPU(中央處理器)Microsoft Azure Cobalt 100。
此外,亞馬遜、阿里、騰訊、字節(jié)跳動(dòng)等多家國(guó)內(nèi)外科技公司都開(kāi)始自研芯片,用于自家的數(shù)據(jù)中心或云計(jì)算服務(wù)當(dāng)中。而加上目前芯片限制的影響,中國(guó)市場(chǎng)的競(jìng)爭(zhēng)就更加復(fù)雜。
談及市場(chǎng)競(jìng)爭(zhēng),陳葆立向鈦媒體App坦言,英特爾非常歡迎有很多的競(jìng)爭(zhēng)對(duì)手來(lái)參與到整個(gè)市場(chǎng)中,同時(shí)英特爾對(duì)于市場(chǎng)競(jìng)爭(zhēng)力非常有信心。
“首先,國(guó)內(nèi)對(duì)于算力的政策支持,如算力網(wǎng)絡(luò)和‘東數(shù)西算’等,顯示出算力領(lǐng)域受到重視,這是個(gè)積極的信號(hào);其次,全球AI技術(shù)的迅猛發(fā)展帶來(lái)了新的機(jī)遇,AI 的爆發(fā)推動(dòng)了對(duì)新算法、新算力和新硬件的需求增長(zhǎng)?;貧w本質(zhì),英特爾非常歡迎有很多的競(jìng)爭(zhēng)對(duì)手來(lái)參與到整個(gè)市場(chǎng)中,這說(shuō)明市場(chǎng)好。但同時(shí),我們對(duì)自身還是有信心的。
英特爾在這個(gè)環(huán)境中持續(xù)推進(jìn),首先是在先進(jìn)制程技術(shù)方面的領(lǐng)導(dǎo)地位,例如正在推進(jìn)的Intel 4和Intel 3制程。同時(shí),英特爾的封裝技術(shù),如EMIB(嵌入式多芯片互連橋接),也在市場(chǎng)中占據(jù)了重要位置。此外,英特爾還開(kāi)放工廠合作。因此,我們有信心能夠在這里做出最好的產(chǎn)品。
最重要的是,英特爾強(qiáng)調(diào)以客戶為中心,通過(guò)與客戶如阿里、字節(jié)的緊密溝通,早期溝通、識(shí)別并修正產(chǎn)品問(wèn)題,確保滿足客戶的最終需求。我們也希望,我們承諾做出來(lái)的東西能夠滿足客戶最終的需求,以客戶為優(yōu)先擁抱市場(chǎng)這個(gè)理念,也是我們多年來(lái)的優(yōu)勢(shì)。綜合以上,我們(對(duì)于市場(chǎng)競(jìng)爭(zhēng))還是很有信心的?!标愝崃⒈硎尽?/blockquote>在他看來(lái),AI 算力需求不是只有一、兩家是“贏家”,而是整個(gè) AI 芯片、計(jì)算相關(guān)產(chǎn)業(yè)都會(huì)因?yàn)檫@場(chǎng) AI 浪場(chǎng)而受益。競(jìng)爭(zhēng)遠(yuǎn)未結(jié)束。
有行業(yè)人士日前向鈦媒體App表示,目前整個(gè) AI 大模型訓(xùn)練推理算力的挑戰(zhàn)在于軟件生態(tài),無(wú)論是CUDA軟件,還是NVLink多卡互聯(lián),均是2023年英偉達(dá)獲得巨大成功的關(guān)鍵要素。因此,如何讓英特爾、AMD和更多廠商,在短期內(nèi)形成CUDA或是英偉達(dá) AI 生態(tài),才是最為關(guān)鍵的因素。
作為老牌芯片巨頭,英特爾花了很長(zhǎng)的時(shí)間做了OpenVINO、OneAPI等軟件棧產(chǎn)品,以及逐步將異構(gòu)計(jì)算、3D封裝等多個(gè)技術(shù)進(jìn)行快速落地應(yīng)用,未來(lái) AI 場(chǎng)景過(guò)程中,單獨(dú)的GPU無(wú)法做主導(dǎo),而是需要CPU、GPU、NPU(神經(jīng)網(wǎng)絡(luò)處理器)等技術(shù)相融合。
“在數(shù)據(jù)中心端,其實(shí)做生態(tài)做得最成熟的也只有英特爾。雖然說(shuō)在 AI、GPU這里我們才剛開(kāi)展,但對(duì)于整個(gè)生態(tài)、開(kāi)源社區(qū)的合作,多年來(lái)應(yīng)該沒(méi)有其他公司比我們做得更多的。所以,英特爾將持續(xù)與開(kāi)發(fā)者社區(qū)合作,讓更多人參與進(jìn)來(lái)。這也是我們明年會(huì)投入的一個(gè)方向?!标愝崃⒈硎?,“芯片需要一個(gè)長(zhǎng)期的研發(fā)流程,我們會(huì)非常認(rèn)真聽(tīng)從客戶反饋并進(jìn)行改進(jìn),也會(huì)針對(duì)合作伙伴提供一些定制產(chǎn)品,提供更好的服務(wù),以滿足客戶需求?!?/p>
陳葆立強(qiáng)調(diào),下一步,英特爾將持續(xù)推進(jìn) AI 技術(shù)和數(shù)據(jù)中心領(lǐng)域的創(chuàng)新,并計(jì)劃2024年重點(diǎn)加強(qiáng)與開(kāi)發(fā)者的互動(dòng),以進(jìn)一步助力大模型技術(shù)的應(yīng)用與產(chǎn)業(yè)化落地,促進(jìn)中國(guó) AI 產(chǎn)業(yè)不斷發(fā)展壯大。
本站提醒:投資有風(fēng)險(xiǎn),入市須謹(jǐn)慎,本內(nèi)容不作為投資理財(cái)建議。