A股三大指數(shù)今日集體回調(diào),截止收盤,滬指跌1.45%,收?qǐng)?bào)3330.73點(diǎn);深證成指跌2.62%,收?qǐng)?bào)10748.97點(diǎn);創(chuàng)業(yè)板指跌3.91%,收?qǐng)?bào)2243.62點(diǎn)。滬深兩市成交額達(dá)到1.82萬億元,較昨日小幅縮量120億。人工智能概念全線走強(qiáng),Sora方向逆勢(shì)飆升,板塊指數(shù)一度創(chuàng)歷史新高。那么,今天我們就來詳細(xì)剖析一下Sora文生視頻模型產(chǎn)業(yè)鏈的投資邏輯。
巴菲特為什么說回調(diào)是機(jī)會(huì)?
巴菲特一直堅(jiān)守價(jià)值投資理念,認(rèn)為股票的價(jià)值最終會(huì)反映在公司的內(nèi)在價(jià)值上。當(dāng)市場(chǎng)回調(diào)時(shí),很多優(yōu)質(zhì)公司的股票價(jià)格可能會(huì)被過度打壓,低于其內(nèi)在價(jià)值。此時(shí)買入,就相當(dāng)于以折扣價(jià)獲得了有價(jià)值的資產(chǎn),未來當(dāng)市場(chǎng)恢復(fù)理性或者公司價(jià)值進(jìn)一步提升時(shí),就能獲得豐厚的回報(bào)。安全邊際是巴菲特投資的重要原則之一。市場(chǎng)回調(diào)會(huì)使股票價(jià)格下降,從而擴(kuò)大了股票的安全邊際。也就是說,投資者在回調(diào)后買入股票,其面臨的潛在損失風(fēng)險(xiǎn)會(huì)降低,而未來的盈利空間會(huì)增加。這為投資者提供了更好的風(fēng)險(xiǎn)與回報(bào)比率。
在市場(chǎng)回調(diào)時(shí),投資者可以有更多的機(jī)會(huì)去選擇那些平時(shí)價(jià)格較高但因回調(diào)而變得更具吸引力的優(yōu)質(zhì)股票。巴菲特旗下的伯克希爾?哈撒韋公司資金規(guī)模龐大,市場(chǎng)回調(diào)能為他提供更多的投資選擇,使他可以將資金配置到更多符合其投資標(biāo)準(zhǔn)的企業(yè)中。
調(diào)整投資組合的時(shí)機(jī):回調(diào)可以讓投資者重新審視和調(diào)整自己的投資組合。對(duì)于巴菲特這樣的長期投資者來說,這是一個(gè)優(yōu)化投資組合結(jié)構(gòu)的好時(shí)機(jī),可以賣出一些估值過高或不再符合投資標(biāo)準(zhǔn)的股票,買入更具潛力的資產(chǎn)。
巴菲特深知市場(chǎng)具有周期性,上漲和下跌是市場(chǎng)的常態(tài)?;卣{(diào)是市場(chǎng)周期中的一個(gè)階段,從長期來看,市場(chǎng)總是會(huì)經(jīng)歷復(fù)蘇和上漲。因此,當(dāng)市場(chǎng)回調(diào)時(shí),巴菲特不會(huì)被短期的波動(dòng)所影響,而是基于長期的投資視角,看到回調(diào)背后隱藏的投資機(jī)會(huì)。
機(jī)構(gòu):科技產(chǎn)業(yè)的投資主線將圍繞AI展開
中信證券認(rèn)為,展望2025年,科技產(chǎn)業(yè)的投資主線將繼續(xù)圍繞AI展開。隨著大模型能力在多模態(tài)、邏輯推理等方面的持續(xù)進(jìn)步,AI將與千行百業(yè)的數(shù)智化轉(zhuǎn)型深度結(jié)合,從算力基礎(chǔ)設(shè)施到終端應(yīng)用落地,持續(xù)驅(qū)動(dòng)科技產(chǎn)業(yè)投資。推薦關(guān)注AI算力、應(yīng)用與數(shù)據(jù)、AI終端三個(gè)方向的投資機(jī)會(huì)。并且隨著宏觀經(jīng)濟(jì)環(huán)境的轉(zhuǎn)暖以及產(chǎn)業(yè)政策的逐步落地,也推薦關(guān)注需求復(fù)蘇背景下,互聯(lián)網(wǎng)、安卓消費(fèi)電子、汽車產(chǎn)業(yè)鏈、半導(dǎo)體、運(yùn)營商等細(xì)分科技板塊的投資機(jī)遇。
天風(fēng)證券認(rèn)為除Nvidia之外的AI芯片或許也會(huì)迎來市場(chǎng)機(jī)會(huì)。其研報(bào)提到,蘋果在最新用于AppleIntelligence的端側(cè)與云端大模型訓(xùn)練中主要使用了Google的TPU,Anthropic也使用谷歌CloudTPUv5e芯片為其大語言模型Claude提供硬件支持;AMD的MI300芯片銷量持續(xù)超預(yù)期。未來,訓(xùn)練與推理端的算力需求有望持續(xù)增長。
華福證券認(rèn)為,要關(guān)注AI相關(guān)需求的高速增長。AIPC(人工智能個(gè)人電腦)市場(chǎng)高速發(fā)展,AI大模型的端側(cè)規(guī)?;瘮U(kuò)張快速推進(jìn)。AI熱潮進(jìn)一步驅(qū)動(dòng)先進(jìn)制程需求飆升,臺(tái)積電HPC及AI芯片價(jià)格或?qū)⑸蠞q,AI應(yīng)用帶動(dòng)硬件升級(jí),存儲(chǔ)需求攀升,隨著面向終端設(shè)備的存儲(chǔ)器的推出,端側(cè)AI市場(chǎng)有望逐步進(jìn)入穩(wěn)定增長軌道。
平安證券表示,國家重視人工智能發(fā)展,提出開展“人工智能+”行動(dòng)、加快形成全國一體化算力體系,這有望推動(dòng)我國AI基礎(chǔ)設(shè)施建設(shè)的加快和AI產(chǎn)業(yè)的發(fā)展。在大模型算法的迭代升級(jí)背景下,全球和中國AI算力市場(chǎng)將增長強(qiáng)勁,我國國產(chǎn)AI芯片產(chǎn)業(yè)鏈也將加快成熟,相關(guān)企業(yè)會(huì)深度受益,應(yīng)用端的國產(chǎn)大模型能力持續(xù)升級(jí),AIGC產(chǎn)業(yè)未來發(fā)展前景廣闊。
據(jù)相關(guān)報(bào)道,字節(jié)跳動(dòng)的視頻生成模型PixelDance即將于即夢(mèng)AI平臺(tái)上線,并面向公眾開放使用。而Runway在11月9日曾宣稱,OpenAI計(jì)劃在大約兩周內(nèi)正式向公眾全面推出Sora。這就意味著字節(jié)跳動(dòng)的即夢(mèng)平臺(tái)會(huì)在Sora發(fā)布之前上線其視頻生成模型PixelDance。
今年2月,OpenAI率先推出了首個(gè)AI視頻生成模型——Sora。該模型能夠依據(jù)用戶的文本描述,生成長達(dá)60秒且畫質(zhì)為1080P的高質(zhì)量視頻,其視頻內(nèi)容涵蓋精細(xì)復(fù)雜的場(chǎng)景、鮮活的角色表情以及復(fù)雜多樣的鏡頭運(yùn)動(dòng)。
Sora充分彰顯了AI在理解與模擬物理世界方面的卓越能力,這一成果被視作邁向通用人工智能(AGI)的關(guān)鍵環(huán)節(jié)。OpenAI認(rèn)為,視頻生成模型是構(gòu)建通用物理世界模擬器的一條極具潛力的路徑,它讓人工智能在理解和模擬處于運(yùn)動(dòng)狀態(tài)的物理世界方面取得了新的重大突破。
自Sora發(fā)布之后,國內(nèi)外其他模型廠商也紛紛跟進(jìn),逐步推出類似Sora的產(chǎn)品。從長遠(yuǎn)視角來看,視頻生成大模型有望在傳媒影視、游戲、金融、醫(yī)療、教育、制造等眾多行業(yè)引發(fā)深刻變革。Sora的問世對(duì)于上述行業(yè)而言意義非凡。依據(jù)紅杉《GenerativeAI:ACreativeNewWorld》的預(yù)測(cè),在未來2-3年,AIGC初創(chuàng)公司以及商業(yè)落地方案的數(shù)量將會(huì)持續(xù)攀升,并且有望創(chuàng)造數(shù)萬億美元的經(jīng)濟(jì)價(jià)值。
一、文生視頻模型究竟是什么?
文生視頻大模型屬于一種能夠借助AI生成視頻內(nèi)容的大型機(jī)器學(xué)習(xí)模型,它能夠根據(jù)用戶的自然語言描述精準(zhǔn)地生成與之匹配的視頻內(nèi)容。這類模型一般基于深度學(xué)習(xí)技術(shù)構(gòu)建,尤其融合了自然語言處理(NLP)、計(jì)算機(jī)視覺(CV)和語音識(shí)別(ASR)等多種技術(shù)。
以O(shè)penAI官方發(fā)布的范例視頻為例,當(dāng)輸入提示詞:“一位時(shí)尚的女士漫步在東京街頭,街上滿是溫暖的霓虹燈和生動(dòng)的城市標(biāo)志。她身著黑色皮夾克、紅色長裙與黑色靴子,手中拎著一個(gè)黑色手提包。她戴著太陽鏡,涂著紅色口紅。走路時(shí)盡顯自信與灑脫。街道潮濕且具有反光效果,形成了彩色燈光的鏡面效果,眾多行人穿梭往來?!?/p>
二、關(guān)于Sora的詳細(xì)解析
Sora模型乃是由OpenAI公司精心研發(fā)打造的一款極為先進(jìn)的文本至視頻生成模型,其正式面向外界發(fā)布的時(shí)間為2024年2月15日。該模型具備一項(xiàng)卓越的能力,即能夠依據(jù)用戶所提供的文本描述來創(chuàng)作出時(shí)長可達(dá)60秒的視頻作品。這些生成的視頻不僅在視覺呈現(xiàn)品質(zhì)方面表現(xiàn)出色,而且能夠極為精準(zhǔn)且完整地將用戶所輸入的提示語內(nèi)容予以還原呈現(xiàn)。在OpenAI官方所出具的技術(shù)報(bào)告當(dāng)中,對(duì)Sora有著極為明確的定位,將其視作“作為世界模擬器的視頻生成模型”,并且指出“拓展視頻生成模型乃是構(gòu)建物理世界通用模擬器的一條切實(shí)可行的路徑”。
在與其他模型的對(duì)比之中,Sora發(fā)布之后成功奠定了視頻生成領(lǐng)域極為重要的技術(shù)路線——DiffusionTransformer(DiT),同時(shí)還將生成視頻的時(shí)長提升至分鐘級(jí)別,這無疑成為了整個(gè)行業(yè)發(fā)展歷程中的一個(gè)關(guān)鍵轉(zhuǎn)折點(diǎn)。
從技術(shù)層面來看,Sora模型巧妙地將自然語言處理技術(shù)與視頻生成技術(shù)進(jìn)行有機(jī)融合。其實(shí)現(xiàn)的機(jī)理是從初始的靜態(tài)噪聲著手,歷經(jīng)多個(gè)步驟逐步去除噪聲,最終成功生成清晰、流暢且符合用戶描述的視頻。在訓(xùn)練過程中,它借助了大量帶有相應(yīng)文本字幕的視頻數(shù)據(jù)進(jìn)行深度訓(xùn)練,以此來不斷提升自身的生成能力與準(zhǔn)確性。
三、Sora產(chǎn)業(yè)鏈的構(gòu)成要素
Sora模型的產(chǎn)業(yè)鏈?zhǔn)且粋€(gè)多環(huán)節(jié)緊密相連且復(fù)雜的體系,其中涵蓋了數(shù)據(jù)收集與處理、模型訓(xùn)練與開發(fā)、部署與應(yīng)用、硬件與云服務(wù)以及產(chǎn)業(yè)鏈上下游企業(yè)等諸多重要環(huán)節(jié)。
首先,在數(shù)據(jù)收集與處理環(huán)節(jié),由于AI模型的訓(xùn)練對(duì)于數(shù)據(jù)有著海量的需求,這些數(shù)據(jù)涵蓋了文本、圖像、視頻等多種豐富的形式。為了能夠滿足模型訓(xùn)練的嚴(yán)苛要求,這些數(shù)據(jù)必須要?dú)v經(jīng)收集、清洗、標(biāo)注等一系列精細(xì)且復(fù)雜的處理流程。
其次,在模型訓(xùn)練階段,當(dāng)收集到充足的數(shù)據(jù)之后,便需要展開高強(qiáng)度的模型訓(xùn)練工作。這一過程需要極為強(qiáng)大的計(jì)算資源予以支撐,諸如高性能計(jì)算機(jī)、GPU、TPU等先進(jìn)的硬件設(shè)備不可或缺。與此同時(shí),還需要專業(yè)素養(yǎng)極高的AI算法工程師投入其中,精心進(jìn)行模型的設(shè)計(jì)、調(diào)優(yōu)等關(guān)鍵工作,以確保模型能夠達(dá)到預(yù)期的性能與效果。
再者,在硬件與云服務(wù)方面,AI模型的順暢運(yùn)行離不開強(qiáng)大的硬件基礎(chǔ)設(shè)施作為堅(jiān)實(shí)后盾,其中包括高性能計(jì)算機(jī)、服務(wù)器,以及算力租賃服務(wù)等多樣化的服務(wù)形式。這些硬件與云服務(wù)共同構(gòu)建起了一個(gè)穩(wěn)定、高效的運(yùn)行環(huán)境,保障Sora模型能夠在不同的應(yīng)用場(chǎng)景中穩(wěn)定發(fā)揮其作用。
最后,在應(yīng)用端,Sora這一文本生成視頻模型具備極為廣泛的應(yīng)用前景,能夠在影視制作、動(dòng)畫制作、游戲開發(fā)、音樂教育等多個(gè)領(lǐng)域大顯身手。它能夠顯著降低視頻制作過程中的成本投入,對(duì)于各應(yīng)用領(lǐng)域而言,均有望實(shí)現(xiàn)可觀的降本增效成果,從而有力地推動(dòng)相關(guān)行業(yè)的創(chuàng)新與發(fā)展,加速整個(gè)行業(yè)的供給端變革進(jìn)程。
四、文生視頻模型的三大核心基石剖析
算法、算力、數(shù)據(jù)堪稱大模型邁向通用人工智能(AGI)的必由之路。伴隨多模態(tài)AI在各個(gè)賽道全面邁向深化成熟的發(fā)展階段,AI模型在訓(xùn)練、推理等方面所對(duì)應(yīng)的算力需求也必然會(huì)隨之獲得進(jìn)一步的釋放與增長。
算法層面
AI算法借助用戶畫像、輿情分析以及預(yù)測(cè)等交易模型,以神經(jīng)網(wǎng)絡(luò)算法、聚類算法、增強(qiáng)算法和傳統(tǒng)回歸算法作為底層基礎(chǔ)算法,進(jìn)而分別達(dá)成了機(jī)器視覺聽覺、降維分析、自然語言處理和模式識(shí)別等一系列人工智能功能。就視頻生成模型算法而言,其主要由基于SD逐幀生成和基于時(shí)空Patches兩種范式所構(gòu)成,這兩種范式在效率與效益方面展開了激烈的比拼。其中,前者所構(gòu)建的模型在訓(xùn)練過程中相對(duì)更為容易操作,但所生成視頻內(nèi)容在一致性方面表現(xiàn)稍差,尤其是在長視頻訓(xùn)練任務(wù)中面臨諸多困難;而后者雖然訓(xùn)練成本相對(duì)較高,然而在生成視頻的長度與一致性方面卻更具優(yōu)勢(shì),更容易得到有效的保障。隨著下一代大模型算力需求的持續(xù)攀升,算法領(lǐng)域有望迎來具有重大意義的生成式革新突破。在國內(nèi),眾多企業(yè)如百度、騰訊、阿里、科大訊飛、字節(jié)跳動(dòng)、華為、商湯科技、曠視科技、依圖科技、云從科技等紛紛加速布局AI算法研發(fā)工作,力求在這一領(lǐng)域占據(jù)有利地位。
算力方面
隨著模型的持續(xù)迭代更新以及AIGC應(yīng)用呈現(xiàn)出多點(diǎn)開花的繁榮景象,訓(xùn)練和推理過程中的算力需求呈現(xiàn)出持續(xù)增長的強(qiáng)勁態(tài)勢(shì),這一趨勢(shì)有力地帶動(dòng)了算力基礎(chǔ)設(shè)施產(chǎn)業(yè)鏈進(jìn)入高速發(fā)展的黃金時(shí)期。以Sora為例,經(jīng)過特定條件下的精確測(cè)算,Sora訓(xùn)練算力需求高達(dá)GPT-4的4.5倍,而其推理算力需求更是接近GPT-4的400倍之多。由此可見,算力基礎(chǔ)設(shè)施的部署需求仍然處于不斷擴(kuò)大與升級(jí)的進(jìn)程之中。AI模型的運(yùn)行高度依賴強(qiáng)大的硬件支撐體系,包括高性能計(jì)算機(jī)、服務(wù)器、云服務(wù)、光通信、液冷溫控、AIDC、AI服務(wù)器、交換機(jī)/路由器、算力模組、CDN、銅纜等各個(gè)環(huán)節(jié)均呈現(xiàn)出高速發(fā)展的良好態(tài)勢(shì),共同構(gòu)建起了一個(gè)龐大而完善的算力產(chǎn)業(yè)鏈圖譜。
數(shù)據(jù)資源方面
高質(zhì)量與大規(guī)模的數(shù)據(jù)集無疑是AI大模型實(shí)現(xiàn)突破的關(guān)鍵要點(diǎn)所在,而用戶數(shù)量或許正是開啟模型迭代“數(shù)據(jù)飛輪”的核心關(guān)鍵所在。按照數(shù)據(jù)源的不同,可以將數(shù)據(jù)劃分為核心數(shù)據(jù)、邊緣數(shù)據(jù)和終端數(shù)據(jù)三大類別,其中前兩者主要來源于企業(yè),而終端數(shù)據(jù)則主要源自于個(gè)人。就當(dāng)前國內(nèi)的現(xiàn)狀而言,數(shù)據(jù)資源總量頗為豐富,在總量層面具備顯著的優(yōu)勢(shì)。然而,由于在數(shù)據(jù)挖掘方面存在不足,數(shù)據(jù)無法在市場(chǎng)上自由、順暢地流通,數(shù)據(jù)的清洗與標(biāo)注產(chǎn)業(yè)鏈尚不夠完善等諸多問題的存在,導(dǎo)致優(yōu)質(zhì)數(shù)據(jù)集仍然處于相對(duì)稀缺的狀態(tài),這也在一定程度上制約了AI大模型的進(jìn)一步發(fā)展與創(chuàng)新。
五、文生視頻市場(chǎng)競(jìng)爭(zhēng)態(tài)勢(shì)剖析
在2023年期間,實(shí)際誕生的文生視頻大模型數(shù)量多達(dá)數(shù)十個(gè),其全球用戶數(shù)量也突破了百萬級(jí)別。不過,大多數(shù)此類視頻模型尚處于產(chǎn)品發(fā)展的早期階段,仍有極大的成長與完善空間。進(jìn)入2024年,各大公司更是馬不停蹄地持續(xù)加速文生視頻模型的研發(fā)進(jìn)程。自O(shè)penAI推出Sora之后,國內(nèi)外眾多模型廠商紛紛效仿,逐步推出類似Sora的產(chǎn)品。在海外市場(chǎng),有Runway、Pika、Luma、HaiperAI等知名企業(yè)積極布局;在國內(nèi),字節(jié)跳動(dòng)、智譜AI、快手、愛詩科技、生數(shù)科技、商湯、智象未來等公司也不甘示弱,踴躍投身于這一領(lǐng)域的競(jìng)爭(zhēng)。
依據(jù)智源研究院FlagEval在2024年8月發(fā)布的主觀評(píng)測(cè)榜單顯示,全球文生視頻大模型排名前三的依次為OpenAISora、RunwayGen-3、字節(jié)跳動(dòng)即夢(mèng)。此外,在國內(nèi)文生視頻綜合性能表現(xiàn)較為突出的模型還涵蓋了快手可靈、愛詩科技PixVerse、科大訊飛星火繪鏡等。根據(jù)最新的多方報(bào)道消息,字節(jié)跳動(dòng)即夢(mèng)AI即將率先上線其視頻生成模型PixelDance,并且其具體上線時(shí)間會(huì)早于OpenAI的Sora正式發(fā)布時(shí)間。據(jù)Runway聯(lián)合創(chuàng)始人CristóbalValenzuela在11月9日透露,OpenAI計(jì)劃在大約兩周內(nèi)正式發(fā)布Sora。
快手可靈大模型是由快手AI團(tuán)隊(duì)自主研發(fā)而成,其采用了與Sora相似的技術(shù)路線,并巧妙結(jié)合了多項(xiàng)自研技術(shù)創(chuàng)新成果。內(nèi)部評(píng)測(cè)數(shù)據(jù)表明,快手可靈1.5模型相較于可靈1.0模型,整體效果實(shí)現(xiàn)了高達(dá)95%的顯著提升。科大訊飛星火繪鏡則是科大訊飛精心打造的AI短視頻創(chuàng)作平臺(tái),該平臺(tái)能夠極為便捷地讓用戶依據(jù)文字描述生成短視頻內(nèi)容,可將文本精準(zhǔn)轉(zhuǎn)換為視頻分鏡,并進(jìn)一步擴(kuò)展成完整的短視頻作品。愛詩科技的海外版PixVerse已然成為全球用戶數(shù)量最多的國產(chǎn)AI視頻生成產(chǎn)品,并且成功搭建起了一個(gè)穩(wěn)定且富有活力的創(chuàng)作者生態(tài)體系,其國內(nèi)版PixVerse也已于3月上線開展內(nèi)測(cè)工作。在11月,智譜AI鄭重宣布旗下AI視頻生成產(chǎn)品“清影”進(jìn)行全面升級(jí)優(yōu)化,成功實(shí)現(xiàn)了從純視覺生成跨越至“有聲視頻”的新階段。
就當(dāng)前形勢(shì)而言,國內(nèi)外的大模型在視頻時(shí)長、分辨率、畫面比例切換等功能以及性能指標(biāo)方面與Sora的差距正在逐步縮小,甚至在部分功能領(lǐng)域已經(jīng)實(shí)現(xiàn)了趕超,文生視頻市場(chǎng)競(jìng)爭(zhēng)愈發(fā)激烈且呈現(xiàn)多元化發(fā)展態(tài)勢(shì)。
移步好股票應(yīng)用,訂閱“機(jī)構(gòu)研選”,看更多精彩內(nèi)容
粉絲特惠:好股票APP五個(gè)熱門產(chǎn)品任選一款,體驗(yàn)五天!歡迎下載注冊(cè)體驗(yàn)!