一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)發(fā)布視頻AI大模型論文,自動(dòng)駕駛是其潛在應(yīng)用領(lǐng)域

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-04-23 00:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,英偉達(dá)與慕尼黑大學(xué)等院校的研究人員聯(lián)合發(fā)布了一篇有關(guān)視頻潛在擴(kuò)散模型(VideoLDM,Latent Diffusion Model)的論文,該模型能夠?qū)⑽谋巨D(zhuǎn)換成視頻,實(shí)現(xiàn)高分辨率的長視頻合成。

研究人員指出,該模型其中一大具有潛力的應(yīng)用領(lǐng)域,是駕駛數(shù)據(jù)的高分辨率視頻合成,能夠模擬特定駕駛場景,在自動(dòng)駕駛領(lǐng)域中具有巨大的應(yīng)用潛力。

AI大模型在自動(dòng)駕駛領(lǐng)域的應(yīng)用探索

當(dāng)下,文字大模型、文生圖大模型發(fā)展迅速,受限于視頻訓(xùn)練數(shù)據(jù)的計(jì)算成本高昂以及缺乏大規(guī)模公開可用的數(shù)據(jù)集等原因,視頻大模型的發(fā)展相對較慢。VideoLDM則成功解決了這個(gè)關(guān)鍵問題。

從原理上來分析,VideoLDM基于圖像數(shù)據(jù)集預(yù)訓(xùn)練,并在此基礎(chǔ)上加入時(shí)間維度以形成視頻框架,最后在編碼的視頻序列上進(jìn)行微調(diào),得到視頻生成器。

目前,VideoLDM生成視頻的最高分辨率可達(dá)2048×1280、24幀。在論文中,該研究團(tuán)隊(duì)給出了幾個(gè)駕駛場景視頻的生成案例:

pYYBAGRCZSOAQuZdAAfWNjkpXd4563.png

在自動(dòng)駕駛領(lǐng)域,AI大模型被認(rèn)為能夠賦能感知標(biāo)注、決策推理等環(huán)節(jié)。今年4月11日,毫末智行了一款自動(dòng)駕駛生成式大模型DriveGPT,中文名雪湖·海若。據(jù)介紹,毫末DriveGPT雪湖·海若現(xiàn)階段主要用于解決自動(dòng)駕駛的認(rèn)知決策問題。

DriveGPT雪湖·海若的底層模型采用GPT(Generative Pre-trained Transformer)生成式預(yù)訓(xùn)練大模型,與ChatGPT使用自然語言進(jìn)行輸入與輸出有所不同,DriveGPT輸入是感知融合后的文本序列,輸出是自動(dòng)駕駛場景文本序列,即將自動(dòng)駕駛場景Token化,形成“Drive Language”,最終完成自車的決策規(guī)控、障礙物預(yù)測以及決策邏輯鏈的輸出等任務(wù)。

毫末表示,DriveGPT雪湖·海若首發(fā)車型新摩卡DHT-PHEV,即將量產(chǎn)上市。DriveGPT雪湖·海若可以逐步應(yīng)用到城市NOH、捷徑推薦、智能陪練以及脫困場景中。

汽車是AI大模型一大重要應(yīng)用場景

隨著眾多AI大模型的發(fā)展,其商業(yè)應(yīng)用場景也引起諸多思考,其中汽車被認(rèn)為是其中一大重要的應(yīng)用場景。最近,百度、阿里、商湯發(fā)布AI大模型,都在汽車智能方面展示出能力。

3月16日,百度正式發(fā)布文心一言,在發(fā)布會(huì)上,李彥宏展示了文心一言在文學(xué)創(chuàng)作、商業(yè)文案創(chuàng)作、數(shù)理推算、中文理解、多模態(tài)生成五個(gè)使用場景中的綜合能力。

其中在多模態(tài)生成方面,文心一言展示出了文本、圖片、音頻和視頻的生成能力。李彥宏表示,多模態(tài)是生成式AI一個(gè)明確的發(fā)展趨勢。未來,隨著百度多模態(tài)統(tǒng)一大模型的能力增強(qiáng),文心一言的多模態(tài)生成能力會(huì)不斷提升。

文心一言發(fā)布之后,長安汽車官宣,旗下逸達(dá)將成為國內(nèi)首款搭載文心一言的量產(chǎn)車型,后續(xù)將通過軟件升級(jí)的形式搭載到新車上。除了長安汽車外,集度、吉利、嵐圖、紅旗、長城、東風(fēng)日產(chǎn)、愛馳、零跑、海馬等多家車企都已確認(rèn)將內(nèi)測體驗(yàn)并接入其相關(guān)能力,與百度共同打造針對汽車智能場景的大模型人工智能交互體驗(yàn)。

4月11日,阿里也正式發(fā)布其AI大模型通義千問。與文心一言、ChatGPT類似,作為大語言模型,通義千問支持多輪交互及復(fù)雜指令理解、多模態(tài)融合以及外部增強(qiáng)API,能夠?qū)崿F(xiàn)多輪對話、文案創(chuàng)作、邏輯推理、多模態(tài)理解、多語言支持等功能。

在近日第二十屆上海國際汽車工業(yè)展覽會(huì)上,阿里集團(tuán)副總裁、斑馬智行CEO張春暉談到,汽車是大模型最大的交互應(yīng)用場景,智能汽車操作系統(tǒng)將會(huì)被重塑。他表示,AliOS智能汽車操作系統(tǒng)已接入通義千問大模型進(jìn)行測試,相關(guān)技術(shù)會(huì)率先在智己汽車上落地。

商湯科技推出的“日日新SenseNova”大模型體系,含中文語言大模型應(yīng)用平臺(tái)“商量SenseChat”、圖片生成模型“秒畫SenseMirage”、AI數(shù)字人視頻生成平臺(tái)“如影SenseAvatar”、3D內(nèi)容生成平臺(tái)“瓊宇SenseSpace”和“格物SenseThings”等,

在此次展會(huì)上,商湯科技展示了其大模型在車艙智能化方面的實(shí)力,商湯語言大模型“商量SenseChat”會(huì)與嘉賓交流互動(dòng),并推薦個(gè)性化體驗(yàn)內(nèi)容。商量SenseChat還支持郵件模式,會(huì)自動(dòng)提煉郵件關(guān)鍵信息,幫助用戶節(jié)省閱讀時(shí)間。“秒畫SenseMirage”文生圖創(chuàng)作平臺(tái)亦首次與展示艙結(jié)合,借助商湯AIGC模型能力自動(dòng)為嘉賓生成各種風(fēng)格的照片。

在“日日新SenseNova”大模型體系的支持,其自動(dòng)駕駛產(chǎn)品方案也獲得持續(xù)創(chuàng)新的能力。商湯絕影率先實(shí)現(xiàn)BEV感知在國內(nèi)首批量產(chǎn)落地,還首創(chuàng)自動(dòng)駕駛GOP感知體系,充分提升數(shù)據(jù)利用效率,引領(lǐng)感知技術(shù)突破。

商湯絕影的自動(dòng)駕駛GOP感知體系可將目標(biāo)數(shù)據(jù)獲取的人力成本降低94%,目前已投入量產(chǎn)。憑借通用視覺模型,絕影有效實(shí)現(xiàn)了對超過3000種物體目標(biāo)的高精度識(shí)別,降低智能駕駛系統(tǒng)對激光雷達(dá)和高精度地圖的依賴。

小結(jié)

今年以來,AI大模型的發(fā)展如火如荼,國內(nèi)外眾多科技企業(yè)紛紛入局。隨著各種AI大模型陸續(xù)發(fā)布,其商業(yè)應(yīng)用場景也引起業(yè)界關(guān)注,而汽車被認(rèn)為是其中一大重要的應(yīng)用場景。

從目前的情況來看,百度、阿里發(fā)布的AI大模型已經(jīng)在推進(jìn)汽車領(lǐng)域的應(yīng)用。不過當(dāng)前主要還是在智能座艙方面,用于人工智能交流對話等領(lǐng)域,在自動(dòng)駕駛方面的應(yīng)用少有提及。估計(jì)原因在于,雖然其AI大模型都具有視頻生成能力,但這方面的能力還有待升級(jí)。就如李彥宏在發(fā)布會(huì)上就提到,視頻生成能力方面,因?yàn)槌杀据^高,現(xiàn)階段還未對所有用戶開放,當(dāng)然未來會(huì)逐步接入。

可以看到,AI大模型在汽車的智能座艙、自動(dòng)駕駛等領(lǐng)域都將有所作為,業(yè)界也正在推進(jìn)AI大模型加速上車,預(yù)計(jì)在智能座艙方面會(huì)率先落地,而在自動(dòng)駕駛方面還需要在視頻能力方面有更多突破。而英偉達(dá)此次發(fā)布視頻模型論文,可能會(huì)起到一定的引領(lǐng)作用。



聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3953

    瀏覽量

    93807
  • 自動(dòng)駕駛
    +關(guān)注

    關(guān)注

    790

    文章

    14321

    瀏覽量

    170692
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI模型不再依賴英偉達(dá)GPU?蘋果揭秘自研大模型

    ? 電子發(fā)燒友網(wǎng)報(bào)道(文/梁浩斌)過去幾年中爆發(fā)的AI算力需求,英偉達(dá)GPU成為了最大的贏家,無論是自動(dòng)駕駛還是AI
    的頭像 發(fā)表于 08-05 06:07 ?4650次閱讀
    <b class='flag-5'>AI</b>大<b class='flag-5'>模型</b>不再依賴<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>GPU?蘋果揭秘自研大<b class='flag-5'>模型</b>

    小鵬汽車在全球AI頂會(huì)展示下一代自動(dòng)駕駛模型

    Driving),與Waymo、英偉達(dá)、加利福尼亞大學(xué)洛杉磯分校(UCLA)、圖賓根大學(xué)(University of Tuebingen)等來自工業(yè)界和學(xué)術(shù)界的自動(dòng)駕駛同行共同探討業(yè)界最新A
    的頭像 發(fā)表于 06-23 09:13 ?584次閱讀

    偉創(chuàng)力攜手英偉達(dá)與Torc開啟自動(dòng)駕駛卡車新紀(jì)元

    近年來,自動(dòng)駕駛技術(shù)的發(fā)展如火如荼。作為世界領(lǐng)先的汽車級(jí)計(jì)算平臺(tái)提供商的偉創(chuàng)力成為自動(dòng)駕駛8級(jí)卡車商業(yè)化先驅(qū)——Torc的合作伙伴,并攜手技術(shù)巨頭英偉達(dá)(NVIDIA),合作開發(fā)了用于
    的頭像 發(fā)表于 03-26 16:10 ?475次閱讀

    NVIDIA Halos自動(dòng)駕駛汽車安全系統(tǒng)發(fā)布

    NVIDIA 整合了從云端到車端的安全自動(dòng)駕駛開發(fā)技術(shù)套件,涵蓋車輛架構(gòu)到 AI 模型,包括芯片、軟件、工具和服務(wù)。 物理 AI 正在為自動(dòng)駕駛
    的頭像 發(fā)表于 03-25 14:51 ?620次閱讀

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......

    制程、異構(gòu)計(jì)算、高帶寬內(nèi)存和可重構(gòu)架構(gòu)展開,應(yīng)用領(lǐng)域涵蓋 AI、5G、數(shù)據(jù)中心、自動(dòng)駕駛和工業(yè)物聯(lián)網(wǎng)。通過優(yōu)化生態(tài)系統(tǒng)、制定有效市場策略、應(yīng)對挑戰(zhàn),F(xiàn)PGA 將在多個(gè)領(lǐng)域繼續(xù)發(fā)揮關(guān)鍵作
    發(fā)表于 03-03 11:21

    英偉達(dá)高管:完全自動(dòng)駕駛汽車尚需時(shí)日

    帶來安全隱患,并損害整個(gè)行業(yè)的信譽(yù)。 卡尼指出,自動(dòng)駕駛技術(shù)的研發(fā)是一個(gè)長期且復(fù)雜的過程,需要不斷積累經(jīng)驗(yàn)和數(shù)據(jù),以確保系統(tǒng)的安全性和可靠性。他強(qiáng)調(diào),英偉達(dá)自動(dòng)駕駛
    的頭像 發(fā)表于 01-23 11:27 ?517次閱讀

    英偉達(dá):全自動(dòng)駕駛汽車至少需十年

    自動(dòng)駕駛技術(shù)迅猛發(fā)展的當(dāng)下,英偉達(dá)作為該領(lǐng)域的重要參與者,卻對完全自動(dòng)駕駛的實(shí)現(xiàn)時(shí)間表達(dá)了審慎態(tài)度。 據(jù)Carscoops報(bào)道,
    的頭像 發(fā)表于 01-23 11:08 ?566次閱讀

    黃仁勛宣布:豐田與英偉達(dá)攜手打造下一代自動(dòng)駕駛汽車

    自動(dòng)駕駛技術(shù)的研發(fā)上注入了新的活力。 黃仁勛表示,英偉達(dá)與豐田的合作將充分利用雙方在各自領(lǐng)域的優(yōu)勢,共同推動(dòng)自動(dòng)駕駛汽車技術(shù)的發(fā)展。
    的頭像 發(fā)表于 01-09 10:25 ?658次閱讀

    英偉達(dá)發(fā)布Cosmos世界基礎(chǔ)模型

    自動(dòng)駕駛汽車、機(jī)器人等物理AI系統(tǒng)的開發(fā)進(jìn)程。 Cosmos平臺(tái)的核心在于強(qiáng)大的生成世界基礎(chǔ)模型,這一模型能夠模擬和預(yù)測現(xiàn)實(shí)世界的各種復(fù)雜
    的頭像 發(fā)表于 01-09 10:23 ?715次閱讀

    英偉達(dá)在華加大招聘,聚焦自動(dòng)駕駛技術(shù)

    近日,據(jù)最新報(bào)道,英偉達(dá)公司今年在中國市場顯著加大了招聘力度,旨在增強(qiáng)研發(fā)能力,并深入探索最新的自動(dòng)駕駛技術(shù)。這一戰(zhàn)略調(diào)整反映了英偉
    的頭像 發(fā)表于 12-13 10:32 ?851次閱讀

    Waymo利用谷歌Gemini大模型,研發(fā)端到端自動(dòng)駕駛系統(tǒng)

    10月31日訊,自動(dòng)駕駛領(lǐng)域的先鋒Waymo,作為Alphabet旗下的一員,長久以來將其與谷歌DeepMind的緊密合作及深厚的AI研究底蘊(yùn)視為
    的頭像 發(fā)表于 10-31 16:55 ?1730次閱讀

    人工智能的應(yīng)用領(lǐng)域自動(dòng)駕駛

    人工智能的應(yīng)用領(lǐng)域確實(shí)包括自動(dòng)駕駛 。近年來,隨著科技的迅猛發(fā)展,人工智能(AI)的應(yīng)用已經(jīng)滲透到生活的方方面面,特別是在自動(dòng)駕駛領(lǐng)域,
    的頭像 發(fā)表于 10-22 16:18 ?1220次閱讀

    英偉達(dá)Cosmos AI項(xiàng)目曝光:構(gòu)建先進(jìn)視頻模型

    近日,英偉達(dá)內(nèi)部一項(xiàng)名為Cosmos的AI項(xiàng)目浮出水面,引起了業(yè)界的廣泛關(guān)注。該項(xiàng)目尚處于保密階段,未向公眾正式發(fā)布,但雄心勃勃的目標(biāo)已初
    的頭像 發(fā)表于 08-07 16:51 ?841次閱讀

    FPGA在自動(dòng)駕駛領(lǐng)域有哪些優(yōu)勢?

    FPGA(Field-Programmable Gate Array,現(xiàn)場可編程門陣列)在自動(dòng)駕駛領(lǐng)域具有顯著的優(yōu)勢,這些優(yōu)勢使得FPGA成為自動(dòng)駕駛技術(shù)中不可或缺的一部分。以下是FPGA在
    發(fā)表于 07-29 17:11

    FPGA在自動(dòng)駕駛領(lǐng)域有哪些應(yīng)用?

    FPGA(Field-Programmable Gate Array,現(xiàn)場可編程門陣列)在自動(dòng)駕駛領(lǐng)域具有廣泛的應(yīng)用,高性能、可配置性、低功耗和低延遲等特點(diǎn)為自動(dòng)駕駛的實(shí)現(xiàn)提供了強(qiáng)有
    發(fā)表于 07-29 17:09