一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

全新 NVIDIA NeMo Retriever微服務(wù)大幅提升LLM的準(zhǔn)確性和吞吐量

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2024-07-26 11:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

企業(yè)能夠通過提供檢索增強(qiáng)生成功能的生產(chǎn)就緒型 NVIDIA NIM 推理微服務(wù),充分挖掘業(yè)務(wù)數(shù)據(jù)的價(jià)值。這些微服務(wù)現(xiàn)已集成到 Cohesity、DataStax、NetApp 和 Snowflake 平臺(tái)中。

如果缺乏準(zhǔn)確性,生成式 AI 應(yīng)用不但無法產(chǎn)生價(jià)值,有時(shí)甚至還會(huì)產(chǎn)生負(fù)價(jià)值。而準(zhǔn)確性的根源在于數(shù)據(jù)。

為幫助開發(fā)者高效獲取最佳的專有數(shù)據(jù),以便為他們的 AI 應(yīng)用生成知識(shí)淵博的回答,NVIDIA 宣布推出四項(xiàng)全新的 NVIDIA NeMo Retriever NIM 推理微服務(wù)。

Llama 3.1 模型集也同期發(fā)布。當(dāng)與適用于該模型集的 NVIDIA NIM 推理微服務(wù)相結(jié)合時(shí),NeMo Retriever NIM 推理微服務(wù)不僅能夠使企業(yè)擴(kuò)展到代理式 AI 工作流(在此工作流中,AI 應(yīng)用可以在最少的干預(yù)或監(jiān)督下準(zhǔn)確運(yùn)行),還能夠提供極為精準(zhǔn)的檢索增強(qiáng)生成(RAG)。

通過 NeMo Retriever,企業(yè)可以將自定義模型與各種業(yè)務(wù)數(shù)據(jù)無縫連接,并使用 RAG 為 AI 應(yīng)用作出高度準(zhǔn)確的回答。這套生產(chǎn)就緒型微服務(wù)實(shí)際上為創(chuàng)建高度準(zhǔn)確的 AI 應(yīng)用提供了非常精準(zhǔn)的信息檢索功能。

例如當(dāng)開發(fā)者創(chuàng)建 AI 智能體和客服聊天機(jī)器人、分析安全漏洞或從復(fù)雜的供應(yīng)鏈信息中提取洞察時(shí),NeMo Retriever 能夠大幅提高模型的準(zhǔn)確性和吞吐量。

NIM 推理微服務(wù)實(shí)現(xiàn)了高性能、易于使用的企業(yè)級(jí)推理。開發(fā)者能夠使用 NeMo Retriever NIM 微服務(wù)并充分利用自己的數(shù)據(jù),來獲得這一切。

已正式發(fā)布的全新 NeMo Retriever 向量化和重排序 NIM 微服務(wù)如下:

NV-EmbedQA-E5-v5:一個(gè)常用社區(qū)基礎(chǔ)向量化模型,針對(duì)文本問答檢索進(jìn)行了優(yōu)化

NV-EmbedQA-Mistral7B-v2:一個(gè)常用多語言社區(qū)基礎(chǔ)模型,針對(duì)文本向量化功能進(jìn)行了微調(diào),以實(shí)現(xiàn)高度準(zhǔn)確的問答

Snowflake-Arctic-Embed-L:一個(gè)經(jīng)過優(yōu)化的社區(qū)模型

NV-RerankQA-Mistral4B-v3:一個(gè)常用社區(qū)基礎(chǔ)模型,針對(duì)文本重排功能進(jìn)行了微調(diào),以實(shí)現(xiàn)高度準(zhǔn)確的問答

這些模型加入到 NIM 微服務(wù)集中,可通過 NVIDIA API 目錄輕松訪問。

向量化和重排序模型

NeMo Retriever NIM 微服務(wù)包含兩種模型——向量化和重排序模型,以及確保透明度和可靠性的開放式和商業(yè)化服務(wù)。

2b24405a-4a67-11ef-b8af-92fbcf53809c.png

RAG 管線示例:使用了適用于 Llama 3.1 的 NVIDIA NIM 微服務(wù)以及適用于客服 AI 聊天機(jī)器人應(yīng)用的 NeMo Retriever 向量化和重排序 NIM 微服務(wù)

向量化模型在將文本、圖像、圖表和視頻等各種數(shù)據(jù)轉(zhuǎn)化為數(shù)字向量,并存儲(chǔ)在向量數(shù)據(jù)庫中的同時(shí),獲取其含義和細(xì)微差別。與傳統(tǒng)的大語言模型(LLM)相比,向量化模型速度更快且計(jì)算成本更低。

重排序模型可獲取數(shù)據(jù)和查詢,隨后根據(jù)數(shù)據(jù)與查詢的相關(guān)性對(duì)數(shù)據(jù)進(jìn)行評(píng)分。與向量化模型相比,這類模型雖然計(jì)算復(fù)雜且速度較慢,但能大幅提高準(zhǔn)確性。

NeMo Retriever 提供了兩全其美的解決方案。開發(fā)者可以充分利用 NeMo Retriever 建立一個(gè)能夠給企業(yè)提供最有用、最準(zhǔn)確結(jié)果的流程。該流程先通過向量化 NIM 檢索巨大的數(shù)據(jù)網(wǎng),然后使用重排序 NIM 篩選結(jié)果的相關(guān)性。

通過 NeMo Retriever,開發(fā)者能夠使用先進(jìn)的開源商業(yè)模型,構(gòu)建極為精準(zhǔn)的文本問答檢索管線。與其他模型相比,NeMo Retriever NIM 微服務(wù)在企業(yè)問答中提供的不準(zhǔn)確答案減少了 30%。

2b430cba-4a67-11ef-b8af-92fbcf53809c.png

NeMo Retriever 向量化 NIM 和向量化 + 重排序 NIM 微服務(wù)性能與詞法搜索和替代向量的對(duì)比。

熱門用例

無論是 RAG 和 AI 智能體解決方案,還是數(shù)據(jù)驅(qū)動(dòng)的分析,NeMo Retriever 都能夠?yàn)楦鞣N AI 應(yīng)用提供助力。

這套微服務(wù)可用于創(chuàng)建能夠作出準(zhǔn)確、情境感知響應(yīng)的智能聊天機(jī)器人、幫助分析海量數(shù)據(jù)以識(shí)別安全漏洞、從復(fù)雜的供應(yīng)鏈信息中提取洞察等。它們還能勝任許多其他任務(wù),比如幫助 AI 賦能的零售業(yè)購物顧問提供自然、個(gè)性化的購物體驗(yàn)。

針對(duì)這些用例的 NVIDIA AI 工作流為開發(fā)生成式 AI 賦能的技術(shù)提供了一個(gè)簡單且能夠獲得支持的起點(diǎn)。

數(shù)十家 NVIDIA 數(shù)據(jù)平臺(tái)合作伙伴正在使用 NeMo Retriever NIM 微服務(wù)提高其 AI 模型的準(zhǔn)確性和吞吐量。

DataStax 在其 Astra DB 和超融合平臺(tái)中集成了 NeMo Retriever 向量化 NIM 微服務(wù),使企業(yè)能夠?yàn)榭蛻籼峁?zhǔn)確的、經(jīng)過生成式 AI 增強(qiáng)的 RAG 功能,并加快產(chǎn)品上市時(shí)間。

Cohesity 將在其 AI 產(chǎn)品 Cohesity Gaia 中集成 NVIDIA NeMo Retriever 微服務(wù),以便幫助客戶通過 RAG 將自己的數(shù)據(jù)用于驅(qū)動(dòng)富有洞察力和變革性的生成式 AI 應(yīng)用。

Kinetica 將使用 NVIDIA NeMo Retriever 開發(fā) LLM 智能體。這些智能體能夠通過自然語言與復(fù)雜的網(wǎng)絡(luò)進(jìn)行交互,從而對(duì)中斷或漏洞作出更快的響應(yīng),將洞察轉(zhuǎn)化為即時(shí)行動(dòng)。

NetApp 正在與 NVIDIA 合作,將 NeMo Retriever 微服務(wù)連接到其智能數(shù)據(jù)基礎(chǔ)設(shè)施上的 EB 級(jí)數(shù)據(jù)。所有 NetApp ONTAP 客戶都將能夠“與他們的數(shù)據(jù)無縫對(duì)話”,在不影響數(shù)據(jù)安全或隱私的情況下獲得專屬的業(yè)務(wù)洞察。

NVIDIA 全球系統(tǒng)集成商合作伙伴包括埃森哲、德勤、Infosys、LTTS、Tata Consultancy Services、Tech Mahindra 和 Wipro 等,以及服務(wù)交付合作伙伴 Data Monsters、EXLService (愛爾蘭) Limited、Latentview、Quantiphi、Slalom、SoftServe 和 Tredence 正在開發(fā)各種服務(wù),幫助企業(yè)將 NeMo Retriever NIM 微服務(wù)添加到他們的 AI 管線中。

與其他 NIM 微服務(wù)一起使用

NeMo Retriever NIM 微服務(wù)可與 NVIDIA Riva NIM 微服務(wù)一起使用。后者為各行各業(yè)的語音 AI 應(yīng)用提供強(qiáng)大助力,增強(qiáng)了客戶服務(wù)并且讓數(shù)字人變得栩栩如生。

即將以 Riva NIM 微服務(wù)形式推出的新模型包括:適用于文本轉(zhuǎn)語音應(yīng)用的 FastPitch 和 HiFi-GAN;適用于多語言神經(jīng)機(jī)器翻譯的 Megatron;以及適用于自動(dòng)語音識(shí)別的破紀(jì)錄 NVIDIA Parakeet 系列模型。

NVIDIA NIM 微服務(wù)既可以組合使用,也可以單獨(dú)使用,為開發(fā)者提供構(gòu)建 AI 應(yīng)用的模塊化方法。這些微服務(wù)還可以在云端、本地或混合環(huán)境中與社區(qū)模型、NVIDIA 模型或用戶自定義模型集成,為開發(fā)者帶來了更大的靈活性。

NVIDIA NIM 微服務(wù)現(xiàn)在可在 ai.nvidia.com 上獲取。企業(yè)可通過 NVIDIA AI Enterprise 軟件平臺(tái)使用 NIM 將 AI 應(yīng)用部署到生產(chǎn)中。

NIM 微服務(wù)可在客戶首選的加速基礎(chǔ)設(shè)施上運(yùn)行,包括亞馬遜科技、谷歌云、Microsoft Azure 和 Oracle Cloud Infrastructure 的云實(shí)例,以及思科、戴爾科技、慧與、聯(lián)想和 Supermicro 等全球服務(wù)器制造合作伙伴的 NVIDIA 認(rèn)證系統(tǒng)。

NVIDIA 開發(fā)者計(jì)劃會(huì)員很快將能夠免費(fèi)使用 NIM,以在他們首選的基礎(chǔ)設(shè)施上進(jìn)行研究、開發(fā)和測試。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 機(jī)器人
    +關(guān)注

    關(guān)注

    213

    文章

    29718

    瀏覽量

    212746
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5304

    瀏覽量

    106316
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35065

    瀏覽量

    279293
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    325

    瀏覽量

    832

原文標(biāo)題:上吧,AI!全新 NVIDIA NeMo Retriever 微服務(wù)大幅提升 LLM 的準(zhǔn)確性和吞吐量

文章出處:【微信號(hào):NVIDIA-Enterprise,微信公眾號(hào):NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    數(shù)據(jù)吞吐量提升!面向下一代音頻設(shè)備,藍(lán)牙HDT、星閃、Wi-Fi、UWB同臺(tái)競技

    電子發(fā)燒友網(wǎng)報(bào)道(文/莫婷婷)音頻設(shè)備數(shù)據(jù)吞吐量提升是當(dāng)前無線通信領(lǐng)域的一個(gè)重要發(fā)展趨勢,藍(lán)牙、Wi-Fi和UWB作為三種主要的無線通信技術(shù),在這一趨勢中扮演著關(guān)鍵角色。 ? 數(shù)據(jù)吞吐量指的是在
    的頭像 發(fā)表于 12-25 01:22 ?3209次閱讀

    企業(yè)使用NVIDIA NeMo微服務(wù)構(gòu)建AI智能體平臺(tái)

    已發(fā)布的 NeMo 微服務(wù)可與合作伙伴平臺(tái)集成,作為創(chuàng)建 AI 智能體的構(gòu)建模塊,使用商業(yè)智能與強(qiáng)大的邏輯推理模型 (包括 NVIDIA Llama Nemotron) 處理更多任務(wù)。
    的頭像 發(fā)表于 04-27 15:05 ?515次閱讀

    NVIDIA發(fā)布全新NIM AI Guardrail微服務(wù)

    NVIDIA近期推出了一項(xiàng)旨在保障代理式AI應(yīng)用安全的重要技術(shù)——NIM AI Guardrail微服務(wù)。這一全新微服務(wù)
    的頭像 發(fā)表于 01-18 11:48 ?791次閱讀

    NVIDIA NeMo Guardrails引入三項(xiàng)全新NIM微服務(wù)

    NVIDIA NeMo Guardrails 包含全新 NVIDIA NIM 微服務(wù),能夠?yàn)楦餍袠I(yè)構(gòu)建 AI 的企業(yè)提高 AI 的
    的頭像 發(fā)表于 01-18 09:39 ?696次閱讀

    NVIDIA 發(fā)布保障代理式 AI 應(yīng)用安全的 NIM 微服務(wù)

    NVIDIA NeMo Guardrails 包含全新 NVIDIA NIM 微服務(wù),能夠?yàn)楦餍袠I(yè)構(gòu)建 AI 的企業(yè)提高 AI 的
    發(fā)表于 01-17 16:29 ?156次閱讀

    全新NVIDIA NIM微服務(wù)實(shí)現(xiàn)突破進(jìn)展

    全新 NVIDIA NIM 微服務(wù)實(shí)現(xiàn)突破進(jìn)展,可助力氣象技術(shù)公司開發(fā)和部署 AI 模型,實(shí)現(xiàn)對(duì)降雪、結(jié)冰和冰雹的預(yù)測。
    的頭像 發(fā)表于 11-21 10:07 ?663次閱讀

    日本企業(yè)借助NVIDIA產(chǎn)品加速AI創(chuàng)新

    日本領(lǐng)先企業(yè)和大學(xué)正在使用 NVIDIA NeMo、NIM 微服務(wù)NVIDIA Isaac 加速 AI 創(chuàng)新。
    的頭像 發(fā)表于 11-19 14:34 ?930次閱讀

    如何提升ASR模型的準(zhǔn)確性

    提升ASR(Automatic Speech Recognition,自動(dòng)語音識(shí)別)模型的準(zhǔn)確性是語音識(shí)別技術(shù)領(lǐng)域的核心挑戰(zhàn)之一。以下是一些提升ASR模型準(zhǔn)確性的關(guān)鍵方法: 一、優(yōu)化數(shù)
    的頭像 發(fā)表于 11-18 15:14 ?2315次閱讀

    TMS320VC5510 HPI吞吐量和優(yōu)化

    電子發(fā)燒友網(wǎng)站提供《TMS320VC5510 HPI吞吐量和優(yōu)化.pdf》資料免費(fèi)下載
    發(fā)表于 10-16 09:35 ?0次下載
    TMS320VC5510 HPI<b class='flag-5'>吞吐量</b>和優(yōu)化

    TMS320C6474模塊吞吐量

    電子發(fā)燒友網(wǎng)站提供《TMS320C6474模塊吞吐量.pdf》資料免費(fèi)下載
    發(fā)表于 10-15 13:52 ?0次下載
    TMS320C6474模塊<b class='flag-5'>吞吐量</b>

    NVIDIA NIM微服務(wù)帶來巨大優(yōu)勢

    服務(wù)通過熱門 AI 模型為數(shù)百萬開發(fā)者帶來高達(dá) 5 倍的 token 效率提升,使他們能夠立即訪問在 NVIDIA DGX Cloud 上運(yùn)行的 NIM 微服務(wù)。
    的頭像 發(fā)表于 08-23 15:20 ?961次閱讀

    采用OpenUSD和NVIDIA NIM微服務(wù)創(chuàng)建精準(zhǔn)品牌視覺

    全球領(lǐng)先的創(chuàng)意和制作服務(wù)機(jī)構(gòu)率先采用 OpenUSD 和 NVIDIA NIM 微服務(wù)來創(chuàng)建精準(zhǔn)的品牌視覺。
    的頭像 發(fā)表于 08-01 14:33 ?751次閱讀

    英偉達(dá)推出全新NVIDIA AI Foundry服務(wù)NVIDIA NIM推理微服務(wù)

    NVIDIA 宣布推出全新 NVIDIA AI Foundry 服務(wù)NVIDIA NIM 推理微服務(wù)
    的頭像 發(fā)表于 07-25 09:48 ?1052次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    Retriever 微服務(wù),以實(shí)現(xiàn)準(zhǔn)確響應(yīng) 埃森哲率先使用新服務(wù),為客戶創(chuàng)建自定義 Llama 3.1 模型;Aramco、ATT 和優(yōu)步。 ? Llama 3.1 多語種大語言模型
    發(fā)表于 07-24 09:39 ?914次閱讀
    <b class='flag-5'>NVIDIA</b> AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    求助,關(guān)于使用iperf測量mesh節(jié)點(diǎn)吞吐量問題求解

    輸出,只能手動(dòng)ctrl+]退出,服務(wù)端收數(shù)據(jù)這邊吞吐量歸零,正常走完iperf測試時(shí)間(我設(shè)定的15s)后出現(xiàn)W (897098) iperf: tcp server recv error, error
    發(fā)表于 07-23 06:59