一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA助力提供多樣、靈活的模型選擇

NVIDIA英偉達(dá) ? 來源:NVIDIA英偉達(dá) ? 2024-09-09 09:19 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

案例簡介

在本案例中,Dify 以模型中立以及開源生態(tài)的優(yōu)勢,為廣大 AI 創(chuàng)新者提供豐富的模型選擇。其集成的 NVIDIAAPI Catalog、NVIDIA NIM和Triton 推理服務(wù)器產(chǎn)品,為 Dify.AI 提供了靈活多樣的模型集成選擇,專業(yè)、高效的模型接入方式讓開發(fā)者用戶能夠構(gòu)建豐富的 AI 應(yīng)用場景。

AI 應(yīng)用面臨落地挑戰(zhàn)

隨著 AI 應(yīng)用場景的不斷豐富,Dify 在 AI 應(yīng)用的落地方面面臨了幾個關(guān)鍵挑戰(zhàn),這些挑戰(zhàn)成為了采用 NVIDIA 產(chǎn)品和技術(shù)的主要驅(qū)動力:

復(fù)雜應(yīng)用場景需要多個模型結(jié)合使用:隨著越來越豐富的 AI 應(yīng)用情景探索,越來越多的企業(yè)都期望能靈活使用當(dāng)前最先進(jìn)的閉源或開源模型,來定制落地方案,以獲得模型在不同情境下的能力表現(xiàn)、成本、性能等方面的最佳組合結(jié)果。

大模型的性能和穩(wěn)定性風(fēng)險(xiǎn):?模型的訓(xùn)練和推理對算力、算法、數(shù)據(jù)都有很高要求,如果選型不當(dāng)或優(yōu)化不足,可能影響應(yīng)?的性能和穩(wěn)定性。

數(shù)據(jù)安全和隱私保護(hù)風(fēng)險(xiǎn):企業(yè)在落地 AI 應(yīng)用時(shí),出于對敏感場景應(yīng)用和企業(yè)數(shù)據(jù)安全的考慮,會更傾向本地部署推理框架來運(yùn)行他們的本地模型。

NVIDIA 助力提供多樣、靈活的模型選擇

Dify 平臺與數(shù)百種專有/開源模型以及數(shù)十種推理提供商、自托管解決方案無縫集成,包括 LLM 推理框架、Rerank 模型、Embedding 模型等類型,允許用戶根據(jù)其具體場景需要,隨時(shí)切換/使用不同的模型能力。其中,Dify 集成了 API Catalog、NVIDIA NIM 和 Triton 推理服務(wù)器開源軟件產(chǎn)品作為可選模型平臺之一,具體作用如下所述:

提供豐富的預(yù)訓(xùn)練模型,滿足多樣化需求

API Catalog 提供了大量針對NVIDIA GPU優(yōu)化的預(yù)訓(xùn)練模型,涵蓋了 LLM、Embedding、Rerank 和 Vision 多個種類。它主要用于評估和測試,提供一個統(tǒng)一的接口,可以測試各種模型,節(jié)省開發(fā)成本。API Catalog 會持續(xù)更新最新的模型,幫助 Dify 用戶加速前期的測試和評估,并為之后的量產(chǎn)部署做好鋪墊,加速 AI 應(yīng)用的開發(fā)和落地。

簡化部署流程,加速生成式 AI 模型上線

NVIDIA NIM 將 AI 模型打包為容器化微服務(wù),開發(fā)者只需幾行代碼即可完成部署,部署時(shí)間可從數(shù)周縮短到數(shù)分鐘。這種簡化的部署流程可以顯著加速生成式 AI 模型的上線,使企業(yè)能夠快速將模型集成到 Dify 的 AI 工作流中,實(shí)現(xiàn) AI 應(yīng)用落地。

優(yōu)化推理性能,提供高效穩(wěn)定的 AI 服務(wù)

Triton 推理服務(wù)器提供了一個優(yōu)化和標(biāo)準(zhǔn)化的平臺,用于部署和執(zhí)行來自多種深度學(xué)習(xí)機(jī)器學(xué)習(xí)框架的 AI 模型。它適用于通用的 AI 推理工作負(fù)載,為開發(fā)者在 Dify 平臺上編排 AI 應(yīng)用提供高效穩(wěn)定的模型服務(wù)。

靈活調(diào)用模型,適應(yīng)不同場景需求

通過 Triton 推理服務(wù)器和 NVIDIA NIM 完成模型部署后,用戶可以在 Dify 平臺中輕松調(diào)用所需的模型。只需在模型設(shè)置中填寫 Server URL、Model Name 等憑據(jù),即可根據(jù)具體的場景需求,隨時(shí)切換或使用不同的模型能力。這種靈活的模型調(diào)用方式可以幫助企業(yè)快速適應(yīng)不斷變化的業(yè)務(wù)需求,提高 AI 應(yīng)用的適應(yīng)性和可擴(kuò)展性。

加入 NVIDIA Inception,

融入全球開發(fā)者社區(qū)生態(tài)

Dify 不僅與 NVIDIA 在模型層面實(shí)現(xiàn)了深度集成,其還于 2024 年 4 月入選了NVIDIA Inception 初創(chuàng)加速計(jì)劃。Dify 也受邀參加了 NVIDIA 初創(chuàng)加速計(jì)劃最新開啟的系列技術(shù)加速營,獲得了與眾多 AI 創(chuàng)新者、行業(yè)客戶、生態(tài)上下游企業(yè)交流合作和極大的市場曝光機(jī)會。

加入 NVIDIA 初創(chuàng)加速計(jì)劃對 Dify 來說,標(biāo)志著一個新的里程碑,Dify 將借助 NVIDIA 的影響力鏈接全球開發(fā)者,在其領(lǐng)先技術(shù)的助力下,不斷突破,打造更繁榮的生態(tài)和產(chǎn)品。

Dify 創(chuàng)始人兼 CEO 張路宇表示:“Dify 成立的第一天,就定位是一個面向全球開發(fā)者用戶的產(chǎn)品,我們希望接入全球領(lǐng)先的大模型,共創(chuàng) AI 解決方案,為不同行業(yè)落地 AI 的企業(yè)、AI 創(chuàng)新者們提供開箱即用的 LLM 應(yīng)用開發(fā)平臺,這也是我們首選 NVIDIA 的原因。在全球的客戶生態(tài)、開發(fā)者生態(tài)經(jīng)營上,NVIDIA 毋庸置疑是我們最好的選擇?!?/p>

繁榮的開源社區(qū)生態(tài),

加速 AI 創(chuàng)新應(yīng)用落地

Dify 團(tuán)隊(duì)成立于 2023 年 3 月,同年 5 月發(fā)布 Dify.AI 第一個版本并開源。基于 LLMOps 及后端即服務(wù)的理念,為企業(yè)提供從 Agent 構(gòu)建到 AI workflow 編排、RAG 檢索、模型管理等能力,致力于打造?個開放的 LLM 應(yīng)?開發(fā)平臺,降低 LLM 應(yīng)?程序的開發(fā)和部署復(fù)雜性,幫助應(yīng)?開發(fā)者更快地搭建和運(yùn)營?產(chǎn)級的?成式 AI 應(yīng)?。

Dify 在開源社區(qū)受到全球開發(fā)者的關(guān)注和喜愛,在短短一年的時(shí)間內(nèi),stars 數(shù)已超過 36,000+,達(dá)到數(shù)十萬次下載量,多次登榜 GitHub 全球趨勢榜單。GitHub stars 已超越知名 AI Infra 產(chǎn)品如 LlamaIndex、flowise 等,僅次于 LangChain。面向需要探索 AI 應(yīng)用創(chuàng)新、AI 應(yīng)用落地業(yè)務(wù)的開發(fā)者或企業(yè)客戶,Dify 提供成熟的應(yīng)用開發(fā)工具平臺,加速 AI 落地業(yè)務(wù)的過程。

截至 2024 年 4 月,Dify.AI 已經(jīng)服務(wù)了十余家 500 強(qiáng)企業(yè)和數(shù)十家上市公司。全球領(lǐng)先企業(yè)選擇 Dify 作為 LLM App Stack,標(biāo)桿客戶覆蓋汽車、先進(jìn)制造、消費(fèi)、半導(dǎo)體、醫(yī)藥等行業(yè),如理想汽車、研華股份、百勝中國、Panasonic、Advantech、安克創(chuàng)新、得到等。Dify.AI 同時(shí)也吸引了全球范圍內(nèi)關(guān)注 LLM 應(yīng)用技術(shù)的創(chuàng)業(yè)者和服務(wù)商,他們可以基于 NVIDIA 的資源和生態(tài),利用 Dify 作為開發(fā)工具,創(chuàng)造出更多創(chuàng)新性 AI 產(chǎn)品和服務(wù),帶來更多生態(tài)合作的空間。

NVIDIA 初創(chuàng)加速計(jì)劃

Dify.AI是 NVIDIA 初創(chuàng)加速計(jì)劃 (NVIDIA Inception) 會員企業(yè)。 NVIDIA 初創(chuàng)加速計(jì)劃為免費(fèi)會員制,旨在培養(yǎng)顛覆行業(yè)格局的優(yōu)秀創(chuàng)業(yè)公司。該計(jì)劃聯(lián)合國內(nèi)外知名的風(fēng)投機(jī)構(gòu)、創(chuàng)業(yè)孵化器、創(chuàng)業(yè)加速器、行業(yè)合作伙伴以及科技創(chuàng)業(yè)媒體等,打造創(chuàng)業(yè)加速生態(tài)系統(tǒng)。能夠提供產(chǎn)品折扣、技術(shù)支持、市場宣傳、融資對接、業(yè)務(wù)推薦等一系列服務(wù),加速創(chuàng)業(yè)公司的發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5309

    瀏覽量

    106384
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    35136

    瀏覽量

    279778
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3141

    瀏覽量

    4066

原文標(biāo)題:初創(chuàng)加速計(jì)劃 | NVIDIA 賦能 Dify.AI,加速企業(yè) AI 應(yīng)用落地

文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何本地部署NVIDIA Cosmos Reason-1-7B模型

    近日,NVIDIA 開源其物理 AI 平臺 NVIDIA Cosmos 中的關(guān)鍵模型——NVIDIA Cosmos Reason-1-7B。這款先進(jìn)的多模態(tài)大
    的頭像 發(fā)表于 07-09 10:17 ?162次閱讀

    歐洲借助NVIDIA Nemotron優(yōu)化主權(quán)大語言模型

    NVIDIA 正攜手歐洲和中東的模型構(gòu)建商與云提供商,共同優(yōu)化主權(quán)大語言模型 (LLM),加速該地區(qū)各行業(yè)采用企業(yè)級 AI。
    的頭像 發(fā)表于 06-12 15:42 ?427次閱讀

    NVIDIA助力解決量子計(jì)算領(lǐng)域重大挑戰(zhàn)

    NVIDIA 加速量子研究中心提供了強(qiáng)大的工具,助力解決量子計(jì)算領(lǐng)域的重大挑戰(zhàn)。
    的頭像 發(fā)表于 03-27 09:17 ?614次閱讀

    NVIDIA發(fā)布全球首個開源人形機(jī)器人基礎(chǔ)模型Isaac GR00T N1

    NVIDIA 宣布推出一系列全新技術(shù),助力人形機(jī)器人開發(fā)。其中包括全球首個開源且完全可定制的基礎(chǔ)模型NVIDIA Isaac GR00T N1,該
    的頭像 發(fā)表于 03-20 14:34 ?722次閱讀

    NVIDIA 推出開放推理 AI 模型系列,助力開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺

    月 18 日 —— ?NVIDIA 今日發(fā)布具有推理功能的開源 Llama Nemotron 模型系列,旨在為開發(fā)者和企業(yè)提供業(yè)務(wù)就緒型基礎(chǔ),助力構(gòu)建能夠獨(dú)立工作或以團(tuán)隊(duì)形式完成復(fù)雜
    發(fā)表于 03-19 09:31 ?237次閱讀
    <b class='flag-5'>NVIDIA</b> 推出開放推理 AI <b class='flag-5'>模型</b>系列,<b class='flag-5'>助力</b>開發(fā)者和企業(yè)構(gòu)建代理式 AI 平臺

    NVIDIA推出開放式Llama Nemotron系列模型

    作為 NVIDIA NIM 微服務(wù),開放式 Llama Nemotron 大語言模型和 Cosmos Nemotron 視覺語言模型可在任何加速系統(tǒng)上為 AI 智能體提供強(qiáng)效
    的頭像 發(fā)表于 01-09 11:11 ?747次閱讀

    NVIDIA推出面向RTX AI PC的AI基礎(chǔ)模型

    NVIDIA 今日發(fā)布能在 NVIDIA RTX AI PC 本地運(yùn)行的基礎(chǔ)模型,為數(shù)字人、內(nèi)容創(chuàng)作、生產(chǎn)力和開發(fā)提供強(qiáng)大助力
    的頭像 發(fā)表于 01-08 11:01 ?549次閱讀

    NVIDIA Cosmos世界基礎(chǔ)模型平臺發(fā)布

    NVIDIA 宣布推出NVIDIA Cosmos,該平臺由先進(jìn)的生成式世界基礎(chǔ)模型、高級 tokenizer、護(hù)欄和加速視頻處理管線組成,將推動自動駕駛汽車(AV)和機(jī)器人等物理 AI 系統(tǒng)的發(fā)展。
    的頭像 發(fā)表于 01-08 10:39 ?563次閱讀

    NVIDIA推出全新生成式AI模型Fugatto

    NVIDIA 開發(fā)了一個全新的生成式 AI 模型。利用輸入的文本和音頻,該模型可以創(chuàng)作出包含任意的音樂、人聲和聲音組合的作品。
    的頭像 發(fā)表于 11-27 11:29 ?819次閱讀

    NVIDIA Isaac Sim滿足模型多樣化訓(xùn)練需求

    光輪智能借助?NVIDIA Isaac Sim,通過 3D 生成與建模技術(shù)構(gòu)建高度逼真的虛擬場景,將現(xiàn)實(shí)世界的復(fù)雜場景抽象并轉(zhuǎn)化為高質(zhì)量的訓(xùn)練數(shù)據(jù)源,從而更有效地滿足模型多樣化訓(xùn)練需求。 AI
    的頭像 發(fā)表于 11-23 14:55 ?1369次閱讀

    NVIDIA AI助力初創(chuàng)企業(yè)為心理治療師提供AI工具

    NVIDIA AI 助力初創(chuàng)企業(yè)為心理治療師提供 AI 工具,以此來優(yōu)化和提升心理健康服務(wù)水平,為人們的心理健康保駕護(hù)航。
    的頭像 發(fā)表于 11-19 16:03 ?577次閱讀

    NVIDIA助力Amdocs打造生成式AI智能體

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開發(fā)和交付基于商用大語言模型(LLM)和領(lǐng)域適配模型的解決方案。該公司還在使用
    的頭像 發(fā)表于 11-19 14:48 ?909次閱讀

    NVIDIA NIM助力企業(yè)高效部署生成式AI模型

    Canonical、Nutanix 和 Red Hat 等廠商的開源 Kubernetes 平臺集成了 NVIDIA NIM,將允許用戶通過 API 調(diào)用來大規(guī)模地部署大語言模型。
    的頭像 發(fā)表于 10-10 09:49 ?765次閱讀

    NVIDIA Modulus助力風(fēng)阻預(yù)測模型實(shí)現(xiàn)

    NVIDIA 與百度飛槳雙方技術(shù)團(tuán)隊(duì)通過在數(shù)據(jù)、算法、模型等多個方面的合作,共同打造了一款適用于車輛空氣動力學(xué)數(shù)值模擬的 3D 高精度汽車風(fēng)阻預(yù)測模型——DNNFluid-Car。經(jīng)過訓(xùn)練
    的頭像 發(fā)表于 08-23 17:10 ?1422次閱讀

    NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

    Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護(hù)到評估的全方位生成式 AI 模型服務(wù),以便部署自定義 Llama 3.1 NVIDIA NIM 微服務(wù)和新的 NVIDIA
    發(fā)表于 07-24 09:39 ?918次閱讀
    <b class='flag-5'>NVIDIA</b> AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI <b class='flag-5'>模型</b>