一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

真格基金宣布捐贈(zèng)開源AI項(xiàng)目vLLM

真格基金 ? 來源:真格基金 ? 2024-09-24 16:13 ? 次閱讀

今天,真格基金高興地宣布向開源 AI 項(xiàng)目 vLLM 提供捐贈(zèng)。

開源技術(shù)處于 AI 革命的中心。Llama 3、Mistral 等開源大模型迅速追趕 GPT-4,TensorFlow、Pytorch 等開源深度學(xué)習(xí)框架提供了豐富的庫和工具。GitHub 上有 6 萬個(gè)通用人工智能項(xiàng)目,Hugging Face 上有超過 40 萬個(gè)模型。每一周,有超過 100 萬行代碼在開源 AI 領(lǐng)域中創(chuàng)建,開發(fā)者像交換禮物一樣,從全世界的各個(gè)角落為開源項(xiàng)目作出貢獻(xiàn)。

2022 年,一個(gè)加州大學(xué)伯克利分校的 3 人團(tuán)隊(duì)從一個(gè)加速 OPT-175B 訓(xùn)練推理的 demo 項(xiàng)目開始,在兩年的時(shí)間里搭建出了全球范圍內(nèi)最受歡迎的開源大模型推理加速框架 vLLM。

vLLM(https://github.com/vllm-project/vllm)的目標(biāo)是,搭建最快速、最易用的開源 LLM 推理服務(wù)引擎(Build the fastest and easiest-to-use open-source LLM inference & serving engine)。

與 Hugging Face Transformers 相比,它提供高達(dá) 24 倍的吞吐量,而無需進(jìn)行任何模型架構(gòu)更改。今天,vLLM 在 GitHub 上的星標(biāo)數(shù)已經(jīng)突破 21.8k,而距離去年 6 月開源以來只過去了一年。

vLLM 支持幾乎所有最新的開源 LLM,包括 Mistral,Llama,Gemma 等 30+ 大模型。一個(gè)新的開源大模型,幾乎都會(huì)在發(fā)布前主動(dòng)接觸 vLLM 做好適配優(yōu)化,確保在上線的第一天,大家就能通過 vLLM 來使用它。

vLLM 不執(zhí)著于英偉達(dá) GPU。與其它框架相比,這也是 vLLM 一個(gè)很大的不同點(diǎn)——支持包括 AMD GPU,Intel CPU/GPU/Habana Gaudi,Google TPU,AWS 在內(nèi)市面上最全的硬件架構(gòu)。從項(xiàng)目創(chuàng)立起,vLLM 就希望能廣泛支持能夠使得推理更快、成本更低也更適用的硬件。

在 ChatGPT 上線、Facebook 成為 Meta 之前,vLLM 誕生于一個(gè)名為「Alpa」的自動(dòng)化并行推理 demo 項(xiàng)目。但在部署過程中,vLLM 團(tuán)隊(duì)發(fā)現(xiàn) demo 的速度很慢,GPU 利用率也非常低。這讓他們意識到,大語言模型推理本身就是一個(gè)非常值得關(guān)注的問題。

當(dāng)時(shí)的市面上沒有任何大語言模型推理優(yōu)化的開源系統(tǒng)。于是,團(tuán)隊(duì)決定從 0 開始自己動(dòng)手做一個(gè)。面對 GPU 的內(nèi)存管理帶來的瓶頸,團(tuán)隊(duì)在多次迭代后,基于操作系統(tǒng)中經(jīng)典的虛擬內(nèi)存和分頁技術(shù),提出了全新的注意力算法 PagedAttention,并構(gòu)建了高吞吐量的分布式 LLM 服務(wù)引擎 vLLM,幾乎做到了 KV 緩存內(nèi)存零浪費(fèi)。

2023 年 6 月,創(chuàng)始團(tuán)隊(duì)發(fā)布 vLLM 開源代碼,并一直維護(hù)到今天。下一步,團(tuán)隊(duì)計(jì)劃將資金用于 vLLM 的開發(fā)、測試和性能提升。

40 年前,世界上最后一個(gè)黑客 Richard Stallman 發(fā)起自由軟件運(yùn)動(dòng),開放、平等、協(xié)作、共創(chuàng)的開源精神開始崛起。從 GNU 和 Linux 的結(jié)合,到 MySQL 的第一個(gè)版本發(fā)布,到 Mozilla 項(xiàng)目的成立,到分布式版本控制系統(tǒng) Git 的雛形面世、Android 的誕生,再到 GitHub 席卷全球,開源帶來的創(chuàng)新幾乎書寫了一部計(jì)算機(jī)信息技術(shù)的歷史。

這種創(chuàng)新來自全世界的聚力協(xié)作。vLLM 的全職團(tuán)隊(duì)只有 3 個(gè)博士生,但 20 多名分布于大模型、Infra、硬件等前沿科技公司的軟件工程師都在為之努力。

為了吸引更多的貢獻(xiàn)者,vLLM 對代碼質(zhì)量要求極高。團(tuán)隊(duì)要求代碼必須模塊化,且非常簡潔易讀。同時(shí),團(tuán)隊(duì)成員會(huì)非常認(rèn)真地做好代碼審查(Code Review),甚至?xí)陂_發(fā)者提交代碼更改(Pull Request,PR)后,在 PR 上接著重構(gòu)后再進(jìn)行合并。

vLLM 社區(qū)的開發(fā)者們在過去 4 場線下見面會(huì)上,會(huì)用網(wǎng)名親切地稱呼彼此。當(dāng)位于硅谷的 vLLM 團(tuán)隊(duì)每天早上醒來,就會(huì)發(fā)現(xiàn)一位來自英國的工程師在夜里默默解決掉了二三十個(gè)問題。

開源短短一年,我們就看見 vLLM 的伯克利團(tuán)隊(duì)之外,包括 Anyscale、IBM、AMD、NeuralMagic、Roblox 在內(nèi)的 300 多名活躍協(xié)作者,在以一行代碼為顆粒度持續(xù)參與貢獻(xiàn)。vLLM GitHub 的每 10 條提交記錄中,就有 8 條來自社區(qū),而這與 Linux Kernel 在發(fā)布 30 年后才達(dá)到的比例狀態(tài)相當(dāng)。

自從成立,真格基金始終是新技術(shù)和創(chuàng)業(yè)精神的堅(jiān)定支持者。我們想成為一直堅(jiān)定地站在創(chuàng)始人身邊的人,陪伴他們引領(lǐng)科技創(chuàng)新并改變這個(gè)世界。2022 年,真格基金就曾向開源項(xiàng)目 ControlNet 發(fā)起捐贈(zèng)。

真格基金管理合伙人戴雨森表示,「這次對 vLLM 這一開源項(xiàng)目的捐贈(zèng),是因?yàn)槲覀兪冀K致力于推動(dòng) AI 的普及,希望新技術(shù)能惠及盡可能多的人類。和工業(yè)界相比,學(xué)術(shù)界的優(yōu)秀工作目前往往受到更多成本和算力的限制。我們相信,改變世界的最好方式是自己創(chuàng)造——如果可以,與全世界的開發(fā)者一起創(chuàng)造。而對于創(chuàng)造未來的重要基石,我們愿盡綿薄之力?!?/p>

如果你在使用 vLLM 時(shí)有任何需求與反饋,歡迎在文章下留言,聯(lián)系真格基金幫忙對接。真格基金一直持續(xù)關(guān)注前沿 AI 領(lǐng)域的發(fā)展,如果你有好的創(chuàng)業(yè)想法,也歡迎和我們聊聊。

文|Wendi

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    33554

    瀏覽量

    274196
  • 開源
    +關(guān)注

    關(guān)注

    3

    文章

    3533

    瀏覽量

    43292
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    2941

    瀏覽量

    3683

原文標(biāo)題:真格基金宣布捐贈(zèng)開源 AI 項(xiàng)目 vLLM

文章出處:【微信號:zhenfund,微信公眾號:真格基金】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    Banana Pi 與瑞薩電子攜手共同推動(dòng)開源創(chuàng)新:BPI-AI2N

    2025年3月11日, Banana Pi 開源硬件平臺很高興宣布,與全球知名半導(dǎo)體解決方案供應(yīng)商瑞薩電子(Renesas Electronics)正式達(dá)成技術(shù)合作關(guān)系。此次合作標(biāo)志著雙方將在開源
    發(fā)表于 03-12 09:43

    開放原子開源基金會(huì)新增捐贈(zèng)人一覽

    2024年12月,新增以下單位成為開放原子開源基金會(huì)及旗下項(xiàng)目捐贈(zèng)人。
    的頭像 發(fā)表于 01-15 10:38 ?519次閱讀

    共建繁榮生態(tài)|開鴻智谷榮獲“2024年度開源鴻蒙社區(qū)卓越單位”

    近日,開放原子開源基金會(huì)OpenHarmony社區(qū)2024年度工作會(huì)議在深圳隆重召開,作為開放原子開源基金會(huì)黃金捐贈(zèng)人、OpenHarmon
    的頭像 發(fā)表于 01-14 21:18 ?437次閱讀
    共建繁榮生態(tài)|開鴻智谷榮獲“2024年度<b class='flag-5'>開源</b>鴻蒙社區(qū)卓越單位”

    共建鴻蒙生態(tài),開放原子開源基金會(huì)為迅龍軟件授牌

    培育壯大我國開源生態(tài)。迅龍軟件作為開源鴻蒙生態(tài)的重要力量,受邀出席此次大會(huì),并在會(huì)上獲頒開放原子開源基金會(huì)的白銀捐贈(zèng)人的授牌。大會(huì)上,
    的頭像 發(fā)表于 01-08 17:36 ?542次閱讀
    共建鴻蒙生態(tài),開放原子<b class='flag-5'>開源</b><b class='flag-5'>基金</b>會(huì)為迅龍軟件授牌

    KWDB開源數(shù)據(jù)庫的未來發(fā)展趨勢

    近日,在2024開放原子開發(fā)者大會(huì)暨首屆開源技術(shù)學(xué)術(shù)大會(huì)開幕式上,開放原子開源基金會(huì)與openKylin、EasyAda、KWDB開源項(xiàng)目
    的頭像 發(fā)表于 01-02 10:31 ?345次閱讀

    探索開源協(xié)作創(chuàng)新中的機(jī)遇與挑戰(zhàn)

    近日,在2024開放原子開發(fā)者大會(huì)暨首屆開源技術(shù)學(xué)術(shù)大會(huì)開幕式上,開放原子開源基金會(huì)與openKylin、EasyAda、KWDB開源項(xiàng)目
    的頭像 發(fā)表于 12-31 11:00 ?411次閱讀

    openKylin開源桌面操作系統(tǒng)的背后故事

    近日,在2024開放原子開發(fā)者大會(huì)暨首屆開源技術(shù)學(xué)術(shù)大會(huì)開幕式上,開放原子開源基金會(huì)與openKylin、EasyAda、KWDB開源項(xiàng)目
    的頭像 發(fā)表于 12-30 10:18 ?466次閱讀

    開放原子開源基金會(huì)與三個(gè)開源項(xiàng)目舉行捐贈(zèng)簽約儀式

    近日,在2024開放原子開發(fā)者大會(huì)暨首屆開源技術(shù)學(xué)術(shù)大會(huì)開幕式上,開放原子開源基金會(huì)秘書長助理李博與openKylin、EasyAda、KWDB開源
    的頭像 發(fā)表于 12-23 11:29 ?508次閱讀

    vLLM項(xiàng)目加入PyTorch生態(tài)系統(tǒng),引領(lǐng)LLM推理新紀(jì)元

    近日,vLLM項(xiàng)目宣布正式成為PyTorch生態(tài)系統(tǒng)的一部分,標(biāo)志著該項(xiàng)目與PyTorch的合作進(jìn)入了一個(gè)全新的階段。本文將從以下幾個(gè)方面進(jìn)行介紹,特別提醒:安裝方案在第四個(gè)部分,可選
    的頭像 發(fā)表于 12-18 17:06 ?611次閱讀
    <b class='flag-5'>vLLM</b><b class='flag-5'>項(xiàng)目</b>加入PyTorch生態(tài)系統(tǒng),引領(lǐng)LLM推理新紀(jì)元

    誠邁科技升級為OpenHarmony項(xiàng)目群A類捐贈(zèng)

    近日,誠邁科技正式升級為開放原子開源基金會(huì)OpenHarmony項(xiàng)目群A類捐贈(zèng)人。作為開源鴻蒙生態(tài)核心共建單位,在2023至2024年度,誠
    的頭像 發(fā)表于 12-13 10:06 ?427次閱讀

    NVIDIA向開放計(jì)算項(xiàng)目捐贈(zèng)Blackwell平臺設(shè)計(jì)

    近日,在美國加利福尼亞州舉行的 OCP 全球峰會(huì)上,NVIDIA 宣布已把 NVIDIA Blackwell 加速計(jì)算平臺的一些基礎(chǔ)元素捐贈(zèng)給開放計(jì)算項(xiàng)目(OCP),并擴(kuò)大 NVIDIA Spectrum-X 對 OCP 標(biāo)準(zhǔn)的
    的頭像 發(fā)表于 11-19 15:30 ?473次閱讀

    Llama 3 與開源AI模型的關(guān)系

    在人工智能(AI)的快速發(fā)展中,開源AI模型扮演著越來越重要的角色。它們不僅推動(dòng)了技術(shù)的創(chuàng)新,還促進(jìn)了全球開發(fā)者社區(qū)的合作。Llama 3,作為一個(gè)新興的AI
    的頭像 發(fā)表于 10-27 14:42 ?621次閱讀

    開放原子開源基金會(huì)五月新增捐贈(zèng)

    2024年5月,新增以下單位成為開放原子開源基金會(huì)及旗下項(xiàng)目捐贈(zèng)人。
    的頭像 發(fā)表于 09-24 10:48 ?1081次閱讀

    迅龍軟件OrangePi?5 Plus順利通過開放原子開源基金會(huì)XTS認(rèn)證

    公益事業(yè)的非營利性獨(dú)立法人機(jī)構(gòu),是我國在開源領(lǐng)域的首個(gè)基金會(huì)。OpenHarmony是由開放原子開源基金會(huì)孵化及運(yùn)營的開源
    的頭像 發(fā)表于 09-09 15:36 ?779次閱讀
    迅龍軟件OrangePi?5 Plus順利通過開放原子<b class='flag-5'>開源</b><b class='flag-5'>基金</b>會(huì)XTS認(rèn)證

    迅龍軟件:作為OpenHarmony項(xiàng)目捐贈(zèng)人,基于開源鴻蒙的OrangePi OS(OH)正在通過XTS認(rèn)證

    作為開放原子開源基金會(huì)的白銀捐贈(zèng)人、OpenHarmony項(xiàng)目群C類捐贈(zèng)人,迅龍軟件受邀參加今年5月在深圳舉行的以“鴻心聚力,智引未來”為主
    的頭像 發(fā)表于 07-23 09:19 ?874次閱讀
    迅龍軟件:作為OpenHarmony<b class='flag-5'>項(xiàng)目</b><b class='flag-5'>捐贈(zèng)</b>人,基于<b class='flag-5'>開源</b>鴻蒙的OrangePi OS(OH)正在通過XTS認(rèn)證