一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Meta推出Llama 2 免費開放商業(yè)和研究機(jī)構(gòu)使用

IEEE電氣電子工程師 ? 來源:IEEE電氣電子工程師 ? 2023-08-02 16:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,Meta推出了Llama 2,這是一個新的大型語言模型,參數(shù)高達(dá)700億。新的生成型人工智能系統(tǒng)代表了OpenAI的變化,但是幾乎沒有分享包括GPT-3/3.5和GPT-4在內(nèi)的大多數(shù)人工智能模型的細(xì)節(jié)。根據(jù)維基百科的數(shù)據(jù),Llama 2的發(fā)布包含了ChatGPT 3.5的40%的參數(shù),其中包括與微軟的重要合作。Redmond也不僅僅是一個名義上的合作伙伴,他最近宣布支持Azure和Windows中的Llama 2。與此同時,高通公司現(xiàn)在表示,它將與Llama 2一起加入LLM競爭,并公布了將Llama 2帶入智能手機(jī)中的計劃。

Meta方面在微軟的Inspire合作伙伴大會上宣布,將與包括微軟在內(nèi)的主要云計算服務(wù)提供商合作,推出新一代開源大模型Llama 2,并將該模型免費開放給商業(yè)和研究機(jī)構(gòu)使用。

這樣的發(fā)展意味著,無論來源如何,開源人工智能模型的能力和覆蓋范圍都將大幅擴(kuò)大。

Llama 2: Fine-tuned and Ready to Chat

Perplexity.ai提供了一個令人印象深刻的多個Llama 2模型的免費在線演示。它的結(jié)果與包括ChatGPT和谷歌Bard在內(nèi)的當(dāng)今頂級聊天機(jī)器人具有競爭力。Llama 2快速生成干凈、自然的文本,盡管不太可能非常出彩,但易于閱讀和理解。Llama 2還可以生成通常理解的事實、生成代碼和求解數(shù)學(xué)方程。

與所有LLM一樣,Llama 2偶爾會產(chǎn)生不正確或不可用的答案,但Meta介紹Llama的論文聲稱,它在學(xué)術(shù)基準(zhǔn)方面與OpenAI的GPT 3.5不相上下,如MMLU(衡量LLM在57門STEM科目中的知識)和GSM8K(衡量LLM對數(shù)學(xué)的理解)。

Meta的研究人員部分是通過純粹的模型大小實現(xiàn)的 —— 但這只是故事的一半。根據(jù)Meta的論文,Llama 2使用了有監(jiān)督的微調(diào)、帶有人類反饋的強(qiáng)化學(xué)習(xí)和一種名為Ghost Attention(GAtt)的新技術(shù),該技術(shù)“能夠在多個回合中進(jìn)行對話控制”。更簡單地說,GAtt幫助Llama在被要求在特定約束下工作時產(chǎn)生所需的結(jié)果,就像被要求“扮演”歷史人物時可能發(fā)生的那樣,或者在諸如架構(gòu)之類的特定主題的上下文中產(chǎn)生響應(yīng)。

25266d8c-3108-11ee-9e74-dac502259ad0.png

META

這些技術(shù)有助于Llama 2提供各種型號,相對于其尺寸,具有可靠的基準(zhǔn)性能。最大的模型Llama 2 70B(有700億個參數(shù))在所有基準(zhǔn)測試中表現(xiàn)最好,但Meta也提供Llama 27 B和Llama 13 B。

參數(shù)較少的變體性能不如Llama 2 70B,但它們足夠緊湊,可以在功能較弱的設(shè)備(如智能手機(jī))上本地運行。領(lǐng)先的智能手機(jī)片上系統(tǒng)(SoC)生產(chǎn)商高通公司宣布與Meta合作,“從2024年開始”讓Llama 2在高通公司支持的智能手機(jī)上本地運行”。

高通公司營銷傳播專家Rodrigo Caruso Neves do Amaral表示:“我們能夠使用我們的軟件工具來編譯和優(yōu)化模型,特別是在我們的Hexagon處理器上運行。無論是對運行這些型號的公司,還是對有時必須為訪問這些應(yīng)用程序付費的消費者,在設(shè)備上運行所節(jié)省的能量都會產(chǎn)生巨大影響?!?/p>

Open Source Fits Where Closed Models Can’t

在智能手機(jī)上離線運行大型語言模型是封閉的人工智能模型(如OpenAI的GPT 3.5和谷歌的PaLM2)無法處理的。這不一定是由于技術(shù)限制(據(jù)推測,OpenAI和谷歌可以提供一種適合智能手機(jī)的模型),而是哲學(xué)上的分歧。OpenAI和谷歌提供LLM作為API。訪問API需要互聯(lián)網(wǎng)連接,客戶將根據(jù)使用情況收費。

相比之下,Llama 2的發(fā)布表示允許無限、免費的商業(yè)和學(xué)術(shù)使用。該許可并不符合開源計劃制定的所有標(biāo)準(zhǔn),因為該許可包括一項條款,要求允許將Llama 2用于“月活躍用戶超過7億”的“產(chǎn)品或服務(wù)”。然而,該條款僅適用于Meta最大的競爭對手,如OpenAI和谷歌。Meta的Llama 2模型已經(jīng)出現(xiàn)在HuggingFace的Open LLM排行榜上,截至7月24日星期一收盤,“Llama-2-70b-chat-hf”的延遲和吞吐量基準(zhǔn)排名第三。(截至發(fā)稿時,目前的頂級模型Stability AI的FreeWilly2實際上已經(jīng)基于Llama 2,但FreeWilly22使用不同的數(shù)據(jù)集對模型進(jìn)行了微調(diào)。)

Srinivas認(rèn)為Llama 2的開源許可證是一個力量倍增器,為開發(fā)者和研究人員提供了一個根據(jù)他們的特定需求調(diào)整模型的機(jī)會?!耙粋€人可以啟動Llama 2的分支,專注于量化,另一個人可以開啟另一個Llama的分支關(guān)注于低階微調(diào),……其他人則可以將更大的模型提煉成更小的模型,從而加速進(jìn)展?!?/p>

事實證明,這對瞄準(zhǔn)邊緣設(shè)備(如智能手機(jī))的開發(fā)人員來說尤其重要。考慮到型號的大小,Llama 2 70B表現(xiàn)出色并不令人驚訝。但Llama 2的較小型號相對于其型號大小也排名良好。在Open LLM排行榜上,大多數(shù)表現(xiàn)優(yōu)于Llama 2的小型模型本身都是基于Meta之前的模型Llama。這表明,隨著開源社區(qū)的開發(fā)人員將他們的才能應(yīng)用到Llama 2中,Llama 2將在排行榜上名列前茅。

Srinivas說:“我認(rèn)為Llama 2 7B和Llama 2 13B已經(jīng)很令人興奮了……這只是一個開始。Meta推出了它,現(xiàn)在人們可以改進(jìn)它??梢詷?gòu)建其他框架和其他工程層,這賦予了每個人更多的權(quán)力。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49007

    瀏覽量

    249274
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3517

    瀏覽量

    50398
  • OpenAI
    +關(guān)注

    關(guān)注

    9

    文章

    1207

    瀏覽量

    8897

原文標(biāo)題:Meta推出Llama 2 免費開放商業(yè)和研究機(jī)構(gòu)使用

文章出處:【微信號:IEEE_China,微信公眾號:IEEE電氣電子工程師】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    使用 NPU 插件對量化的 Llama 3.1 8b 模型進(jìn)行推理時出現(xiàn)“從 __Int64 轉(zhuǎn)換為無符號 int 的錯誤”,怎么解決?

    安裝了 OpenVINO? GenAI 2024.4。 使用以下命令量化 Llama 3.1 8B 模型: optimum-cli export openvino -m meta-llama
    發(fā)表于 06-25 07:20

    無法在OVMS上運行來自Meta的大型語言模型 (LLM),為什么?

    無法在 OVMS 上運行來自 Meta 的大型語言模型 (LLM),例如 LLaMa2。 從 OVMS GitHub* 存儲庫運行 llama_chat Python* Demo 時遇到錯誤。
    發(fā)表于 03-05 08:07

    NVIDIA推出開放Llama Nemotron系列模型

    作為 NVIDIA NIM 微服務(wù),開放Llama Nemotron 大語言模型和 Cosmos Nemotron 視覺語言模型可在任何加速系統(tǒng)上為 AI 智能體提供強(qiáng)效助力。
    的頭像 發(fā)表于 01-09 11:11 ?739次閱讀

    Meta推出Metamate AI工具,進(jìn)軍企業(yè)市場

    基于Meta的大型語言模型Llama構(gòu)建,集成了先進(jìn)的自然語言處理技術(shù)和深度學(xué)習(xí)算法。它能夠幫助員工進(jìn)行編程、開展研究,以及起草內(nèi)部和外部的溝通文稿,極大地提高了工作效率和質(zhì)量。 據(jù)了解,Metamate以
    的頭像 發(fā)表于 12-09 14:57 ?908次閱讀

    Meta推出Llama 3.3 70B,AI大模型競爭白熱化

    在今年的AI領(lǐng)域,Meta也不甘落后,推出了其壓軸之作——Llama 3.3 70B大模型。與此同時,馬斯克的xAI也宣布其Grok模型從今天起全球免費
    的頭像 發(fā)表于 12-09 14:50 ?802次閱讀

    使用NVIDIA TensorRT提升Llama 3.2性能

    Llama 3.2 模型集擴(kuò)展了 Meta Llama 開源模型集的模型陣容,包含視覺語言模型(VLM)、小語言模型(SLM)和支持視覺的更新版 Llama Guard 模型。與 NV
    的頭像 發(fā)表于 11-20 09:59 ?789次閱讀

    Meta發(fā)布Llama 3.2量化版模型

    近日,Meta在開源Llama 3.2的1B與3B模型后,再次為人工智能領(lǐng)域帶來了新進(jìn)展。10月24日,Meta正式推出了這兩個模型的量化版本,旨在進(jìn)一步優(yōu)化模型性能,拓寬其應(yīng)用場景。
    的頭像 發(fā)表于 10-29 11:05 ?842次閱讀

    亞馬遜云科技上線Meta Llama 3.2模型

    亞馬遜云科技近日宣布,Meta公司的新一代模型Llama 3.2已在其平臺上正式上線。該模型包括Meta首款多模態(tài)模型,現(xiàn)已在Amazon Bedrock和Amazon SageMaker中全面可用。
    的頭像 發(fā)表于 10-11 18:08 ?745次閱讀

    亞馬遜云科技正式上線Meta Llama 3.2模型

    亞馬遜云科技宣布,Meta的新一代模型Llama 3.2,包括其首款多模態(tài)模型,現(xiàn)已在Amazon Bedrock和Amazon SageMaker中正式可用。
    的頭像 發(fā)表于 10-11 09:20 ?869次閱讀

    Meta發(fā)布多模態(tài)LLAMA 3.2人工智能模型

    Meta Platforms近日宣布了一項重要技術(shù)突破,成功推出了多模態(tài)LLAMA 3.2人工智能模型。這一創(chuàng)新模型不僅能夠深度解析文本信息,還實現(xiàn)了對圖像內(nèi)容的精準(zhǔn)理解,標(biāo)志著Meta
    的頭像 發(fā)表于 09-27 11:44 ?692次閱讀

    Meta Llama 3.1系列模型可在Google Cloud上使用

    我們很高興宣布,Llama 3.1 系列模型已添加到 Vertex AI Model Garden,這包括全新的 405B,即 Meta 迄今為止功能最強(qiáng)大、用途最廣泛的模型。這些模型的添加,表明
    的頭像 發(fā)表于 08-02 15:42 ?726次閱讀

    PerfXCloud平臺成功接入Meta Llama3.1

    近日,Meta對外宣布推出迄今為止最強(qiáng)大的開源模型——Llama3.1 405B,同時還發(fā)布了全新優(yōu)化升級的70B和8B版本,技術(shù)革新的浪潮再次洶涌來襲!在此,我們滿懷欣喜地向您宣告,PerfXCloud平臺現(xiàn)已成功接入
    的頭像 發(fā)表于 07-25 10:26 ?895次閱讀

    Meta發(fā)布全新開源大模型Llama 3.1

    科技巨頭Meta近期震撼發(fā)布了其最新的開源人工智能(AI)模型——Llama 3.1,這一舉措標(biāo)志著Meta在AI領(lǐng)域的又一重大突破。Meta創(chuàng)始人馬克·扎克伯格親自站臺,盛贊
    的頭像 發(fā)表于 07-24 18:25 ?1782次閱讀

    Meta不會在歐盟提供新的多模態(tài)AI模型

    科技巨頭Meta近日宣布了一項重要決策,其即將推出的創(chuàng)新多模態(tài)Llama模型將不會在歐盟地區(qū)發(fā)布。這一決定背后,是Meta對歐洲復(fù)雜且不可預(yù)測的監(jiān)管環(huán)境的深刻考量,也為
    的頭像 發(fā)表于 07-19 16:04 ?841次閱讀

    Meta即將發(fā)布超強(qiáng)開源AI模型Llama 3-405B

    在人工智能領(lǐng)域的激烈競爭中,Meta公司再次擲出重磅炸彈,宣布將于7月23日正式發(fā)布其最新力作——Llama 3-405B,一個擁有驚人4050億參數(shù)的開源大模型。這一舉措不僅標(biāo)志著Meta在AI
    的頭像 發(fā)表于 07-18 09:58 ?1331次閱讀