一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿拉伯語自然語言處理模型NOOR的詳細(xì)介紹

文傳商訊 ? 來源:文傳商訊 ? 作者:文傳商訊 ? 2022-04-12 11:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

阿布扎比先進(jìn)技術(shù)研究委員會(huì)旗下的全球研究中心和應(yīng)用研究支柱部門技術(shù)創(chuàng)新研究所(TII)今天宣布推出NOOR語言處理模型,這是迄今為止全球規(guī)模居首的阿拉伯語自然語言處理(NLP)模型。

TII的高級(jí)研究人員和人工智能專家團(tuán)隊(duì)與LightOn聯(lián)手,對(duì)這個(gè)阿拉伯語NLP模型進(jìn)行了改進(jìn)。LightOn是一家專為企業(yè)提供超大規(guī)模機(jī)器智能的技術(shù)公司。NOOR模型能夠執(zhí)行超出語言領(lǐng)域的任務(wù),可提供覆蓋整個(gè)端到端處理管道的高質(zhì)量數(shù)據(jù),包括大規(guī)模數(shù)據(jù)抓取、過濾和管理。該模型可促進(jìn)超大規(guī)模數(shù)據(jù)的分布式訓(xùn)練和服務(wù),基于該模型的應(yīng)用具有高效推理能力,并可針對(duì)特定領(lǐng)域進(jìn)行模型調(diào)整。

TII和ASPIRE首席執(zhí)行官Ray O. Johnson博士表示:“這一進(jìn)展將大幅提升我們的研究能力和資質(zhì),并提升阿布扎比和阿聯(lián)酋作為重要研究生態(tài)系統(tǒng)的地位。我們的專家團(tuán)隊(duì)再次證明,阿布扎比和阿聯(lián)酋地區(qū)可以取得具有世界影響力的、突破性的研發(fā)成果?!?/p>

TII人工智能跨學(xué)科中心部門主任Ebtesam Almazrouei博士表示:“在自然語言處理領(lǐng)域,大型語言模型不斷涌現(xiàn)。能推出這個(gè)擁有100億個(gè)參數(shù)的先進(jìn)模型,我們感到很自豪。這是全球規(guī)模居首的阿拉伯語NLP模型。為訓(xùn)練該模型,我們采集了一套獨(dú)一無二的大型阿拉伯語數(shù)據(jù)集。相關(guān)工作歷經(jīng)數(shù)月時(shí)間,包括對(duì)各種來源數(shù)據(jù)的整理、剔除和過濾。在此特別感謝參與該項(xiàng)目的整個(gè)團(tuán)隊(duì),他們使NOOR成為世界各地學(xué)者和企業(yè)首選的阿拉伯語研究模型?!?/p>

TII數(shù)字科學(xué)研究中心和人工智能跨學(xué)科中心部門首席研究員Mérouane Debbah教授在發(fā)布會(huì)上表示:“通過NOOR,TII利用在大型語言模型方面的專有技術(shù),擴(kuò)大了現(xiàn)代標(biāo)準(zhǔn)阿拉伯語模型的范圍,以在新一代人工智能研究中建立跨學(xué)科的先進(jìn)專長(zhǎng)?!?/p>

NOOR擁有超過300億字的獨(dú)特?cái)?shù)據(jù)集,涵蓋網(wǎng)絡(luò)數(shù)據(jù)、書籍、詩歌、新聞文章和技術(shù)信息等來源,從而打造出全球規(guī)模居首的高質(zhì)量跨領(lǐng)域阿拉伯語數(shù)據(jù)集,并大幅拓寬了該模型的適用范圍。

Ebtesam Almazrouei博士表示,NOOR模型基于流行的Transformer架構(gòu),僅包含解碼器,結(jié)構(gòu)與GPT-3相似,其設(shè)計(jì)旨在處理生成類任務(wù)。經(jīng)過升級(jí)的架構(gòu)引入了機(jī)器學(xué)習(xí)領(lǐng)域的最新發(fā)展,包括更好的位置嵌入等改進(jìn)。為確保NOOR大規(guī)模數(shù)據(jù)集的質(zhì)量,TII團(tuán)隊(duì)設(shè)計(jì)了一個(gè)基于機(jī)器學(xué)習(xí)技術(shù)的自動(dòng)過濾管道。相關(guān)工具可以識(shí)別優(yōu)質(zhì)參考文本,并保障模型不受垃圾內(nèi)容污染。

NOOR利用先進(jìn)的3D并行技術(shù),在配備128個(gè)A100 GPU的高性能計(jì)算資源上進(jìn)行了訓(xùn)練,該過程采用分布式計(jì)算模式,能夠確保有效利用可用的硬件資源。

人工智能跨學(xué)科中心部門主任指出,NOOR只是該部門努力為更廣泛的阿聯(lián)酋人工智能戰(zhàn)略做出貢獻(xiàn)的第一步。

該模型以阿拉伯語中的“光”命名,以體現(xiàn)模型旨在啟迪人類智慧的宗旨。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1806

    文章

    49014

    瀏覽量

    249447
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3520

    瀏覽量

    50421
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    628

    瀏覽量

    14157
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    沙特阿拉伯國(guó)家電力公司SEC與華為數(shù)字能源簽署電網(wǎng)仿真測(cè)試合作協(xié)議

    【沙特阿拉伯,利雅得,2025年7月3日】沙特阿拉伯國(guó)家電力公司(以下簡(jiǎn)稱“SEC”)、沙特阿拉伯國(guó)家電網(wǎng)公司(以下簡(jiǎn)稱“NG”)和華為數(shù)字能源正式簽署電網(wǎng)仿真測(cè)試合作協(xié)議,三方將聯(lián)合建設(shè)電網(wǎng)仿真
    的頭像 發(fā)表于 07-10 14:47 ?1556次閱讀
    沙特<b class='flag-5'>阿拉伯</b>國(guó)家電力公司SEC與華為數(shù)字能源簽署電網(wǎng)仿真測(cè)試合作協(xié)議

    沙特阿拉伯新能源整車認(rèn)證

    沙特阿拉伯對(duì)新能源汽車(包括純電動(dòng)汽車、插電式混合動(dòng)力汽車等)的整車認(rèn)證主要遵循其國(guó)家標(biāo)準(zhǔn)和海灣合作委員會(huì)(GCC)的通用法規(guī)。以下是沙特新能源汽車整車認(rèn)證的關(guān)鍵要點(diǎn)和流程:1.適用法規(guī)與標(biāo)準(zhǔn)
    的頭像 發(fā)表于 06-21 23:53 ?296次閱讀
    沙特<b class='flag-5'>阿拉伯</b>新能源整車認(rèn)證

    耐能與沙特阿拉伯國(guó)家半導(dǎo)體中心達(dá)成戰(zhàn)略合作

    基于對(duì)全球人工智能市場(chǎng)趨勢(shì)以及中東地區(qū)(尤其是沙特阿拉伯)新興機(jī)遇的深刻洞察。耐能(Kneron)經(jīng)過戰(zhàn)略考量,選擇與沙特國(guó)家半導(dǎo)體中心(NSH)合作,在利雅得設(shè)立子公司。沙特阿拉伯國(guó)家半導(dǎo)體中心的使命是在沙特打造一個(gè)無晶圓廠半導(dǎo)體生態(tài)系統(tǒng) 。
    的頭像 發(fā)表于 01-09 13:48 ?483次閱讀

    如何優(yōu)化自然語言處理模型的性能

    優(yōu)化自然語言處理(NLP)模型的性能是一個(gè)多方面的任務(wù),涉及數(shù)據(jù)預(yù)處理、特征工程、模型選擇、模型
    的頭像 發(fā)表于 12-05 15:30 ?1700次閱讀

    自然語言處理與機(jī)器學(xué)習(xí)的關(guān)系 自然語言處理的基本概念及步驟

    Learning,簡(jiǎn)稱ML)是人工智能的一個(gè)核心領(lǐng)域,它使計(jì)算機(jī)能夠從數(shù)據(jù)中學(xué)習(xí)并做出預(yù)測(cè)或決策。自然語言處理與機(jī)器學(xué)習(xí)之間有著密切的關(guān)系,因?yàn)闄C(jī)器學(xué)習(xí)提供了一種強(qiáng)大的工具,用于從大量文本數(shù)據(jù)中提取模式和知識(shí),從而提高NLP系統(tǒng)的性能。
    的頭像 發(fā)表于 12-05 15:21 ?1985次閱讀

    語音識(shí)別與自然語言處理的關(guān)系

    在人工智能的快速發(fā)展中,語音識(shí)別和自然語言處理(NLP)成為了兩個(gè)重要的技術(shù)支柱。語音識(shí)別技術(shù)使得機(jī)器能夠理解人類的語音,而自然語言處理則讓機(jī)器能夠理解、解釋和生成人類
    的頭像 發(fā)表于 11-26 09:21 ?1501次閱讀

    什么是LLM?LLM在自然語言處理中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,自然語言處理(NLP)領(lǐng)域迎來了革命性的進(jìn)步。其中,大型語言模型(LLM)的出現(xiàn),標(biāo)志著我們對(duì)語言理解能力的一次
    的頭像 發(fā)表于 11-19 15:32 ?3650次閱讀

    ASR與自然語言處理的結(jié)合

    ASR(Automatic Speech Recognition,自動(dòng)語音識(shí)別)與自然語言處理(NLP)是人工智能領(lǐng)域的兩個(gè)重要分支,它們?cè)谠S多應(yīng)用中緊密結(jié)合,共同構(gòu)成了自然語言理解和生成的技術(shù)體系
    的頭像 發(fā)表于 11-18 15:19 ?1025次閱讀

    卷積神經(jīng)網(wǎng)絡(luò)在自然語言處理中的應(yīng)用

    自然語言處理是人工智能領(lǐng)域的一個(gè)重要分支,它致力于使計(jì)算機(jī)能夠理解、解釋和生成人類語言。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)(CNNs)作為一種強(qiáng)大的模型,在圖像識(shí)別和語音
    的頭像 發(fā)表于 11-15 14:58 ?804次閱讀

    自然語言處理與機(jī)器學(xué)習(xí)的區(qū)別

    在人工智能的快速發(fā)展中,自然語言處理(NLP)和機(jī)器學(xué)習(xí)(ML)成為了兩個(gè)核心的研究領(lǐng)域。它們都致力于解決復(fù)雜的問題,但側(cè)重點(diǎn)和應(yīng)用場(chǎng)景有所不同。 1. 自然語言處理(NLP) 定義:
    的頭像 發(fā)表于 11-11 10:35 ?1547次閱讀

    使用LLM進(jìn)行自然語言處理的優(yōu)缺點(diǎn)

    自然語言處理(NLP)是人工智能和語言學(xué)領(lǐng)域的一個(gè)分支,它致力于使計(jì)算機(jī)能夠理解、解釋和生成人類語言。大型語言
    的頭像 發(fā)表于 11-08 09:27 ?2450次閱讀

    科大訊飛發(fā)布訊飛星火4.0 Turbo大模型及星火多語言模型

    ,科大訊飛以其一貫的創(chuàng)新精神,開創(chuàng)性地發(fā)布了星火多語言模型。這一創(chuàng)新之舉不僅進(jìn)一步鞏固了科大訊飛在中文和英文處理領(lǐng)域的領(lǐng)先地位,更將語言的支持范圍大幅擴(kuò)展,涵蓋了俄語、日語、
    的頭像 發(fā)表于 10-24 13:58 ?909次閱讀

    AI大模型自然語言處理中的應(yīng)用

    AI大模型自然語言處理(NLP)中的應(yīng)用廣泛且深入,其強(qiáng)大的語義理解和生成能力為NLP任務(wù)帶來了顯著的性能提升。以下是對(duì)AI大模型在NLP中應(yīng)用的
    的頭像 發(fā)表于 10-23 14:38 ?1541次閱讀

    【AWTK使用經(jīng)驗(yàn)】如何在AWTK顯示阿拉伯文本

    。本篇文章將簡(jiǎn)單介紹阿拉伯文本相關(guān)整形與排序規(guī)則,接著介紹在AWStudio設(shè)置阿拉伯語言翻譯的步驟。阿拉伯文本整形規(guī)則一般GUI顯示英文或
    的頭像 發(fā)表于 09-12 08:07 ?691次閱讀
    【AWTK使用經(jīng)驗(yàn)】如何在AWTK顯示<b class='flag-5'>阿拉伯</b>文本

    【《大語言模型應(yīng)用指南》閱讀體驗(yàn)】+ 基礎(chǔ)篇

    。首先結(jié)合ChatGPT的4次迭代升級(jí)介紹了什么是大語言模型,大語言模型的特點(diǎn):參數(shù)多、通用性強(qiáng);之后用較大的篇幅
    發(fā)表于 07-25 14:33