近日,英偉達(dá)在其官方博客上宣布了一項(xiàng)重大進(jìn)展,推出了一款名為Nemotron-CC的大型英文AI訓(xùn)練數(shù)據(jù)庫(kù)。這一數(shù)據(jù)庫(kù)的發(fā)布,標(biāo)志著英偉達(dá)在推動(dòng)大語(yǔ)言模型訓(xùn)練技術(shù)方面邁出了重要一步。
據(jù)英偉達(dá)介紹,Nemotron-CC數(shù)據(jù)庫(kù)總計(jì)包含了驚人的6.3萬(wàn)億個(gè)Token,其中1.9萬(wàn)億為精心合成的數(shù)據(jù)。這一龐大的數(shù)據(jù)量不僅為AI模型的訓(xùn)練提供了豐富的素材,更為學(xué)術(shù)界和企業(yè)界在探索大語(yǔ)言模型領(lǐng)域時(shí)提供了強(qiáng)有力的支持。
英偉達(dá)聲稱(chēng),Nemotron-CC數(shù)據(jù)庫(kù)的設(shè)計(jì)初衷就是為了幫助學(xué)術(shù)界和企業(yè)界進(jìn)一步推動(dòng)大語(yǔ)言模型的訓(xùn)練過(guò)程。通過(guò)提供如此大規(guī)模、高質(zhì)量的訓(xùn)練數(shù)據(jù),英偉達(dá)期望能夠加速AI技術(shù)的創(chuàng)新和應(yīng)用,為各行各業(yè)帶來(lái)更多的智能化解決方案。
隨著人工智能技術(shù)的不斷發(fā)展,大語(yǔ)言模型已經(jīng)成為研究和實(shí)踐中的熱點(diǎn)。而英偉達(dá)此次推出的Nemotron-CC數(shù)據(jù)庫(kù),無(wú)疑將為這一領(lǐng)域的研究和應(yīng)用注入新的活力。
-
AI
+關(guān)注
關(guān)注
87文章
33554瀏覽量
274195 -
數(shù)據(jù)庫(kù)
+關(guān)注
關(guān)注
7文章
3884瀏覽量
65574 -
模型
+關(guān)注
關(guān)注
1文章
3464瀏覽量
49817 -
英偉達(dá)
+關(guān)注
關(guān)注
22文章
3900瀏覽量
92898
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
SEGGER emFile支持大型數(shù)據(jù)庫(kù)
IBM攜手英偉達(dá)AI數(shù)據(jù)平臺(tái)推動(dòng)企業(yè)級(jí)AI創(chuàng)新
云數(shù)據(jù)庫(kù)是哪種數(shù)據(jù)庫(kù)類(lèi)型?
數(shù)據(jù)庫(kù)數(shù)據(jù)恢復(fù)—通過(guò)拼接數(shù)據(jù)庫(kù)碎片恢復(fù)SQLserver數(shù)據(jù)庫(kù)

英偉達(dá)發(fā)布AI模型 Llama-3.1-Nemotron-51B AI模型
NVIDIA Nemotron-4 340B模型幫助開(kāi)發(fā)者生成合成訓(xùn)練數(shù)據(jù)

英偉達(dá)Blackwell可支持10萬(wàn)億參數(shù)模型AI訓(xùn)練,實(shí)時(shí)大語(yǔ)言模型推理
英偉達(dá)回應(yīng)AI芯片推遲發(fā)布傳聞
英偉達(dá)打造人形機(jī)器人訓(xùn)練平臺(tái),引領(lǐng)AI新紀(jì)元
蘋(píng)果AI模型訓(xùn)練新動(dòng)向:攜手谷歌,未選英偉達(dá)
蘋(píng)果承認(rèn)使用谷歌芯片來(lái)訓(xùn)練AI
大型數(shù)據(jù)庫(kù)可選擇WDS作為其數(shù)據(jù)庫(kù)一體機(jī)產(chǎn)品存儲(chǔ)底座


評(píng)論