一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

通過利用機器學習模型破譯古籍

星星科技指導員 ? 來源:NVIDIA ? 作者:Michelle Horton ? 2022-04-08 09:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

為了揭示過去的秘密,世界各地的歷史學者花費畢生精力翻譯古代手稿。圣母大學的一個研究小組希望幫助這項任務,用一種新開發(fā)的機器學習模型來翻譯和記錄幾百年前的手寫文檔。

利用圣加爾修道院圖書館的數(shù)字化手稿和一個考慮到人類感知的機器學習模型 study 在深度學習轉錄能力方面有顯著提高。

“我們正在處理歷史文件,這些文件的書寫風格早已過時,可以追溯到幾個世紀以前,并且使用拉丁語等語言,而拉丁語已經很少使用了。你可以得到這些材料的美麗照片,但我們已經著手做的是以一種模仿專家讀者眼睛對頁面感知的方式自動轉錄,并提供快速、可搜索的文本閱讀,”圣母大學副教授、資深作者沃爾特·舍勒在新聞稿中說。

圣加爾修道院圖書館建于 719 年,是世界上最古老、最豐富的圖書館藏品之一。該圖書館藏有大約 160000 卷書和 2000 份手稿,可追溯到八世紀。在羊皮紙上用現(xiàn)在很少使用的語言手工書寫,這些材料中的許多尚未被閱讀——這是一筆潛在的歷史檔案財富,等待發(fā)掘。

機器學習方法能夠自動轉錄這些類型的歷史文件已經在工作中,但挑戰(zhàn)仍然存在。

到目前為止,大型數(shù)據(jù)集對于提高這些語言模型的性能是必不可少的。由于可供查閱的書籍數(shù)量巨大,這項工作需要時間,并且需要相對較少的專家學者進行注釋。缺少知識,如從未編纂過的中世紀拉丁語詞典,構成了更大的障礙。

該團隊將傳統(tǒng)的機器學習方法與研究物理世界和人類行為之間關系的視覺心理物理學相結合,以創(chuàng)建更多信息豐富的注釋。在這種情況下,他們在處理古代文本時將人類視覺測量納入神經網絡的訓練過程。

“這是機器學習中通常不使用的策略。我們通過這些心理物理測量來標記數(shù)據(jù),這些測量直接來自于通過行為測量對感知進行的心理學研究。然后,我們通知網絡在感知這些角色方面的常見困難,并可以根據(jù)這些測量結果進行糾正,” Scheirer 說。

為了訓練、驗證和測試這些模型,研究人員使用了一套來自圣加爾的可追溯到九世紀的數(shù)字化手寫拉丁手稿。他們要求專家閱讀并將文本行中的手動抄本輸入定制的軟件中。測量每次抄寫的時間,可以洞察單詞、字符或段落的難度。根據(jù)作者的說法,這些數(shù)據(jù)有助于減少算法中的錯誤,并提供更真實的讀數(shù)。

所有的實驗都是使用 cuDNN-accelerated PyTorch 深度學習框架和 GPU ?!叭绻麤]有 NVIDIA 硬件和軟件,我們肯定不可能完成我們所做的事情。

pYYBAGJPlEWAa7tcAAGssGNMcGs826.png

該研究引入了一種新的深度學習損失公式,該公式結合了人類視覺測量,可應用于手寫文檔轉錄的不同處理管道。信貸: Scheirer 等人/ IEEE

團隊仍在努力改進某些方面。損壞和不完整的文檔以及插圖和縮寫對模型提出了特殊的挑戰(zhàn)。

“由于互聯(lián)網規(guī)模的數(shù)據(jù)和 GPU 硬件,人工智能達到了拐點,這將使文化遺產和人文學科與其他領域一樣受益。我們只是初步了解我們可以對這個項目做些什么。

關于作者

Michelle Horton 是 NVIDIA 的高級開發(fā)人員通信經理,擁有通信經理和科學作家的背景。她在 NVIDIA 為開發(fā)者博客撰文,重點介紹了開發(fā)者使用 NVIDIA 技術的多種方式。

審核編輯:郭婷

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關注

    關注

    28

    文章

    4943

    瀏覽量

    131210
  • 互聯(lián)網

    關注

    55

    文章

    11249

    瀏覽量

    106378
  • 機器學習
    +關注

    關注

    66

    文章

    8501

    瀏覽量

    134584
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    通過NVIDIA Cosmos模型增強機器人學習

    通用機器人的時代已經到來,這得益于機械電子技術和機器人 AI 基礎模型的進步。但目前機器人技術的發(fā)展仍面臨一個關鍵挑戰(zhàn):機器人需要大量的訓練
    的頭像 發(fā)表于 07-14 11:49 ?145次閱讀
    <b class='flag-5'>通過</b>NVIDIA Cosmos<b class='flag-5'>模型</b>增強<b class='flag-5'>機器人學習</b>

    邊緣計算中的機器學習:基于 Linux 系統(tǒng)的實時推理模型部署與工業(yè)集成!

    你好,旅行者!歡迎來到Medium的這一角落。在本文中,我們將把一個機器學習模型(神經網絡)部署到邊緣設備上,利用從ModbusTCP寄存器獲取的實時數(shù)據(jù)來預測一臺復古音頻放大器的當前
    的頭像 發(fā)表于 06-11 17:22 ?335次閱讀
    邊緣計算中的<b class='flag-5'>機器</b><b class='flag-5'>學習</b>:基于 Linux 系統(tǒng)的實時推理<b class='flag-5'>模型</b>部署與工業(yè)集成!

    機器學習模型市場前景如何

    當今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發(fā)廣闊。下面,AI部落小編將探討機器學習
    的頭像 發(fā)表于 02-13 09:39 ?359次閱讀

    【「基于大模型的RAG應用開發(fā)與優(yōu)化」閱讀體驗】+大模型微調技術解讀

    集對模型進行進一步訓練的過程。 大模型微調是利用預訓練模型的權重和特征,通過在新任務數(shù)據(jù)集上的訓練,對
    發(fā)表于 01-14 16:51

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人大模型

    。 多模態(tài)融合的創(chuàng)新與突破 機器人控制技術的另一個重要突破在于多模態(tài)大模型的應用。相比于僅通過文字進行人機交互的傳統(tǒng)方法,現(xiàn)代機器人能夠融合視覺、聲音、定位等多模態(tài)輸入信息,為任務執(zhí)行
    發(fā)表于 12-29 23:04

    《具身智能機器人系統(tǒng)》第7-9章閱讀心得之具身智能機器人與大模型

    醫(yī)療領域,手術輔助機器人需要毫米級的精確控制,書中有介紹基于視覺伺服的實時控制算法,以及如何利用模型優(yōu)化手術路徑規(guī)劃。工業(yè)場景中,協(xié)作機器人面臨的主要挑戰(zhàn)是快速適應新工藝流程。具身智
    發(fā)表于 12-24 15:03

    cmp在機器學習中的作用 如何使用cmp進行數(shù)據(jù)對比

    機器學習領域,"cmp"這個術語可能并不是一個常見的術語,它可能是指"比較"(comparison)的縮寫。 比較在機器學習中的作用 模型
    的頭像 發(fā)表于 12-17 09:35 ?873次閱讀

    什么是機器學習?通過機器學習方法能解決哪些問題?

    來源:Master編程樹“機器學習”最初的研究動機是讓計算機系統(tǒng)具有人的學習能力以便實現(xiàn)人工智能。因為沒有學習能力的系統(tǒng)很難被認為是具有智能的。目前被廣泛采用的
    的頭像 發(fā)表于 11-16 01:07 ?963次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?<b class='flag-5'>通過</b><b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法能解決哪些問題?

    AI大模型與深度學習的關系

    AI大模型與深度學習之間存在著密不可分的關系,它們互為促進,相輔相成。以下是對兩者關系的介紹: 一、深度學習是AI大模型的基礎 技術支撐 :深度學習
    的頭像 發(fā)表于 10-23 15:25 ?2879次閱讀

    AI大模型與傳統(tǒng)機器學習的區(qū)別

    AI大模型與傳統(tǒng)機器學習在多個方面存在顯著的區(qū)別。以下是對這些區(qū)別的介紹: 一、模型規(guī)模與復雜度 AI大模型 :通常包含數(shù)十億甚至數(shù)萬億的參
    的頭像 發(fā)表于 10-23 15:01 ?2563次閱讀

    構建語音控制機器人 - 線性模型機器學習

    輪子并識別音頻信號,但它仍然無法通過語音命令控制或按預定義路徑行駛。 線性控制模型 首先要解決的問題是實現(xiàn)直線驅動。為此,我們使用線性模型來控制提供給車輪的電壓。使用線性模型適合對汽車
    的頭像 發(fā)表于 10-02 16:31 ?569次閱讀
    構建語音控制<b class='flag-5'>機器</b>人 - 線性<b class='flag-5'>模型</b>和<b class='flag-5'>機器</b><b class='flag-5'>學習</b>

    【《時間序列與機器學習》閱讀體驗】+ 時間序列的信息提取

    本人有些機器學習的基礎,理解起來一點也不輕松,加油。 作者首先說明了時間序列的信息提取是時間序列分析的一個重要環(huán)節(jié),目標是從給定的時間序列數(shù)據(jù)中提取出有用的信息和特征,以支持后續(xù)的分析和預測任務,可以利用
    發(fā)表于 08-14 18:00

    【《大語言模型應用指南》閱讀體驗】+ 基礎知識學習

    今天來學習大語言模型在自然語言理解方面的原理以及問答回復實現(xiàn)。 主要是基于深度學習和自然語言處理技術。 大語言模型涉及以下幾個過程: 數(shù)據(jù)收集:大語言
    發(fā)表于 08-02 11:03

    【《大語言模型應用指南》閱讀體驗】+ 基礎篇

    這個程序不需要程序員編寫,而是由計算機自動生成。因此,人工編程方法依賴程序員思考的規(guī)則,而自動編程是計算機算法通過分析數(shù)據(jù)自行創(chuàng)建規(guī)則。 作者通過類比學生準備高考的過程來說明機器學習
    發(fā)表于 07-25 14:33

    【《大語言模型應用指南》閱讀體驗】+ 俯瞰全書

    上周收到《大語言模型應用指南》一書,非常高興,但工作項目繁忙,今天才品鑒體驗,感謝作者編寫了一部內容豐富、理論應用相結合、印刷精美的著作,也感謝電子發(fā)燒友論壇提供了一個讓我了解大語言模型機器
    發(fā)表于 07-21 13:35