知識(shí)圖譜在圖書情報(bào)界稱為知識(shí)域可視化或知識(shí)領(lǐng)域映射地圖,是顯示知識(shí)發(fā)展進(jìn)程與結(jié)構(gòu)關(guān)系的一系列各種不同的圖形。用可視化技術(shù)形象的描述學(xué)科知識(shí)資源及其載體,挖掘、分析、構(gòu)建、繪制和顯示知識(shí)及它們之間的相互聯(lián)系。
隨著知識(shí)圖譜在搜索領(lǐng)域的大獲成功,以及知識(shí)圖譜進(jìn)行中推廣,現(xiàn)在自然語(yǔ)言處理有明顯和知識(shí)圖譜結(jié)合的趨勢(shì)。特別是在特定領(lǐng)域的客服系統(tǒng)構(gòu)建模型中,這種趨勢(shì)就更明顯,因?yàn)檫@些系統(tǒng)往往要關(guān)聯(lián)很多領(lǐng)域的知識(shí),而這種知識(shí)的整合和表示,很適合用知識(shí)圖譜來(lái)解決。
隨著知識(shí)圖譜基礎(chǔ)工程技術(shù)的完善和進(jìn)步,圖譜構(gòu)建的容易程度也大大提高,所以自然語(yǔ)言處理和知識(shí)圖譜的結(jié)合就越來(lái)越成為趨勢(shì)。目前各項(xiàng)自然語(yǔ)言處理技術(shù)基本已經(jīng)比較成熟,但是很多技術(shù)的效果還達(dá)不到商用的水平。特別是在語(yǔ)義理解方面,和商用還有比較大的差距。不過(guò)隨著各個(gè)研究機(jī)構(gòu)和企業(yè)的不斷努力,技術(shù)研究也一直在不斷的進(jìn)步。
對(duì)于新型的深度學(xué)習(xí)框架,目前在自然語(yǔ)言處理中的應(yīng)用還有待進(jìn)一步加深和提高。比如對(duì)抗學(xué)習(xí)、對(duì)偶學(xué)習(xí)等雖然在圖像處理領(lǐng)域得到了比較好的效果,但是在自然語(yǔ)言處理領(lǐng)域的效果就稍微差一些。
目前人機(jī)對(duì)話、問(wèn)答系統(tǒng)、語(yǔ)言翻譯是自然語(yǔ)言處理中的熱門領(lǐng)域,各大公司都有投入大量的精力在做自己的語(yǔ)音助手。這些上層的應(yīng)用,都依賴于底層技術(shù)和模型的進(jìn)步,雖說(shuō)整個(gè)自然語(yǔ)言處理的效果差強(qiáng)人意,但是對(duì)于底層技術(shù)的研究應(yīng)該說(shuō)是目前研究的熱點(diǎn)。
知識(shí)結(jié)構(gòu)方法
要做算法研究,肯定需要一定的知識(shí)積累,對(duì)于知識(shí)積累這部分,建議是先學(xué)數(shù)學(xué)理論基礎(chǔ),學(xué)的順序可以是代數(shù)→概率論→隨機(jī)過(guò)程。當(dāng)然這里面每一科都是很大的一個(gè)方向,學(xué)的時(shí)候不必面面俱到,所有都深入理解,但是相對(duì)基礎(chǔ)的一些概念和這門學(xué)科主要講的是什么問(wèn)題一定要記住。
在學(xué)習(xí)了一些基礎(chǔ)數(shù)學(xué)知識(shí)之后,就開始編寫算法。這里的算法模型,建議跟著具體的業(yè)務(wù)來(lái)學(xué)習(xí)和實(shí)踐,比如可以先從識(shí)別垃圾郵件這樣的demo進(jìn)行學(xué)習(xí)實(shí)驗(yàn),可以改進(jìn)里面的參數(shù)或者實(shí)現(xiàn)方法,看看能不能達(dá)到更好的效果。初步學(xué)習(xí)還是需要下苦功夫一步一步模仿,然后改進(jìn),才能深入的掌握相應(yīng)的內(nèi)容。
工具
工欲善其事必先利其器,所以好的工具往往能事半功倍。在工具的選擇上,建議最高優(yōu)先級(jí)的是Python,畢竟其的宣傳口語(yǔ)是:人生苦短,請(qǐng)用Python。第二優(yōu)先級(jí)的是Java,基于Java可以和現(xiàn)有的很多框架進(jìn)行直接交互,比如Hadoop、Spark等等。
對(duì)于Java就要學(xué)習(xí)一些基礎(chǔ)的數(shù)據(jù)結(jié)構(gòu),對(duì)于Python也可以按照這個(gè)思路,Python本身也是一個(gè)高級(jí)編程語(yǔ)言。掌握了基礎(chǔ)的數(shù)據(jù)結(jié)構(gòu)之后,也可以一步一步的實(shí)現(xiàn)具體的功能,在學(xué)習(xí)的時(shí)候,要多試驗(yàn),求同存異。
緊跟時(shí)代
自然語(yǔ)言處理領(lǐng)域也算是一個(gè)知識(shí)密集型的行業(yè),知識(shí)的更新迭代非常的快,要時(shí)刻關(guān)注行業(yè)、領(lǐng)域的最新進(jìn)展。這個(gè)方面主要就是看一些論文和關(guān)注一些重要的學(xué)術(shù)會(huì)議,對(duì)于論文的獲取,Google Scholar、arxiv都是很好的工具和資源。
-
圖像處理
+關(guān)注
關(guān)注
27文章
1329瀏覽量
58036 -
自然語(yǔ)言處理
+關(guān)注
關(guān)注
1文章
628瀏覽量
14154 -
知識(shí)圖譜
+關(guān)注
關(guān)注
2文章
132瀏覽量
8001
原文標(biāo)題:自然語(yǔ)言處理現(xiàn)狀和學(xué)習(xí)方法
文章出處:【微信號(hào):NeXt8060,微信公眾號(hào):HALCON圖像處理與機(jī)器視覺(jué)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
NLPIR大數(shù)據(jù)知識(shí)圖譜完美展現(xiàn)文本數(shù)據(jù)內(nèi)容
KGB知識(shí)圖譜基于傳統(tǒng)知識(shí)工程的突破分析
KGB知識(shí)圖譜技術(shù)能夠解決哪些行業(yè)痛點(diǎn)?
知識(shí)圖譜的三種特性評(píng)析
KGB知識(shí)圖譜幫助金融機(jī)構(gòu)進(jìn)行風(fēng)險(xiǎn)預(yù)判
KGB知識(shí)圖譜通過(guò)智能搜索提升金融行業(yè)分析能力
自然語(yǔ)言處理怎么最快入門_自然語(yǔ)言處理知識(shí)了解
知識(shí)圖譜與訓(xùn)練模型相結(jié)合和命名實(shí)體識(shí)別的研究工作

知識(shí)圖譜與BERT相結(jié)合助力語(yǔ)言模型

自然語(yǔ)言分析(NLA)是什么
知識(shí)圖譜:知識(shí)圖譜的典型應(yīng)用

知識(shí)圖譜基礎(chǔ)知識(shí)應(yīng)用和學(xué)術(shù)前沿趨勢(shì)

評(píng)論