人工智能作詩機(jī)器人
作詩機(jī)器人作為一個玩具也好一個科學(xué)研究的領(lǐng)域課題也罷,很早就有人開始研究了。就但從數(shù)學(xué)模型角度來說,作詩姬應(yīng)該屬于隱馬爾可夫模型的變種。
所謂隱馬爾可夫模型HMM就是從時間序列的隨機(jī)事件中去統(tǒng)計前后狀態(tài)的轉(zhuǎn)化概率。這種模型在NLP領(lǐng)域應(yīng)用是非常廣泛的,在作詩姬這種玩具中也少不了它拋頭露面。
遇到這種命題,首先應(yīng)該想到的是使用RNN模型(LSTM)來進(jìn)行訓(xùn)練。因為RNN具有一種天生就最適合擬合隱馬爾可夫模型的構(gòu)造,所以這個大的思路應(yīng)該是沒有什么問題的??墒?,中文有中文的特點(diǎn),而且中文當(dāng)中有一些令我們中國人最自豪的,最優(yōu)美的韻律感,同時也是我們自己在嘗試寫詩的過程中最不好把握的東西——平仄和韻腳。隱馬爾可夫模型可以統(tǒng)計出來在一個字后面出現(xiàn)另一個字是多大概率,而且可以有一定自由度地選擇其中的一個字作為下一個接續(xù)字——可以選擇概率最大的那個字,這種情況下一旦第一個字確定后,后面整個詩文理論上就是全部確定的;也可以按照概率從大到小排列,用概率的比例去生成一個 “不均勻的骰子”,使得下一個字的產(chǎn)生有一定變化。
用隱馬爾可夫模型生成字的時候,選擇概率較大的字出現(xiàn)的目的是為了讓語句更為通暢,因為兩個字有較大概率緊鄰出現(xiàn)的話大多是因為它們是一個詞,或者在單字詞盛行的古詩文中至少是詞組或者常用短語。例如“紅顏”、“春光”、“山河”、“相送”等。而概率小的鄰接字含義很可能表示的是這兩個字從來沒有前后腳出現(xiàn)過,或者偶爾出現(xiàn)過那么一兩次還是一個屬于前面的詞尾一個屬于后面的詞頭的情況,那如果采用的話自然是狗屁不通。
光是用隱馬爾可夫模型去統(tǒng)計還是不夠的,要生成一個有一定“含義”的詩文是需要有一定的意境和慣用詞匯的。為此,有這樣一本書作為辭典備用,叫做《詩學(xué)含英》,不過別找了京東上沒有,這么偏門小眾的書求助萬能的淘寶吧。由于在五絕和七絕這樣的詩律中是講究押韻和平仄工整的,所以第二三四句實際上是根據(jù)第一句來生成的,它們的生成要在規(guī)則上與第一句呼應(yīng)。那么就要先重點(diǎn)生成第一句,再一句一句按照規(guī)則去生成其余的句子。
非常好我支持^.^
(0) 0%
不好我反對
(0) 0%
下載地址
人工智能作詩機(jī)器人下載
相關(guān)電子資料下載
- 如何使用Rust創(chuàng)建一個基于ChatGPT的RAG助手 43
- 如何創(chuàng)建FPGA控制的機(jī)器人手臂? 219
- 如何創(chuàng)建FPGA控制的機(jī)器人手臂 49
- 怎樣延長半導(dǎo)體元器件的壽命呢? 180
- 邁爾微視MRDVS發(fā)布多模態(tài)避障相機(jī)S2 90
- iTR機(jī)器人iScrubbot系列清潔機(jī)器人實現(xiàn)數(shù)字化管理 136
- 哈爾濱工業(yè)大學(xué)研發(fā)液態(tài)金屬磁性微型軟體機(jī)器人 20
- 智能時代的三大核心技術(shù) 57
- EPR6-S工業(yè)機(jī)器人通過EtherCAT轉(zhuǎn)profinet網(wǎng)關(guān)接入西門子系統(tǒng) 135
- 智能工廠系統(tǒng)集成解決方案 25