一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

三大算法模型引領(lǐng),突圍復(fù)雜網(wǎng)絡(luò)語言分析困境

Qp2m_ggservicer ? 來源:未知 ? 作者:李倩 ? 2018-06-27 11:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

6月23-24日,知乎在798舉辦了一場“陰陽怪氣”主題書法展,現(xiàn)場不僅有陰陽怪氣粉碎機、“瓦力”實驗室等精彩互動,知乎社區(qū)治理團隊也首次亮相,分享了知乎在識別“陰陽怪氣”類內(nèi)容上的探索。

據(jù)了解,知乎還將在近期對該技術(shù)進(jìn)行產(chǎn)品化嘗試,向用戶提供“瓦力”陰陽怪氣智能過濾選項,同時,還將對“瓦力”進(jìn)行更多訓(xùn)練,不斷提升準(zhǔn)確率和召回率,最終將陰陽怪氣識別技術(shù)全面應(yīng)用到社區(qū)治理中。

三大算法模型引領(lǐng),突圍復(fù)雜網(wǎng)絡(luò)語言分析困境

目前,知乎借助AI技術(shù),并輔以人機結(jié)合和多元的產(chǎn)品舉措,多重手段加強對社區(qū)氛圍的維護(hù)。現(xiàn)階段,知乎已實現(xiàn)對95%以上的違法違規(guī)、廣告導(dǎo)流和不友善等內(nèi)容的主動打擊、覆蓋和篩查 。

知乎運營總監(jiān)孫達(dá)云表示, 過去一年,知乎全力探索對陰陽怪氣類評論的解決方案。陰陽怪氣可用“杠精”這個詞來指代,通常以“不針對發(fā)言內(nèi)容,而是批評對方的語氣”以及“提出反對意見,但不給或給出極少數(shù)論據(jù)支持”這兩類常見言論為代表,此類評論極大了傷害創(chuàng)作者和交流者的體驗,但難以解決。

解決陰陽怪氣類評論的難點核心主要在于網(wǎng)絡(luò)語言的復(fù)雜性,情感分析不同于普通文本分析,例如經(jīng)典的“呵呵”,由于雙方不同關(guān)系、說話的不同場景和時間都會帶來迥然不同的表意。即便是人工判定都存在標(biāo)準(zhǔn)化難度,算法模型的訓(xùn)練挑戰(zhàn)就更為艱辛。

知乎團隊的不懈努力下,針對陰陽怪氣評論通常表達(dá)負(fù)面情感的特點,知乎構(gòu)建了內(nèi)容情感傾向性識別的算法模型和識別用戶親密度的模型,并通過訓(xùn)練不斷迭代完善。

此外,針對陰陽怪氣評論的典型特征,知乎建立了文本識別模型不斷標(biāo)記訓(xùn)練樣本。三大模型的結(jié)合,不僅擺脫單一算法模型的局限性,也讓“瓦力”的陰陽怪氣識別準(zhǔn)確率超過了大多數(shù)人工判斷。

持續(xù)迭代技術(shù)方案 攻克情感分析前沿難題

知乎內(nèi)容質(zhì)量管理團隊技術(shù)負(fù)責(zé)人劉兆來則詳細(xì)介紹了“瓦力”最新的陰陽怪氣技術(shù)方案:首先通過知乎社區(qū)里的舉報、反對等負(fù)向用戶行為收集訓(xùn)練數(shù)據(jù)。然后通過各種同義替換、規(guī)則模版方式對訓(xùn)練數(shù)據(jù)進(jìn)行擴展,以緩解訓(xùn)練數(shù)據(jù)稀疏的問題。

同時,“瓦力”提取文本、句法、表情符等特征,并利用一個帶attention的CNN和LSTM的融合模型進(jìn)行分類,最終判斷出內(nèi)容是否為陰陽怪氣。

優(yōu)化技術(shù)方案后,“瓦力”已能實現(xiàn)對“暗藏玄機夸獎”(忍不住關(guān)注答主了,你的答案很有水平!你博士快畢業(yè)了吧?。ⅰ昂脼槿藥煛保ㄎ矣X得你挺慘,雖然長這么大了,還真應(yīng)該回小學(xué)改造)、“強行反駁”(你開心就好、請開始你的表演)等數(shù)類陰陽怪氣內(nèi)容的識別。而根據(jù)知乎社區(qū)治理團隊的調(diào)查,用戶最反感的陰陽怪氣言論大多屬于這些類型,這意味著,“瓦力”在處理網(wǎng)絡(luò)言語暴力上取得了階段性進(jìn)展。

劉兆來表示,未來將不斷優(yōu)化“瓦力”的識別能力,提高模型泛化能力,同時不斷迭代更新模型,緊跟學(xué)術(shù)前沿的同時,適應(yīng)網(wǎng)絡(luò)語言的變化潮流。

知乎著力陰陽怪氣識別技術(shù),正是知乎“認(rèn)真、專業(yè)、友善”社區(qū)精神的一次直觀體現(xiàn)和有力踐行。日益強大的“瓦力”已能實時解決答非所問、辱罵、貼標(biāo)簽等不友善問題,而人機結(jié)合的社區(qū)治理方式,以及用戶深度參與社區(qū)自治,更讓歧視、謠言八卦、愚昧偏見等內(nèi)容在知乎難以找到立足之地。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI算法
    +關(guān)注

    關(guān)注

    0

    文章

    263

    瀏覽量

    12702
  • ai技術(shù)
    +關(guān)注

    關(guān)注

    1

    文章

    1308

    瀏覽量

    25173

原文標(biāo)題:GGAI 前沿 | 知乎優(yōu)化AI算法“瓦力” 挑戰(zhàn)“陰陽怪氣”難題

文章出處:【微信號:ggservicerobot,微信公眾號:高工智能未來】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    小白學(xué)大模型:從零實現(xiàn) LLM語言模型

    在當(dāng)今人工智能領(lǐng)域,大型語言模型(LLM)的開發(fā)已經(jīng)成為一個熱門話題。這些模型通過學(xué)習(xí)大量的文本數(shù)據(jù),能夠生成自然語言文本,完成各種復(fù)雜的任
    的頭像 發(fā)表于 04-30 18:34 ?524次閱讀
    小白學(xué)大<b class='flag-5'>模型</b>:從零實現(xiàn) LLM<b class='flag-5'>語言</b><b class='flag-5'>模型</b>

    模型訓(xùn)練:開源數(shù)據(jù)與算法的機遇與挑戰(zhàn)分析

    進(jìn)行多方位的總結(jié)和梳理。 在第二章《TOP 101-2024 大模型觀點》中,蘇州盛派網(wǎng)絡(luò)科技有限公司創(chuàng)始人兼首席架構(gòu)師蘇震巍分析了大模型訓(xùn)練過程中開源數(shù)據(jù)集和
    的頭像 發(fā)表于 02-20 10:40 ?636次閱讀
    大<b class='flag-5'>模型</b>訓(xùn)練:開源數(shù)據(jù)與<b class='flag-5'>算法</b>的機遇與挑戰(zhàn)<b class='flag-5'>分析</b>

    語言模型的解碼策略與關(guān)鍵優(yōu)化總結(jié)

    本文系統(tǒng)性地闡述了大型語言模型(LargeLanguageModels,LLMs)中的解碼策略技術(shù)原理及其實踐應(yīng)用。通過深入分析各類解碼算法的工作機制、性能特征和優(yōu)化方法,為研究者和工
    的頭像 發(fā)表于 02-18 12:00 ?591次閱讀
    大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>的解碼策略與關(guān)鍵優(yōu)化總結(jié)

    了解DeepSeek-V3 和 DeepSeek-R1兩個大模型的不同定位和應(yīng)用選擇

    采購套件)。 4. 多模態(tài)分析 CLIP-EC (開源社區(qū)模型) 針對電路圖-文本對齊訓(xùn)練的模型,可識別原理圖并生成網(wǎng)表描述(需配合視覺模型使用)。
    發(fā)表于 02-14 02:08

    望獲實時Linux系統(tǒng)與大語言模型深度融合,開創(chuàng)實時智能無限可能!

    語言模型的崛起為智能化應(yīng)用開辟了新的可能性。借助深度學(xué)習(xí)技術(shù),這些模型能夠理解和生成自然語言,處理復(fù)雜的文本和語義信息。這使得它們在諸如人
    的頭像 發(fā)表于 01-08 13:44 ?695次閱讀

    語言模型管理的作用

    要充分發(fā)揮語言模型的潛力,有效的語言模型管理非常重要。以下,是對語言模型管理作用的
    的頭像 發(fā)表于 01-02 11:06 ?393次閱讀

    AI大語言模型開發(fā)步驟

    開發(fā)一個高效、準(zhǔn)確的大語言模型是一個復(fù)雜且多階段的過程,涉及數(shù)據(jù)收集與預(yù)處理、模型架構(gòu)設(shè)計、訓(xùn)練與優(yōu)化、評估與調(diào)試等多個環(huán)節(jié)。接下來,AI部落小編為大家詳細(xì)闡述AI大
    的頭像 發(fā)表于 12-19 11:29 ?915次閱讀

    語言模型開發(fā)框架是什么

    語言模型開發(fā)框架是指用于訓(xùn)練、推理和部署大型語言模型的軟件工具和庫。下面,AI部落小編為您介紹大語言
    的頭像 發(fā)表于 12-06 10:28 ?533次閱讀

    語言模型開發(fā)語言是什么

    在人工智能領(lǐng)域,大語言模型(Large Language Models, LLMs)背后,離不開高效的開發(fā)語言和工具的支持。下面,AI部落小編為您介紹大語言
    的頭像 發(fā)表于 12-04 11:44 ?709次閱讀

    云端語言模型開發(fā)方法

    云端語言模型的開發(fā)是一個復(fù)雜而系統(tǒng)的過程,涉及數(shù)據(jù)準(zhǔn)備、模型選擇、訓(xùn)練優(yōu)化、部署應(yīng)用等多個環(huán)節(jié)。下面,AI部落小編為您分享云端語言
    的頭像 發(fā)表于 12-02 10:48 ?695次閱讀

    從零開始訓(xùn)練一個大語言模型需要投資多少錢?

    一,前言 ? 在AI領(lǐng)域,訓(xùn)練一個大型語言模型(LLM)是一個耗時且復(fù)雜的過程。幾乎每個做大型語言模型(LLM)訓(xùn)練的人都會被問到:“從零開
    的頭像 發(fā)表于 11-08 14:15 ?796次閱讀
    從零開始訓(xùn)練一個大<b class='flag-5'>語言</b><b class='flag-5'>模型</b>需要投資多少錢?

    語言模型如何開發(fā)

    語言模型的開發(fā)是一個復(fù)雜且細(xì)致的過程,涵蓋了數(shù)據(jù)準(zhǔn)備、模型架構(gòu)設(shè)計、訓(xùn)練、微調(diào)和部署等多個階段。以下是對大語言
    的頭像 發(fā)表于 11-04 10:14 ?609次閱讀

    Llama 3 語言模型應(yīng)用

    在人工智能領(lǐng)域,語言模型的發(fā)展一直是研究的熱點。隨著技術(shù)的不斷進(jìn)步,我們見證了從簡單的關(guān)鍵詞匹配到復(fù)雜的上下文理解的轉(zhuǎn)變。 一、Llama 3 語言
    的頭像 發(fā)表于 10-27 14:15 ?749次閱讀

    【《大語言模型應(yīng)用指南》閱讀體驗】+ 基礎(chǔ)知識學(xué)習(xí)

    的信息,提供更全面的上下文理解。這使得模型能夠更準(zhǔn)確地理解復(fù)雜問題中的多個層面和隱含意義。 2. 語義分析 模型通過訓(xùn)練學(xué)習(xí)到語言的語義特征
    發(fā)表于 08-02 11:03

    【《大語言模型應(yīng)用指南》閱讀體驗】+ 基礎(chǔ)篇

    講解,包括偏置、權(quán)重、激活函數(shù);要素包括網(wǎng)絡(luò)結(jié)構(gòu)、損失函數(shù)和優(yōu)化方法。章節(jié)最后總結(jié)了神經(jīng)網(wǎng)絡(luò)參數(shù)學(xué)習(xí)的關(guān)鍵步驟。 1.4章節(jié)描述了自然語言處理的相關(guān)知識點,包括什么是自然
    發(fā)表于 07-25 14:33