一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ChatGPT重磅升級!新語音和圖像輸入功能,讓ChatGPT能看、能聽、能說

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-09-28 00:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日消息,OpenAI在一篇博客中表示,ChatGPT 將推出新的語音和圖像功能。用戶不僅可以在文本框中輸入文字提示,還可以通過語音或圖像與ChatGPT交流。OpenAI稱,新功能在未來兩周內(nèi)向付費(fèi)用戶推出,不久后會(huì)推廣到其他用戶。

ChatGPT 是OpenAI推出的一種人工智能技術(shù)驅(qū)動(dòng)的自然語言處理工具,它能夠基于在預(yù)訓(xùn)練階段所見的模式和統(tǒng)計(jì)規(guī)律,來生成回答,還能根據(jù)聊天的上下文進(jìn)行互動(dòng),能完成撰寫郵件、視頻腳本、文案、翻譯、代碼,寫論文等任務(wù)。自2022年11月30日發(fā)布以來,ChatGPT 已經(jīng)進(jìn)行了多次功能升級。

ChatGPT現(xiàn)在能看、能聽、能說了

ChatGPT使用了Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu),也是GPT-3.5架構(gòu),這是一種用于處理序列數(shù)據(jù)的模型,擁有語言理解和文本生成能力,尤其是它會(huì)通過連接大量的語料庫來訓(xùn)練模型,這些語料庫包含了真實(shí)世界中的對話,使得ChatGPT具備上知天文下知地理,還能根據(jù)聊天的上下文進(jìn)行互動(dòng)的能力,做到與真正人類幾乎無異的聊天場景進(jìn)行交流。

2022年11月30日,ChatGPT剛面世就迅速在社交媒體上走紅,短短5天,注冊用戶數(shù)超過100萬。2023年一月末,ChatGPT的月活用戶突破1億,成為史上增長最快的消費(fèi)者應(yīng)用。

2023年2月2日,OpenAI發(fā)布ChatGPT試點(diǎn)訂閱計(jì)劃——ChatGPT Plus。ChatGPT Plus以每月20美元的價(jià)格提供,訂閱者可獲得比免費(fèi)版本更穩(wěn)定、更快的服務(wù),及嘗試新功能和優(yōu)化的優(yōu)先權(quán)。同日,微軟發(fā)布公告稱,旗下所有產(chǎn)品將全線整合ChatGPT。

2023年3月15日,OpenAI正式推出GPT-4。GPT-4是多模態(tài)大模型,即支持圖像和文本輸入以及文本輸出,擁有強(qiáng)大的識圖能力。GPT-4的特點(diǎn)在于:第一,它的訓(xùn)練數(shù)量更大;第二,支持多元的輸出輸入形式;第三,在專業(yè)領(lǐng)域的學(xué)習(xí)能力更強(qiáng)。

2023年5月18日,OpenAI官網(wǎng)宣布推出iOS版ChatGPT應(yīng)用,該應(yīng)用可免費(fèi)使用,并在不同設(shè)備間同步用戶的歷史記錄。該應(yīng)用還集成了OpenAI開源語音識別系統(tǒng)Whisper,支持語音輸入。ChatGPT Plus付費(fèi)訂閱用戶可以獨(dú)家使用GPT-4功能。

2023年7月,OpenAI宣布推出定制指令功能,以便客戶更好地控制ChatGPT的回應(yīng)方式。此外,OpenAI還發(fā)布公告稱,給ChatGPT加了一個(gè)名為Custom instructions的新功能。2023年7月25日,OpenAI宣布,安卓版ChatGPT正式上線。

2023年9月25日,OpenAI發(fā)布《ChatGPT 現(xiàn)在能看、能聽、能說了》的公告,宣布ChatGPT 增加語音輸入和圖像輸入兩項(xiàng)新功能。這可以說是ChatGPT 發(fā)布以來極其重大的更新。

據(jù)介紹,語音輸入功能類似于手機(jī)上的語音助手,用戶只需要輕輕點(diǎn)擊一個(gè)按鈕,說出自己的問題,ChatGPT能將這些口述的問題轉(zhuǎn)換成文本,將其輸入至大語言模型中,生成答案,接著將答案轉(zhuǎn)化成語音,播放給用戶。

語音轉(zhuǎn)文本的任務(wù)由OpenAI 的 Whisper 模型提供支持。同時(shí),該公司正在引入一款全新的文本轉(zhuǎn)語音的模型,據(jù)稱可以通過幾秒鐘的語音樣本生成與人類相似的音頻。

圖像輸入功能類似于Google Lens,用戶可以拍攝自己感興趣的事物,并上傳到ChatGPT中,ChatGPT會(huì)嘗試識別用戶想要詢問的內(nèi)容,并給出相應(yīng)的回答。用戶還可以用應(yīng)用中的繪圖工具來幫助表達(dá)自己的問題,或者配合語音或文本輸入來進(jìn)行交流。

用戶可以向ChatGPT展示一張或多張圖片,提問相關(guān)的問題。比如,發(fā)送一張壞掉的燒烤爐圖片,然后詢問無法啟動(dòng)原因;拍攝一張冰箱中的食材,詢問多種菜品制作方案。

OpenAI還放出了一段視頻,是和ChatGPT商量著修自行車,不斷問ChatGPT:這里是扳手嗎?是調(diào)整這里嗎?甚至還把說明書拍照發(fā)給ChatGPT求解釋。

這正是ChatGPT獨(dú)特的特性所帶來的幫助,用戶可以與機(jī)器人進(jìn)行互動(dòng),逐步完善答案,而無需首先進(jìn)行搜索并在得到錯(cuò)誤答案后再次搜索。

ChatGPT新增語音和圖像功能帶來的風(fēng)險(xiǎn)

OpenAI在博客中表示,其目標(biāo)是構(gòu)建安全有益的通用人工智能(AGI)。新增的語音和圖像功能可能會(huì)帶來一些風(fēng)險(xiǎn),但是OpenAI正在采取措施緩解這些風(fēng)險(xiǎn)。

新的語音技術(shù)能夠在短短幾秒鐘的真實(shí)語音片段中生成逼真的合成語音,這一技術(shù)存在潛在風(fēng)險(xiǎn),比如,惡意行為者可能會(huì)濫用這項(xiàng)技術(shù),冒充公眾人物或?qū)嵤┢墼p。為了避免這些問題的發(fā)生,OpenAI決定將這項(xiàng)技術(shù)應(yīng)用于特定的場景中,會(huì)受到嚴(yán)格的限制。

新的圖像功能也帶來一定風(fēng)險(xiǎn),在進(jìn)行更廣泛的部署之前,OpenAI測試了該模型在極端主義和科學(xué)領(lǐng)域等方面潛在的風(fēng)險(xiǎn),并對一些關(guān)鍵細(xì)節(jié)進(jìn)行了調(diào)整,來確保負(fù)責(zé)任地應(yīng)用這項(xiàng)技術(shù)。比如,在處理人物圖片時(shí),OpenAI限制了ChatGPT 對人物進(jìn)行分析和直接評價(jià)的能力,這意味著上傳一個(gè)人的照片就能知道那是誰無法實(shí)現(xiàn),這是為了隱私安全。

ChatGPT自發(fā)布以來,在受到廣大用戶追捧的同時(shí),其伴隨的風(fēng)險(xiǎn)也讓各界人士表示擔(dān)憂。一是它可能在被使用的過程中造成數(shù)據(jù)信息的丟失;二是它也可能會(huì)被一些不法分子用來實(shí)施欺詐行為。在過去這大半年時(shí)間里,不少機(jī)構(gòu)也在反對ChatGPT的使用和進(jìn)一步研究。

2023年2月3日,IT行業(yè)的領(lǐng)導(dǎo)們擔(dān)心,ChatGPT已經(jīng)被黑客們用于策劃網(wǎng)絡(luò)攻擊時(shí)使用。黑莓(Black Berry)的一份報(bào)告調(diào)查了英國500名IT行業(yè)決策者對ChatGPT這項(xiàng)革命性技術(shù)的看法,發(fā)現(xiàn)超過四分之三(76%)的人認(rèn)為,外國已經(jīng)在針對其他國家的網(wǎng)絡(luò)戰(zhàn)爭中使用ChatGPT。近一半的人認(rèn)為,2023年,將會(huì)出現(xiàn)有人惡意使用ChatGPT成功進(jìn)行網(wǎng)絡(luò)攻擊。

2023年4月,中國支付清算協(xié)會(huì)倡議支付行業(yè)從業(yè)人員謹(jǐn)慎使用ChatGPT。4月13日,西班牙國家數(shù)據(jù)保護(hù)局和法國國家信息自由委員會(huì)分別宣布對ChatGPT展開調(diào)查。

在各界人士對ChatGPT存在風(fēng)險(xiǎn)的質(zhì)疑聲中,OpenAI也一直在尋找解決辦法,如何讓其在增加新功能的同時(shí)而不會(huì)帶來新的問題。從這次的功能升級來看,OpenAI試圖通過有意限制新模型的功能,來達(dá)到更進(jìn)一步提升功能和同時(shí)帶來新問題的平衡。OpenAI表示,將不斷改進(jìn)和完善風(fēng)險(xiǎn)緩解措施,未來為大家提供更強(qiáng)大的系統(tǒng)。

總結(jié)

ChatGPT自出世以來就引起了廣泛關(guān)注,過去近一年時(shí)間,OpenAI對其底層模型和界面也進(jìn)行了多次升級。如今,ChatGPT更是進(jìn)行了一次重磅升級,新增語音輸入和圖像輸入功能,讓ChatGPT實(shí)現(xiàn)了能看、能聽、能說的能力。

與此同時(shí),ChatGPT在使用中存在的風(fēng)險(xiǎn)一直以來也是各界擔(dān)心的問題,此次增加的新功能更是可能帶來新的風(fēng)險(xiǎn)。不過在過去這段時(shí)間,OpenAI也一直致力于尋找解決辦法,就比如在這次功能升級中,OpenAI通過一些限制來在實(shí)現(xiàn)新功能的同時(shí)也避免可能帶來新風(fēng)險(xiǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1590

    瀏覽量

    9129
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    和安信可Ai-M61模組對話?手搓一個(gè)ChatGPT 語音助手 #人工智能 #

    ChatGPT
    jf_31745078
    發(fā)布于 :2025年03月12日 15:56:59

    OpenAI免費(fèi)開放ChatGPT搜索功能

    近日,OpenAI宣布了一項(xiàng)重大決策:向所有用戶免費(fèi)開放ChatGPT搜索功能。這一舉措無疑將為用戶帶來更加高效、智能的搜索體驗(yàn)。 與谷歌等傳統(tǒng)搜索引擎的收錄模式相比,ChatGPT搜索展現(xiàn)出了獨(dú)特
    的頭像 發(fā)表于 02-06 14:35 ?513次閱讀

    OpenAI桌面版ChatGPT新增應(yīng)用協(xié)作功能

    近日,OpenAI宣布了一項(xiàng)重要更新,為桌面版ChatGPT推出了“與應(yīng)用協(xié)作”(Work With Apps)功能。這一新功能旨在支持原生應(yīng)用程序的自動(dòng)化協(xié)作,為用戶帶來更加高效和便捷
    的頭像 發(fā)表于 12-23 10:52 ?681次閱讀

    ChatGPT新增實(shí)時(shí)搜索與高級語音功能

    。OpenAI對搜索算法進(jìn)行了深度優(yōu)化,使得ChatGPT能夠在用戶提出問題后,迅速獲取到分鐘級別的最新信息,包括股票、新聞等。這一功能的加入,極大地滿足了用戶對即時(shí)數(shù)據(jù)的需求,使得ChatGPT在各類應(yīng)用場景中更加得心應(yīng)手。
    的頭像 發(fā)表于 12-17 14:08 ?650次閱讀

    大聯(lián)大推出基于MediaTek Genio 130與ChatGPT的AI語音助理方案

    大聯(lián)大控股,作為亞太地區(qū)市場領(lǐng)先的半導(dǎo)體元器件分銷商,近日宣布了一項(xiàng)重要?jiǎng)?chuàng)新。其旗下子公司品佳,成功推出了基于聯(lián)發(fā)科技(MediaTek)Genio 130芯片與ChatGPT功能的AI語音助理方案
    的頭像 發(fā)表于 12-11 11:07 ?842次閱讀

    OpenAI推出Windows桌面版ChatGPT應(yīng)用

    Embiricos介紹,這款桌面版ChatGPT應(yīng)用不僅繼承了原有版本的強(qiáng)大功能,還新增了多項(xiàng)實(shí)用特性,旨在用戶在不中斷當(dāng)前工作流程的情況下,輕松啟動(dòng)新的對話或繼續(xù)之前的討論。 該應(yīng)用支持
    的頭像 發(fā)表于 11-18 14:04 ?713次閱讀

    OpenAI推出ChatGPT搜索功能

    近日,OpenAI再次邁出了重要的一步,為其廣受好評的ChatGPT平臺添加了一項(xiàng)全新的搜索功能。 據(jù)悉,這項(xiàng)被命名為“ChatGPT搜索”的新功能,將為用戶帶來前所未有的搜索體驗(yàn)。以
    的頭像 發(fā)表于 11-04 10:34 ?687次閱讀

    OpenAI在ChatGPT增添搜索功能

    近日,OpenAI宣布為其旗艦產(chǎn)品ChatGPT增添全新的搜索功能,此舉標(biāo)志著該公司對Alphabet旗下谷歌的直接挑戰(zhàn)進(jìn)一步升級。OpenAI周四正式揭曉了這一名為“ChatGPT
    的頭像 發(fā)表于 11-01 17:01 ?763次閱讀

    OpenAI ChatGPT高級語音模式登陸Windows和Mac平臺

    10月31日最新消息,OpenAI今日正式宣布,其ChatGPT的高級語音模式(AVM)現(xiàn)已全面登陸Windows與Mac電腦平臺。
    的頭像 發(fā)表于 10-31 16:35 ?925次閱讀

    解鎖 GPT-4o!2024 ChatGPT Plus 代升級全攻略(附國內(nèi)支付方法)

    ChatGPT Plus 每月 20 美元,OpenAI 承諾 Plus 用戶享有更快的響應(yīng)速度、優(yōu)先使用新功能及最新模型,包括強(qiáng)大的 GPT-4o。本文將分享 2024 年 ChatGPT
    的頭像 發(fā)表于 10-29 18:17 ?2520次閱讀

    怎樣搭建基于 ChatGPT 的聊天系統(tǒng)

    搭建一個(gè)基于ChatGPT的聊天系統(tǒng)是一個(gè)涉及多個(gè)步驟的過程,包括理解ChatGPT的API、設(shè)計(jì)用戶界面、處理數(shù)據(jù)和集成ChatGPT模型。以下是一個(gè)簡化的指南,用于創(chuàng)建一個(gè)基本的聊天系統(tǒng)。 1.
    的頭像 發(fā)表于 10-25 16:23 ?1032次閱讀

    ChatGPT 適合哪些行業(yè)

    ChatGPT 是一種基于人工智能的自然語言處理技術(shù),它能夠理解和生成人類語言。這種技術(shù)在多個(gè)行業(yè)中都有廣泛的應(yīng)用潛力。以下是一些ChatGPT特別適合的行業(yè),以及它在這些行業(yè)中可能的應(yīng)用方式
    的頭像 發(fā)表于 10-25 16:11 ?1003次閱讀

    ChatGPT 高級語音模式擴(kuò)展至歐盟多國

    ,隨后在上個(gè)月擴(kuò)展到了英國用戶。現(xiàn)在,歐盟等多地區(qū)的 ChatGPT Plus 和 Team 用戶也可以享受到這一便捷的功能。 ChatGPT 高級語音模式的一大亮點(diǎn)在于其快速的響應(yīng)時(shí)
    的頭像 發(fā)表于 10-23 11:08 ?787次閱讀

    OpenAI發(fā)布ChatGPT高級語音版,付費(fèi)訂閱并設(shè)對話時(shí)長限制

    ChatGPT已邁入語音交互的新紀(jì)元,為付費(fèi)用戶解鎖了高級語音功能,旨在對話體驗(yàn)更加自然流暢。OpenAI在本周二宣布了這一消息,標(biāo)志著其
    的頭像 發(fā)表于 09-27 15:34 ?3124次閱讀