一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ChatGPT重磅升級(jí)!新語音和圖像輸入功能,讓ChatGPT能看、能聽、能說

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-09-28 00:14 ? 次閱讀

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日消息,OpenAI在一篇博客中表示,ChatGPT 將推出新的語音和圖像功能。用戶不僅可以在文本框中輸入文字提示,還可以通過語音或圖像與ChatGPT交流。OpenAI稱,新功能在未來兩周內(nèi)向付費(fèi)用戶推出,不久后會(huì)推廣到其他用戶。

ChatGPT 是OpenAI推出的一種人工智能技術(shù)驅(qū)動(dòng)的自然語言處理工具,它能夠基于在預(yù)訓(xùn)練階段所見的模式和統(tǒng)計(jì)規(guī)律,來生成回答,還能根據(jù)聊天的上下文進(jìn)行互動(dòng),能完成撰寫郵件、視頻腳本、文案、翻譯、代碼,寫論文等任務(wù)。自2022年11月30日發(fā)布以來,ChatGPT 已經(jīng)進(jìn)行了多次功能升級(jí)。

ChatGPT現(xiàn)在能看、能聽、能說了

ChatGPT使用了Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu),也是GPT-3.5架構(gòu),這是一種用于處理序列數(shù)據(jù)的模型,擁有語言理解和文本生成能力,尤其是它會(huì)通過連接大量的語料庫來訓(xùn)練模型,這些語料庫包含了真實(shí)世界中的對(duì)話,使得ChatGPT具備上知天文下知地理,還能根據(jù)聊天的上下文進(jìn)行互動(dòng)的能力,做到與真正人類幾乎無異的聊天場(chǎng)景進(jìn)行交流。

2022年11月30日,ChatGPT剛面世就迅速在社交媒體上走紅,短短5天,注冊(cè)用戶數(shù)超過100萬。2023年一月末,ChatGPT的月活用戶突破1億,成為史上增長最快的消費(fèi)者應(yīng)用。

2023年2月2日,OpenAI發(fā)布ChatGPT試點(diǎn)訂閱計(jì)劃——ChatGPT Plus。ChatGPT Plus以每月20美元的價(jià)格提供,訂閱者可獲得比免費(fèi)版本更穩(wěn)定、更快的服務(wù),及嘗試新功能和優(yōu)化的優(yōu)先權(quán)。同日,微軟發(fā)布公告稱,旗下所有產(chǎn)品將全線整合ChatGPT。

2023年3月15日,OpenAI正式推出GPT-4。GPT-4是多模態(tài)大模型,即支持圖像和文本輸入以及文本輸出,擁有強(qiáng)大的識(shí)圖能力。GPT-4的特點(diǎn)在于:第一,它的訓(xùn)練數(shù)量更大;第二,支持多元的輸出輸入形式;第三,在專業(yè)領(lǐng)域的學(xué)習(xí)能力更強(qiáng)。

2023年5月18日,OpenAI官網(wǎng)宣布推出iOS版ChatGPT應(yīng)用,該應(yīng)用可免費(fèi)使用,并在不同設(shè)備間同步用戶的歷史記錄。該應(yīng)用還集成了OpenAI開源語音識(shí)別系統(tǒng)Whisper,支持語音輸入。ChatGPT Plus付費(fèi)訂閱用戶可以獨(dú)家使用GPT-4功能。

2023年7月,OpenAI宣布推出定制指令功能,以便客戶更好地控制ChatGPT的回應(yīng)方式。此外,OpenAI還發(fā)布公告稱,給ChatGPT加了一個(gè)名為Custom instructions的新功能。2023年7月25日,OpenAI宣布,安卓版ChatGPT正式上線。

2023年9月25日,OpenAI發(fā)布《ChatGPT 現(xiàn)在能看、能聽、能說了》的公告,宣布ChatGPT 增加語音輸入和圖像輸入兩項(xiàng)新功能。這可以說是ChatGPT 發(fā)布以來極其重大的更新。

據(jù)介紹,語音輸入功能類似于手機(jī)上的語音助手,用戶只需要輕輕點(diǎn)擊一個(gè)按鈕,說出自己的問題,ChatGPT能將這些口述的問題轉(zhuǎn)換成文本,將其輸入至大語言模型中,生成答案,接著將答案轉(zhuǎn)化成語音,播放給用戶。

語音轉(zhuǎn)文本的任務(wù)由OpenAI 的 Whisper 模型提供支持。同時(shí),該公司正在引入一款全新的文本轉(zhuǎn)語音的模型,據(jù)稱可以通過幾秒鐘的語音樣本生成與人類相似的音頻。

圖像輸入功能類似于Google Lens,用戶可以拍攝自己感興趣的事物,并上傳到ChatGPT中,ChatGPT會(huì)嘗試識(shí)別用戶想要詢問的內(nèi)容,并給出相應(yīng)的回答。用戶還可以用應(yīng)用中的繪圖工具來幫助表達(dá)自己的問題,或者配合語音或文本輸入來進(jìn)行交流。

用戶可以向ChatGPT展示一張或多張圖片,提問相關(guān)的問題。比如,發(fā)送一張壞掉的燒烤爐圖片,然后詢問無法啟動(dòng)原因;拍攝一張冰箱中的食材,詢問多種菜品制作方案。

OpenAI還放出了一段視頻,是和ChatGPT商量著修自行車,不斷問ChatGPT:這里是扳手嗎?是調(diào)整這里嗎?甚至還把說明書拍照發(fā)給ChatGPT求解釋。

這正是ChatGPT獨(dú)特的特性所帶來的幫助,用戶可以與機(jī)器人進(jìn)行互動(dòng),逐步完善答案,而無需首先進(jìn)行搜索并在得到錯(cuò)誤答案后再次搜索。

ChatGPT新增語音和圖像功能帶來的風(fēng)險(xiǎn)

OpenAI在博客中表示,其目標(biāo)是構(gòu)建安全有益的通用人工智能(AGI)。新增的語音和圖像功能可能會(huì)帶來一些風(fēng)險(xiǎn),但是OpenAI正在采取措施緩解這些風(fēng)險(xiǎn)。

新的語音技術(shù)能夠在短短幾秒鐘的真實(shí)語音片段中生成逼真的合成語音,這一技術(shù)存在潛在風(fēng)險(xiǎn),比如,惡意行為者可能會(huì)濫用這項(xiàng)技術(shù),冒充公眾人物或?qū)嵤┢墼p。為了避免這些問題的發(fā)生,OpenAI決定將這項(xiàng)技術(shù)應(yīng)用于特定的場(chǎng)景中,會(huì)受到嚴(yán)格的限制。

新的圖像功能也帶來一定風(fēng)險(xiǎn),在進(jìn)行更廣泛的部署之前,OpenAI測(cè)試了該模型在極端主義和科學(xué)領(lǐng)域等方面潛在的風(fēng)險(xiǎn),并對(duì)一些關(guān)鍵細(xì)節(jié)進(jìn)行了調(diào)整,來確保負(fù)責(zé)任地應(yīng)用這項(xiàng)技術(shù)。比如,在處理人物圖片時(shí),OpenAI限制了ChatGPT 對(duì)人物進(jìn)行分析和直接評(píng)價(jià)的能力,這意味著上傳一個(gè)人的照片就能知道那是誰無法實(shí)現(xiàn),這是為了隱私安全。

ChatGPT自發(fā)布以來,在受到廣大用戶追捧的同時(shí),其伴隨的風(fēng)險(xiǎn)也讓各界人士表示擔(dān)憂。一是它可能在被使用的過程中造成數(shù)據(jù)信息的丟失;二是它也可能會(huì)被一些不法分子用來實(shí)施欺詐行為。在過去這大半年時(shí)間里,不少機(jī)構(gòu)也在反對(duì)ChatGPT的使用和進(jìn)一步研究。

2023年2月3日,IT行業(yè)的領(lǐng)導(dǎo)們擔(dān)心,ChatGPT已經(jīng)被黑客們用于策劃網(wǎng)絡(luò)攻擊時(shí)使用。黑莓(Black Berry)的一份報(bào)告調(diào)查了英國500名IT行業(yè)決策者對(duì)ChatGPT這項(xiàng)革命性技術(shù)的看法,發(fā)現(xiàn)超過四分之三(76%)的人認(rèn)為,外國已經(jīng)在針對(duì)其他國家的網(wǎng)絡(luò)戰(zhàn)爭(zhēng)中使用ChatGPT。近一半的人認(rèn)為,2023年,將會(huì)出現(xiàn)有人惡意使用ChatGPT成功進(jìn)行網(wǎng)絡(luò)攻擊。

2023年4月,中國支付清算協(xié)會(huì)倡議支付行業(yè)從業(yè)人員謹(jǐn)慎使用ChatGPT。4月13日,西班牙國家數(shù)據(jù)保護(hù)局和法國國家信息自由委員會(huì)分別宣布對(duì)ChatGPT展開調(diào)查。

在各界人士對(duì)ChatGPT存在風(fēng)險(xiǎn)的質(zhì)疑聲中,OpenAI也一直在尋找解決辦法,如何讓其在增加新功能的同時(shí)而不會(huì)帶來新的問題。從這次的功能升級(jí)來看,OpenAI試圖通過有意限制新模型的功能,來達(dá)到更進(jìn)一步提升功能和同時(shí)帶來新問題的平衡。OpenAI表示,將不斷改進(jìn)和完善風(fēng)險(xiǎn)緩解措施,未來為大家提供更強(qiáng)大的系統(tǒng)。

總結(jié)

ChatGPT自出世以來就引起了廣泛關(guān)注,過去近一年時(shí)間,OpenAI對(duì)其底層模型和界面也進(jìn)行了多次升級(jí)。如今,ChatGPT更是進(jìn)行了一次重磅升級(jí),新增語音輸入和圖像輸入功能,讓ChatGPT實(shí)現(xiàn)了能看、能聽、能說的能力。

與此同時(shí),ChatGPT在使用中存在的風(fēng)險(xiǎn)一直以來也是各界擔(dān)心的問題,此次增加的新功能更是可能帶來新的風(fēng)險(xiǎn)。不過在過去這段時(shí)間,OpenAI也一直致力于尋找解決辦法,就比如在這次功能升級(jí)中,OpenAI通過一些限制來在實(shí)現(xiàn)新功能的同時(shí)也避免可能帶來新風(fēng)險(xiǎn)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ChatGPT
    +關(guān)注

    關(guān)注

    29

    文章

    1584

    瀏覽量

    8663
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    和安信可Ai-M61模組對(duì)話?手搓一個(gè)ChatGPT 語音助手 #人工智能 #

    ChatGPT
    jf_31745078
    發(fā)布于 :2025年03月12日 15:56:59

    OpenAI免費(fèi)開放ChatGPT搜索功能

    近日,OpenAI宣布了一項(xiàng)重大決策:向所有用戶免費(fèi)開放ChatGPT搜索功能。這一舉措無疑將為用戶帶來更加高效、智能的搜索體驗(yàn)。 與谷歌等傳統(tǒng)搜索引擎的收錄模式相比,ChatGPT搜索展現(xiàn)出了獨(dú)特
    的頭像 發(fā)表于 02-06 14:35 ?371次閱讀

    ChatGPT新增實(shí)時(shí)搜索與高級(jí)語音功能

    。OpenAI對(duì)搜索算法進(jìn)行了深度優(yōu)化,使得ChatGPT能夠在用戶提出問題后,迅速獲取到分鐘級(jí)別的最新信息,包括股票、新聞等。這一功能的加入,極大地滿足了用戶對(duì)即時(shí)數(shù)據(jù)的需求,使得ChatGPT在各類應(yīng)用場(chǎng)景中更加得心應(yīng)手。
    的頭像 發(fā)表于 12-17 14:08 ?495次閱讀

    大聯(lián)大推出基于MediaTek Genio 130與ChatGPT的AI語音助理方案

    大聯(lián)大控股,作為亞太地區(qū)市場(chǎng)領(lǐng)先的半導(dǎo)體元器件分銷商,近日宣布了一項(xiàng)重要?jiǎng)?chuàng)新。其旗下子公司品佳,成功推出了基于聯(lián)發(fā)科技(MediaTek)Genio 130芯片與ChatGPT功能的AI語音助理方案
    的頭像 發(fā)表于 12-11 11:07 ?679次閱讀

    OpenAI推出Windows桌面版ChatGPT應(yīng)用

    Embiricos介紹,這款桌面版ChatGPT應(yīng)用不僅繼承了原有版本的強(qiáng)大功能,還新增了多項(xiàng)實(shí)用特性,旨在用戶在不中斷當(dāng)前工作流程的情況下,輕松啟動(dòng)新的對(duì)話或繼續(xù)之前的討論。 該應(yīng)用支持
    的頭像 發(fā)表于 11-18 14:04 ?547次閱讀

    OpenAI推出ChatGPT搜索功能

    近日,OpenAI再次邁出了重要的一步,為其廣受好評(píng)的ChatGPT平臺(tái)添加了一項(xiàng)全新的搜索功能。 據(jù)悉,這項(xiàng)被命名為“ChatGPT搜索”的新功能,將為用戶帶來前所未有的搜索體驗(yàn)。以
    的頭像 發(fā)表于 11-04 10:34 ?577次閱讀

    OpenAI在ChatGPT增添搜索功能

    近日,OpenAI宣布為其旗艦產(chǎn)品ChatGPT增添全新的搜索功能,此舉標(biāo)志著該公司對(duì)Alphabet旗下谷歌的直接挑戰(zhàn)進(jìn)一步升級(jí)。OpenAI周四正式揭曉了這一名為“ChatGPT
    的頭像 發(fā)表于 11-01 17:01 ?623次閱讀

    OpenAI ChatGPT高級(jí)語音模式登陸Windows和Mac平臺(tái)

    10月31日最新消息,OpenAI今日正式宣布,其ChatGPT的高級(jí)語音模式(AVM)現(xiàn)已全面登陸Windows與Mac電腦平臺(tái)。
    的頭像 發(fā)表于 10-31 16:35 ?744次閱讀

    怎樣搭建基于 ChatGPT 的聊天系統(tǒng)

    搭建一個(gè)基于ChatGPT的聊天系統(tǒng)是一個(gè)涉及多個(gè)步驟的過程,包括理解ChatGPT的API、設(shè)計(jì)用戶界面、處理數(shù)據(jù)和集成ChatGPT模型。以下是一個(gè)簡化的指南,用于創(chuàng)建一個(gè)基本的聊天系統(tǒng)。 1.
    的頭像 發(fā)表于 10-25 16:23 ?869次閱讀

    ChatGPT 高級(jí)語音模式擴(kuò)展至歐盟多國

    ,隨后在上個(gè)月擴(kuò)展到了英國用戶?,F(xiàn)在,歐盟等多地區(qū)的 ChatGPT Plus 和 Team 用戶也可以享受到這一便捷的功能。 ChatGPT 高級(jí)語音模式的一大亮點(diǎn)在于其快速的響應(yīng)時(shí)
    的頭像 發(fā)表于 10-23 11:08 ?644次閱讀

    OpenAI發(fā)布ChatGPT高級(jí)語音版,付費(fèi)訂閱并設(shè)對(duì)話時(shí)長限制

    ChatGPT已邁入語音交互的新紀(jì)元,為付費(fèi)用戶解鎖了高級(jí)語音功能,旨在對(duì)話體驗(yàn)更加自然流暢。OpenAI在本周二宣布了這一消息,標(biāo)志著其
    的頭像 發(fā)表于 09-27 15:34 ?2801次閱讀

    用launch pad燒錄chatgpt_demo項(xiàng)目會(huì)有api key報(bào)錯(cuò)的原因?

    我用launch pad燒錄chatgpt_demo項(xiàng)目問題會(huì)有api key報(bào)錯(cuò);請(qǐng)問用launch pad要如何設(shè)置api key和調(diào)試?還是只能通過idf?
    發(fā)表于 06-27 07:59

    使用espbox lite進(jìn)行chatgpt_demo的燒錄報(bào)錯(cuò)是什么原因?

    我使用espbox lite進(jìn)行chatgpt_demo的燒錄 我的idf是v5.1release版本的,espbox是master版本的 在編譯時(shí)似乎沒有什么問題 在燒錄時(shí)報(bào)錯(cuò) 請(qǐng)問這是什么原因
    發(fā)表于 06-11 08:45

    OpenAI 深夜拋出王炸 “ChatGPT- 4o”, “她” 來了

    功能和實(shí)際應(yīng)用。 GPT-4 turbo****的增強(qiáng)功能 ChatGPT-4o帶來了幾個(gè)值得注意的升級(jí),增強(qiáng)了性能和可用性: · 更快的響應(yīng)時(shí)間和更高的準(zhǔn)確性: 是客戶服務(wù)和其他快
    發(fā)表于 05-27 15:43

    OpenAI正在為ChatGPT開發(fā)全新的搜索功能

    OpenAI近日傳來令人振奮的消息,其正在為旗下明星產(chǎn)品ChatGPT研發(fā)一項(xiàng)全新的搜索功能。據(jù)悉,這項(xiàng)功能將極大地拓寬ChatGPT的應(yīng)用范圍,并為用戶帶來更為全面、準(zhǔn)確的回答。
    的頭像 發(fā)表于 05-10 11:18 ?686次閱讀