作者 / 產(chǎn)品經(jīng)理 Ivan Solovyev
開發(fā)者現(xiàn)在可以通過 Gemini API 訪問 Google 最先進(jìn)的圖像生成模型 Imagen 3。該模型最初僅對付費(fèi)用戶開放,不久后也將面向免費(fèi)用戶推出。
Imagen 3 擅長生成具有視覺吸引力、無偽影且風(fēng)格多樣的圖像,從超現(xiàn)實(shí)主義圖像到印象派風(fēng)景,從抽象構(gòu)圖到動漫角色等應(yīng)有盡有。改進(jìn)后的提示遵循能力使其能夠輕松地將絕佳創(chuàng)意轉(zhuǎn)化為高質(zhì)量圖像??傮w而言,Imagen 3 在各種基準(zhǔn)測試中展現(xiàn)出了最先進(jìn)的性能。通過 Gemini API 使用 Imagen 3 的價(jià)格為每張圖像 0.03 美元,并且用戶可以控制寬高比、生成選項(xiàng)數(shù)量等更多參數(shù)。
為了幫助遏制錯(cuò)誤信息和錯(cuò)誤歸因,所有由 Imagen 3 生成的圖像都包含一個(gè)不可見的數(shù)字SynthID水印,用于識別它們?yōu)?AI 生成的圖像。
了解 Imagen 3 的實(shí)際效果
下方圖庫展示了Imagen 3在多種風(fēng)格圖像上的卓越表現(xiàn)。
開始使用 Gemini API 中的 Imagen 3
此 Python 代碼段展示了如何使用 Gemini API 和 Imagen 3 生成圖像。
fromgoogleimportgenai fromgoogle.genaiimporttypes fromPILimportImage fromioimportBytesIO client = genai.Client(api_key='GEMINI_API_KEY') response = client.models.generate_images( model='imagen-3.0-generate-002', prompt='a portrait of a sheepadoodle wearing cape', config=types.GenerateImagesConfig( number_of_images=1, ) ) forgenerated_imageinresponse.generated_images: image = Image.open(BytesIO(generated_image.image.image_bytes)) image.show()圖像已生成
您可以在 Gemini API 開發(fā)者文檔中探索更多關(guān)于提示技巧和圖像風(fēng)格的內(nèi)容,有關(guān)評分、方法論及性能提升的更多詳情,請參閱我們更新后的技術(shù)報(bào)告附錄 D。
我們非常高興能夠邁出第一步,將我們的生成式媒體模型擴(kuò)展至 Gemini API。我們還計(jì)劃在不久的將來推出更多模型,以便開發(fā)者能夠?qū)⑸墒矫襟w與語言模型結(jié)合起來使用。
-
Google
+關(guān)注
關(guān)注
5文章
1789瀏覽量
59058 -
Gemini
關(guān)注
0文章
68瀏覽量
7925 -
圖像生成
+關(guān)注
關(guān)注
0文章
25瀏覽量
7039
原文標(biāo)題:Gemini API 集成 Imagen 3,帶來更強(qiáng)大的圖像生成功能
文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
Firebase Studio現(xiàn)已集成Gemini 2.5
谷歌新一代生成式AI媒體模型登陸Vertex AI平臺
谷歌Gemini 2.5模型系列更新
谷歌Gemini API最新進(jìn)展
谷歌 Gemini 2.0 Flash 系列 AI 模型上新
谷歌推出Gemini 2.0 Flash體驗(yàn)版
借助谷歌Gemini和Imagen模型生成高質(zhì)量圖像

Google兩款先進(jìn)生成式AI模型登陸Vertex AI平臺
OpenAI暫不推出Sora視頻生成模型API
谷歌正式發(fā)布Gemini 2.0 性能提升近兩倍
谷歌發(fā)布Gemini 2.0 AI模型
在設(shè)備上利用AI Edge Torch生成式API部署自定義大語言模型

評論