谷歌云最近在 Cloud SQL for PostgreSQL 和 AlloyDB for PostgreSQL 中增加了對 pgvector 的支持。這個擴(kuò)展為托管數(shù)據(jù)庫帶來了向量搜索操作,允許開發(fā)人員存儲大型語言模型(LLM)生成的向量嵌入并執(zhí)行相似性搜索。
Cloud SQL 和 AlloyDB 現(xiàn)在可以與 Vertex AI 上的生成性 AI 服務(wù)配對,幫助創(chuàng)建能夠感知應(yīng)用程序和用戶狀態(tài)的 AI 應(yīng)用程序。谷歌高級產(chǎn)品經(jīng)理 Sandhya Ghai 和產(chǎn)品經(jīng)理 Bala Narasimhan 解釋說:
向量嵌入是一種數(shù)值表示,通常用于將復(fù)雜的用戶生成內(nèi)容(如文本、音頻和視頻)轉(zhuǎn)換為易于存儲、操作和索引的形式。這些表示由嵌入模型生成,如果兩個內(nèi)容在語義上相似,它們各自的嵌入就會在嵌入向量空間中彼此相鄰。然后,向量嵌入會被索引,被用于基于相似性進(jìn)行有效的數(shù)據(jù)過濾。
例如,開發(fā)人員可以使用 Vertex AI 的預(yù)訓(xùn)練模型在文本和圖像之間生成嵌入,并將它們存儲并索引到數(shù)據(jù)庫中,簡化查找相似記錄的過程。
用戶現(xiàn)在可以使用 CREATE EXTENSION 命令在現(xiàn)有的數(shù)據(jù)庫中安裝 pgvector 擴(kuò)展:
postgres=> CREATE EXTENSION IF NOT EXISTS vector;
CREATE EXTENSION
postgres=> CREATE TABLE embeddings(
id INTEGER,
embedding vector(3)
);
CREATE TABLE
postgres=> INSERT INTO embeddings
VALUES
(1, '[1, 0, -1]'),
(2, '[1, 1, 1]'),
(3, '[1, 1, 50]');
INSERT03
正如 Ghai 和 Narasimhan 所解釋的那樣,這一新功能還可以幫助開發(fā)人員利用預(yù)訓(xùn)練的 LLM:
我們需要了解的是,LLM 沒有狀態(tài)的概念……嵌入允許你將大型上下文(如文檔或歷史聊天記錄)存儲在數(shù)據(jù)庫中,并過濾它們,以便查找最相關(guān)的信息。然后,你可以將最相關(guān)的聊天歷史記錄或文檔片段輸入模型來模擬長期記憶和業(yè)務(wù)特定知識。
谷歌云發(fā)布了一個 Colab Notebook 和一個視頻,用 pgvector、開源框架 LangChain 和 LLM 構(gòu)建 AI 驅(qū)動的應(yīng)用程序。谷歌高級軟件工程師 Saket Saurabh 演示了如何在示例 Python 應(yīng)用程序中添加生成式 AI 功能,他寫道:
pgvector 擴(kuò)展還引入了用于對向量執(zhí)行相似性匹配的新運算符,你可以用它查找語義上相似的向量。這樣的運算符有兩個:
‘<->’:返回兩個向量之間的歐幾里得距離…… ‘<=>’:返回兩個向量之間的余弦距離
在過去的幾個月中,谷歌云并不是唯一一個瞄準(zhǔn)向量數(shù)據(jù)庫的云供應(yīng)商,Amazon RDS for PostgreSQL 也支持 pgvector 擴(kuò)展,微軟還展示了如何將 Azure Data Explorer(ADX)作為向量數(shù)據(jù)庫,并討論了幾種連接到向量數(shù)據(jù)庫的連接器。
-
連接器
+關(guān)注
關(guān)注
99文章
15390瀏覽量
140522 -
AI
+關(guān)注
關(guān)注
88文章
35164瀏覽量
279904 -
數(shù)據(jù)庫
+關(guān)注
關(guān)注
7文章
3927瀏覽量
66223
原文標(biāo)題:增強(qiáng)AI能力:谷歌云在托管數(shù)據(jù)庫中集成向量搜索
文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
milvus向量數(shù)據(jù)庫的主要特性和應(yīng)用場景

HarmonyOS5云服務(wù)技術(shù)分享--云數(shù)據(jù)庫使用指南
《AI Agent 應(yīng)用與項目實戰(zhàn)》閱讀心得3——RAG架構(gòu)與部署本地知識庫
聚云科技獲亞馬遜云科技生成式AI能力認(rèn)證
聚云科技榮獲亞馬遜云科技生成式AI能力認(rèn)證
分布式云化數(shù)據(jù)庫有哪些類型
云數(shù)據(jù)庫是哪種數(shù)據(jù)庫類型?
一般企業(yè)購買云服務(wù)器帶數(shù)據(jù)庫嗎?
華為云榮登Gartner?云數(shù)據(jù)庫挑戰(zhàn)者象限
云托管可以操作云數(shù)據(jù)庫嗎?安全性如何
云數(shù)據(jù)庫和云主機(jī)哪個好一點?
數(shù)據(jù)庫數(shù)據(jù)恢復(fù)—通過拼接數(shù)據(jù)庫碎片恢復(fù)SQLserver數(shù)據(jù)庫

評論