一区二区三区三上|欧美在线视频五区|国产午夜无码在线观看视频|亚洲国产裸体网站|无码成年人影视|亚洲AV亚洲AV|成人开心激情五月|欧美性爱内射视频|超碰人人干人人上|一区二区无码三区亚洲人区久久精品

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Redis 8 向量搜索實(shí)測(cè):輕松擴(kuò)展至 10 億向量

虹科技術(shù) ? 來源:虹科技術(shù) ? 作者:虹科技術(shù) ? 2025-05-13 14:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

面對(duì)生成式 AI 帶來的超大規(guī)模向量需求,Redis 8 向量搜索實(shí)測(cè)輕松支持 10 億向量,依舊保持低延遲與高吞吐表現(xiàn)。本篇文章詳細(xì)介紹了 Redis 如何通過 HNSW 算法擴(kuò)展至十億級(jí)別,并提供完整測(cè)試配置與性能數(shù)據(jù)。無論是 AI 檢索、推薦系統(tǒng)還是多模態(tài)生成應(yīng)用,Redis 8 都是你構(gòu)建高效向量服務(wù)的可靠選擇。

隨著越來越多的公司把生成式人工智能(GenAI)應(yīng)用投入生產(chǎn),我們看到客戶對(duì)更大向量數(shù)據(jù)庫(kù)的需求不斷增長(zhǎng)。我們發(fā)現(xiàn)了一些需要 10 億個(gè)或更多向量的使用場(chǎng)景,很高興能分享我們?cè)谶@一規(guī)模上的基準(zhǔn)測(cè)試結(jié)果。

在測(cè)試中,我們?cè)谥形谎舆t為 200 毫秒的情況下達(dá)到了 90% 的精確度,而在處理 50 個(gè)并發(fā)搜索請(qǐng)求時(shí),對(duì)于前 100 個(gè)最近鄰(nearest neighbors),在中位延遲為 1.3 秒的情況下達(dá)到了 95% 的精確度。

將向量搜索擴(kuò)展到 10 億個(gè)向量并非易事,但 Redis 8 的發(fā)布讓這一過程顯得輕松。今天,我們將通過展示 Redis 在實(shí)時(shí)搜索 10 億個(gè) 768 維向量時(shí)的處理能力,來說明它如何應(yīng)對(duì)大規(guī)模應(yīng)用程序。我們嚴(yán)格測(cè)試了索引與搜索的性能,證明了 Redis 不僅是最快的向量數(shù)據(jù)庫(kù),還能從數(shù)百萬個(gè)向量擴(kuò)展到數(shù)十億個(gè)向量,仍然提供極低的延遲。請(qǐng)查看下面的詳細(xì)信息。

測(cè)試配置詳解

我們使用了一個(gè)與 Intel? 合作準(zhǔn)備的向量數(shù)據(jù)集,該數(shù)據(jù)集包含 10 億個(gè) 768 維向量,采用 FLOAT16 精度和 10K 查詢,每個(gè)查詢有 100 個(gè)真實(shí)值(精確鄰居,exact neighbors)。該數(shù)據(jù)集源自LAION-5B 數(shù)據(jù)集,這是一個(gè)用于訓(xùn)練下一代圖生文模型(如 Stable Diffusion 和 OpenClip)的大規(guī)模數(shù)據(jù)集。

向量索引使用了歐幾里得距離度量和 FLOAT16 精度,并且在查詢時(shí)通過調(diào)整以下參數(shù)來實(shí)現(xiàn)不同的精確度:

EF_CONSTRUCTION(在索引創(chuàng)建時(shí)設(shè)置):在構(gòu)建圖時(shí),圖中每個(gè)節(jié)點(diǎn)允許的最大潛在出邊(potential outgoing edges candidates)候選數(shù)量。

M(在索引創(chuàng)建時(shí)設(shè)置):在圖的每一層中,每個(gè)節(jié)點(diǎn)允許的最大出邊數(shù)量。在第零層,最大出邊數(shù)量將是 2M。

EF_RUNTIME(在查詢時(shí)可變):在 KNN 搜索期間要保留的最大頂級(jí)候選數(shù)量(maximum top candidates)。更高的 EF_RUNTIME 值將導(dǎo)致更準(zhǔn)確的結(jié)果,但也會(huì)增加運(yùn)行時(shí)間。

使用數(shù)據(jù)集的 100 個(gè)最近鄰的真實(shí)值來評(píng)估每個(gè)回復(fù)的準(zhǔn)確性(召回率),并且我們對(duì) M 在 4、8、16 和 32 個(gè)出邊之間,EF_CONSTRUCTION 在 4、8、16 和 32 之間,以及 EF_RUNTIME 在 4、8、16、32、64、128、256、512、1024、2048、4096 和 8192 之間進(jìn)行了調(diào)整。為確保結(jié)果可重現(xiàn),每個(gè)配置都運(yùn)行了 3 次,選擇了最好的結(jié)果。

Redis 8 Community Edition 十億規(guī)模基準(zhǔn)測(cè)試

數(shù)據(jù)集:laion-img-emb-768-1G-cosine

客戶端數(shù)量:501

繪制值:每秒請(qǐng)求數(shù)(RPS)| 平均延遲(秒)| 95百分位延遲(秒)| 索引時(shí)間(秒)

wKgZPGgi33-AD4ciAADd27A_1j8775.png

在我們之前的向量數(shù)據(jù)庫(kù)基準(zhǔn)測(cè)試博客中,我們專注于證明 Redis 是最快的向量數(shù)據(jù)庫(kù)?,F(xiàn)在我們證明,對(duì)于需要保持實(shí)時(shí)性延遲的使用場(chǎng)景,我們不僅是最快的向量數(shù)據(jù)庫(kù),我們還可以將向量數(shù)量從數(shù)百萬擴(kuò)展到數(shù)十億。

測(cè)試結(jié)果

在十億向量規(guī)模下,使用實(shí)時(shí)索引,Redis 8 社區(qū)版可以維持每秒 66K 向量插入,對(duì)于允許至少 95% 精確度(M 16 和 EF_CONSTRUCTION 32)的索引配置。對(duì)于導(dǎo)致較低精確度(M 4 和 EF_CONSTRUCTION 4)的索引配置,Redis 8 社區(qū)版可以支持高達(dá)每秒 160K 向量插入的速率。通過使用更多服務(wù)器可以進(jìn)一步增加吞吐量。

對(duì)于高精確度查詢,我們可以看到更大的 HNSW 索引(更高的 M 和 EF_CONSTRUCT)會(huì)提高搜索質(zhì)量,但會(huì)增加延遲。在處理 50 個(gè)并發(fā)搜索請(qǐng)求時(shí),我們?cè)谥形谎舆t(包括往返時(shí)間)為 200 毫秒的情況下達(dá)到 90% 精確度,而在中位延遲(包括往返時(shí)間)為 1.3 秒的情況下達(dá)到 95% 精確度。

由于所需的精確度和延遲權(quán)衡因使用場(chǎng)景而異,因此根據(jù)上面的圖表調(diào)整 HNSW 參數(shù)非常重要。

Redis 8 證明了實(shí)時(shí)向量搜索不僅適用于數(shù)百萬個(gè)向量,還能擴(kuò)展到數(shù)十億個(gè)向量,同時(shí)保持高性能。通過正確的 HNSW 調(diào)優(yōu),你可以在精確度、延遲和吞吐量之間取得平衡,以適應(yīng)你的使用場(chǎng)景,實(shí)現(xiàn)高達(dá) 95% 的召回率和實(shí)時(shí)查詢。無論你是在構(gòu)建人工智能驅(qū)動(dòng)的搜索、推薦引擎還是任何基于向量的應(yīng)用程序,Redis 都能為你提供所需的快速、可擴(kuò)展性能。

Redis

艾體寶是Redis企業(yè)版數(shù)據(jù)庫(kù)的中國(guó)區(qū)戰(zhàn)略合作伙伴,持續(xù)關(guān)注各行業(yè)當(dāng)下急切需求,專注于為企業(yè)解答疑問,制定專屬服務(wù),提供一站式解決方案,艾體寶提供的Redis企業(yè)版數(shù)據(jù)庫(kù)是無數(shù)企業(yè)數(shù)據(jù)安全保護(hù)路上的最佳合作選擇!為企業(yè)的數(shù)據(jù)安全保駕護(hù)航!

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    34765

    瀏覽量

    276905
  • 人工智能
    +關(guān)注

    關(guān)注

    1805

    文章

    48898

    瀏覽量

    247827
  • Redis
    +關(guān)注

    關(guān)注

    0

    文章

    385

    瀏覽量

    11378
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    RISC-V架構(gòu)下的編譯器自動(dòng)向量

    進(jìn)迭時(shí)空專注于研發(fā)基于RISC-V的高性能新AICPU,對(duì)于充分發(fā)揮CPU核的性能而言,編譯器是不可或缺的一環(huán),而在AI時(shí)代,毫無疑問向量算力將發(fā)揮越來越重要的作用。進(jìn)迭時(shí)空非常重視RISC-V
    的頭像 發(fā)表于 06-06 16:59 ?255次閱讀
    RISC-V架構(gòu)下的編譯器自動(dòng)<b class='flag-5'>向量</b>化

    redis三種集群方案詳解

    Redis中提供的集群方案總共有三種(一般一個(gè)redis節(jié)點(diǎn)不超過10G內(nèi)存)。
    的頭像 發(fā)表于 03-31 10:46 ?639次閱讀
    <b class='flag-5'>redis</b>三種集群方案詳解

    《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》閱讀心得3——RAG架構(gòu)與部署本地知識(shí)庫(kù)

    。RAG技術(shù)建立在向量數(shù)據(jù)庫(kù)的基礎(chǔ)上,通過高維向量空間中的相似度計(jì)算來實(shí)現(xiàn)語(yǔ)義層面的匹配,這比傳統(tǒng)的關(guān)鍵詞搜索更能捕捉文本的深層語(yǔ)義關(guān)聯(lián)。 第七章通過一個(gè)本地知識(shí)庫(kù)的搭建案例展示了RAG技術(shù)的工程實(shí)踐。在
    發(fā)表于 03-07 19:49

    百度搜索,能否將DeepSeek變成“內(nèi)功”?

    實(shí)測(cè)之后,會(huì)發(fā)現(xiàn)百度搜索和DeepSeek稱得上“王炸組合”
    的頭像 發(fā)表于 02-21 10:04 ?2300次閱讀
    百度<b class='flag-5'>搜索</b>,能否將DeepSeek變成“內(nèi)功”?

    Redis實(shí)戰(zhàn)筆記

    在目前的技術(shù)選型中,Redis 儼然已經(jīng)成為了系統(tǒng)高性能緩存方案的事實(shí)標(biāo)準(zhǔn),因此現(xiàn)在?Redis 也成為了后端開發(fā)的基本技能樹之一。 ? 基于上述情況,今天給大家分享一份?杰哥?親筆撰寫的內(nèi)部
    的頭像 發(fā)表于 02-09 09:12 ?354次閱讀
    <b class='flag-5'>Redis</b>實(shí)戰(zhàn)筆記

    Redis Cluster之故障轉(zhuǎn)移

    1. Redis Cluster 簡(jiǎn)介 Redis Cluster 是 Redis 官方提供的 Redis 集群功能。 為什么要實(shí)現(xiàn) Redis
    的頭像 發(fā)表于 01-20 09:21 ?839次閱讀
    <b class='flag-5'>Redis</b> Cluster之故障轉(zhuǎn)移

    RK3576有多強(qiáng)?實(shí)測(cè)三屏八攝像頭輕松搞定

    的MYD-LR3576開發(fā)板開發(fā)了一個(gè)三屏異顯,8路攝像頭輸入的DEMO,實(shí)測(cè)下來,RK3576輕松搞定了該任務(wù)。MYD-LR3576開發(fā)板是基于RK3576設(shè)計(jì)的一款
    的頭像 發(fā)表于 01-16 08:06 ?588次閱讀
    RK3576有多強(qiáng)?<b class='flag-5'>實(shí)測(cè)</b>三屏八攝像頭<b class='flag-5'>輕松</b>搞定

    華為云 Flexus X 輕松實(shí)現(xiàn) Redis 一主多從高效部署

    前言 ????????華為云 Flexus?X 是一款專為高性能計(jì)算設(shè)計(jì)的云服務(wù)器實(shí)例,其搭載的 X-Turbo 加速技術(shù)和智能應(yīng)用調(diào)優(yōu)算法,能夠大幅提升 Redis 的處理能力和響應(yīng)速度。此外
    的頭像 發(fā)表于 12-27 13:45 ?472次閱讀
    華為云 Flexus X <b class='flag-5'>輕松</b>實(shí)現(xiàn) <b class='flag-5'>Redis</b> 一主多從高效部署

    希姆計(jì)算的RISC-V矩陣擴(kuò)展開源項(xiàng)目已升級(jí)0.5版本,支持向量+矩陣的實(shí)現(xiàn)

    希姆計(jì)算的RISC-V矩陣擴(kuò)展開源項(xiàng)目已升級(jí)0.5版本-----支持向量+矩陣的實(shí)現(xiàn)范福杰博士&陳煒博士項(xiàng)目背景Background為了解決RISC-V在人工智能領(lǐng)域中指令碎片化
    的頭像 發(fā)表于 11-12 01:08 ?2596次閱讀
    希姆計(jì)算的RISC-V矩陣<b class='flag-5'>擴(kuò)展</b>開源項(xiàng)目已升級(jí)<b class='flag-5'>至</b>0.5版本,支持<b class='flag-5'>向量</b>+矩陣的實(shí)現(xiàn)

    AI搜索創(chuàng)企Perplexity擬融資5美元

    近日,據(jù)路透社消息透露,人工智能搜索領(lǐng)域的初創(chuàng)企業(yè)Perplexity即將迎來新一輪的重大融資。據(jù)悉,該公司計(jì)劃在新一輪融資中籌集高達(dá)5美元的資金,這一舉措有望使其整體估值飆升至90美元的高位
    的頭像 發(fā)表于 11-10 11:20 ?724次閱讀

    淺談RISC-C C Intrinsic的發(fā)展情況

    Intrinsic 特別適用于向量擴(kuò)展(RVV),這是因?yàn)镽VV提供了對(duì)數(shù)據(jù)并行處理的原生支持。 ## RISC-V C Intrinsic 標(biāo)準(zhǔn) RISC-V C Intrinsic 的標(biāo)準(zhǔn)由
    發(fā)表于 10-16 16:55

    科技云報(bào)到:大模型時(shí)代下,向量數(shù)據(jù)庫(kù)的野望

    科技云報(bào)到:大模型時(shí)代下,向量數(shù)據(jù)庫(kù)的野望
    的頭像 發(fā)表于 10-14 17:18 ?506次閱讀

    IC測(cè)試基本原理與ATE測(cè)試向量生成

    ,研究和發(fā)展IC測(cè)試,有著重要的意義。而測(cè)試向量作為IC測(cè)試中的重要部分,研究其生成方法也日漸重要。1IC測(cè)試1.1IC測(cè)試原理IC測(cè)試是指依據(jù)被測(cè)器件(DUT)特點(diǎn)
    的頭像 發(fā)表于 10-12 08:03 ?2349次閱讀
    IC測(cè)試基本原理與ATE測(cè)試<b class='flag-5'>向量</b>生成

    TMS320C6701如何自己更改中斷向量的入口地址?

    TMS320C6701如何自己更改中斷向量的入口地址?有沒有C6701外設(shè)中斷的參考程序?或者對(duì)C6701有像Controlsuit一樣的參考軟件
    發(fā)表于 08-09 06:49

    K8S學(xué)習(xí)教程(二):在 PetaExpress KubeSphere容器平臺(tái)部署高可用 Redis 集群

    并且需要手動(dòng)重啟節(jié)點(diǎn),相較之下,使用 PetaExpress 提供的 Kubernetes(k8s) 服務(wù) 進(jìn)行 Redis 集群的部署,則展現(xiàn)出了顯著的優(yōu)勢(shì): 1、安裝便捷:使用鏡像或者 yaml 配置文件即可一件安裝,極大地簡(jiǎn)化了安裝流程 2、縮擴(kuò)容方便:在 擴(kuò)容 、
    的頭像 發(fā)表于 07-03 15:30 ?1194次閱讀
    K<b class='flag-5'>8</b>S學(xué)習(xí)教程(二):在 PetaExpress KubeSphere容器平臺(tái)部署高可用 <b class='flag-5'>Redis</b> 集群