百卅天大
您当前的位置:首页 > 世界杯积分榜 > 正文

2026美加墨世界杯中国认证平台 存储"黑科技"之IBM CAS: 单机承载千亿级向量数据库, 龙套 "1% 数据困局", 竣事企业级 RAG 范畴化

来源:未知   作者:admin   时间:2026-05-20 00:41   浏览:117

2026美加墨世界杯中国认证平台 存储"黑科技"之IBM CAS: 单机承载千亿级向量数据库, 龙套 "1% 数据困局", 竣事企业级 RAG 范畴化

北京2026年5月19日--最近,IBM护士院与英伟达(NVIDIA)、三星共同展示了一项本色感知存储系统(contentawarenessstorage)[1]。该系统在单台劳动器上得胜支合手千亿级别向量的存储与检索,平均查询蔓延为694毫秒,调回精度达90%。系统硬件组合为IBMStorageScaleSystem6000全闪存修复、六颗英伟达H200GPU以及48块三星30.72TB容量的PCIeGen5NVMe固态硬盘。IBMStorageScaleSystem6000全闪存修复将盘算推算与存储解耦,并通过英伟达H200GPU加快索引重建,将蓝本基于CPU需耗时数小时的索引构建过程,裁汰至GPU上的数分钟。

龙套“1%数据困局”,让AI走向数据

咱们全部来望望IBM是如何用单机竣事了当今大集群智力竣事的收尾。

今天,大模子版块平均数天便迎来一次更新,RAG(检索增强生成)已成为挖掘非结构化数据价值的中枢。企业CIO多数面对中枢课题:如何借助通用东说念主工智能(AI)与AI智能体竣事日常运营提效?如何依托现存IT资源输出精确、高价值的业务决策?

高质地AI打法的中枢前提,是模子可高效触达原始实在数据,而检索增强生成(RAG)恰是优化推理收尾、普及打法准确性与时效性的要害本事。但是,当向量数据量激增至数十亿级别时,CIO们面对到了传统全内存向量索引决议的容量与资本窘境。飞涨的DRAM价钱、不巩固的货期和数据在CPU与存储间每每搬运形成的"内存墙"与"IO墙"瓶颈,正严重制约着AI应用的范畴化落地,企业在落地过程中多数遭逢四大痛点:

非结构化数据类型絮叨,仅1%数据能被AI有用应用并创造价值;

数据失真与模子幻觉为企业带来合规与决策风险;

RAG历程激励多副本冗余、数据反复传输,资本居高不下;

面向PB级海量数据时,传统架构性能瓶颈突显,难以范畴化落地。

龙套"1%数据困局",让AI走向数据

当下企业被海量非结构化数据包围,PDF、邮件、音视频、演示文稿、财务报表等数据合手续增长,但能被大模子调用并产生价值的占比不及1%。

RAG本事通过数据向量化、优化批量刷新周期、依托GPU集群竣事散布式处理,可龙套数据拜谒适度,让AI隐敝更平常的数据起头。而IBMStorageScale的中枢突破,在于甩掉"数据迁徙至AI"的传统模式,竣事"AI走向数据"的全新范式。好像的说,即是CAS本事成功在存储层作念文档的索乞降向量化(致使集成了NVIDIA的微劳动)竣事了让AI走向数据,即让AI快速定位合规、洁净的可用数据,从泉源抑止模子幻觉风险,这一才略依托IBMCAS本色感知存储(Content-AwareStorage)本事竣事。

AI存储新范式:CAS将向量处理下千里至存储层

CAS的颠覆性改进,是让存储系统从被迫"数据仓库"滚动为主动"AI参与单位"——存储不再仅保存数据,而是对数据项进行量化办法,将蓝本由向量数据库承担的文档向量化历程,从应用层成功下千里至存储层。

IBMCAS

等闲来讲,传统RAG需先将数据从存储取出,在外部完成向量化后导入向量数据库;而CAS可在存储系统里面完周到历程处理,数据无需迁徙、无需拷贝。

该本事源于IBM护士院在当然说话处理、向量镶嵌模子、硬件加快领域的永恒本事积蓄。文档数据索求历程深度整合基于NVIDIANIM构建的NVIDIANeMoRetriever微劳动(从属于NVIDIAAIEnterprise),2026美加墨世界杯中国认证平台确保AI助手与AIAgent基于最新、最干系的潦倒文打法,简化RAG运维、普及AI应用业务价值。

IBMStorageScale(原GPFS)为企业构建全局妥洽数据平台,在多站点、多云、数据中心与边际环境间打造单一定名空间,兼容第三方存储,龙套数据孤岛,竣事全域数据妥洽拜谒。CAS手脚StorageScale的全新AI增强才略,助力企业从现存数据钞票中挖掘更大价值,权贵普及RAG准确性、减少模子幻觉,让AI模子无需重新查考即可同步最新数据,适配科研、客户劳动、常识型应用等企业级场景。

企业级RAG范畴化:龙套性能瓶颈,加码安全合规

市面主流向量数据库撑合手百亿级向量,往往需要数十乃至上百台劳动器,节点范畴蔓延后,散布式索引同步、故障收复、扩容迁徙等问题频发,运维与资本压力稠密。

IBMStorageScaleSystem

IBMStorageScale存储决议竣事单劳动器承载1000亿向量,按企业典型文档场景测算,可全面隐敝PB级至数十PB级非结构化数据,为企业CIO带来四大中枢价值:

基础设施资本指数级下落:无需部署数十乃至上百台向量数据库劳动器;

运维复杂度大幅抑止:单一存储集群即可撑合手全历程RAG需求;

企业级及时性保险:端到端蔓延低至694毫秒,倨傲中枢业求及时条目;

数据安全才略强化:收受原始数据源权限管控体系,聊天机器东说念主打法等滋生数据妥洽苦守安全战略。

底层中枢上风:数据赶快处理、无需迁徙,检索与盘算推算在数据存储位置成功完成,自然契合数据合规与安全管控条目。

单劳动器承载千亿向量的本事底气:中枢依托IBMStorageScaleSystem6000全闪存存储一体机:单节点成就48块NVMe盘,搭载PCIeGen5与400GbInfiniBand高速互联,都集NVIDIAGPUDirectStorage本事,竣事GPU成功拜谒SSD数据,跳过CPU数据搬运行动。

系统将超大范畴索引拆分为多个平稳子索引,各子索引可平稳优化、平稳重建、互不搅扰,透顶惩处传统向量数据库"牵一发而动全身"的重构痛点。

实测数据对比:纯CPU环境下,千亿级向量索引重建需120天;搭载6块NVIDIAH200GPU的IBMStorageScaleSystem6000,仅需4天即可完成。

结语

东说念主工智能期间,存储的扮装被重新界说。IBM给出明确谜底:存储不应成为AI瓶颈,而应是AI基础设施的中枢加快器。

本次决议提供纯软件版与一体机版两种寄托样式,全面兼容RHELAI开源数据活水线,深度集成NVIDIAAIDataPlatform,是可成功落地分娩环境的企业级惩处决议。

以IBMStorageScale为中枢的AI存储决议,正在让PB级企业RAG从本事构思变为执行。RAG的范畴上限,不再受限于向量数目与存储性能,而取决于企业可触达、可应用的数据范畴。

[1]IBMIntroducesContent-Aware-StorageforRAGWorkloads,Storagereview,April22,2026.

IM体育官方网站首页

IBMCorporationlogo.2026美加墨世界杯中国认证平台