/ 中存储网

腾讯云正式发布AI原生(AI Native)向量数据库Tencent Cloud VectorDB

2023-07-04 12:08:05 来源:中存储

7月4日,腾讯云正式发布AI原生(AI Native)向量数据库Tencent Cloud VectorDB,预计 8 月上线腾讯云官网。

该数据库能够被广泛应用于大模型的训练、推理和知识库补充等场景。腾讯方面表示,它是国内首个从接入层、计算层、到存储层提供全生命周期AI化的向量数据库。

根据官方公开的数据信息,腾讯云向量数据库最高支持10亿级向量检索规模,延迟控制在毫秒级;它相比传统单机插件式数据库检索规模提升10倍,同时具备百万级每秒查询(QPS)的峰值能力。

“如果你看好AI大模型,就应该看好向量数据库”,腾讯云数据库副总经理罗云表示,随着大模型的不断发展和普及,AI Native向量数据库将成为企业数据处理的标配。

据悉,该数据库面向大模型训练,让企业原先花一个月时间才能完成的大模型接入,缩短到三天时间。

腾讯云数据库副总经理罗云指出,向量数据库已经在QQ浏览器、腾讯视频、腾讯游戏、QQ音乐、搜狗输入法等30+业务场景中应用,并自研了分布式向量数据库核心引擎Olama,原名ElasticFaiss。

向量数据库源自腾讯集团每日处理千亿次检索的向量引擎(OLAMA),单索引支持10亿级向量规模,更适用于AI运算、检索,数据接入AI的效率也比传统方案提升10倍。

此外,腾讯云在6月19日首次公布了其行业大模型研发进展,依托腾讯云TI平台打造行业大模型精选商店,为客户提供MaaS(Model-as-a-Service)一站式服务。

今年4月,腾讯云发布了专为大模型训练设计的新一代HCC高性能计算集群,采用最新一代的腾讯云星星海自研服务器,具备业界最高的3.2Tbps互联带宽,算力性能提升3倍。

在具体落地应用层面,腾讯方面表示,该向量数据库基于腾讯每日处理千亿次检索的向量引擎(OLAMA),数据接入AI的效率比传统方案提升10倍,运行稳定性达到99.99%,目前已经应用在腾讯视频、QQ浏览器、QQ音乐等30多款腾讯内部产品之中。

以腾讯视频的应用为例,视频库中的图片、音频、标题文本等内容使用腾讯云向量数据库,月均完成的检索和计算量高达200亿次,能够满足版权保护、原创识别、相似性检索等场景需求。

从使用结果来看,向量数据库能直接提升运营效率。官方信息显示,使用腾讯云向量数据库后,QQ音乐人均听歌时长提升3.2%、腾讯视频有效曝光人均时长提升1.74%、QQ浏览器成本降低了37.9%。

什么是向量数据库Vector Database ?一文理解向量数据库工作机制和原理