V1.0.0
版本信息
-
发布时间:2025 年 11 月 14 日
-
版本号:V1.0.0
-
RPM 版本号:seekdb-1.0.0.0-100000262025111218
版本概览
OceanBase seekdb(简称 seekdb)是一款 AI 原生混合搜索数据库,在一个数据库中融合向量、文本、结构化与半结构化数据能力,并通过内置 AI Functions 支持多模混合搜索与智能推理。
产品架构

-
部署模式:支持嵌入式和服务器两种部署模式。嵌入式模式下可将 seekdb 直接集成进 Python 应用,便于进行个人开发。
-
多模数据与索引层:支持向量、文本、JSON、GIS 等多模数据类型,并提供高效的索引支持。包括 HNSW/IVF 向量索引及索引量化算法,覆盖多种分词器和查询模式的基于 BM25 相关性计算的全文索引,适用于混合搜索的混合索引,适用于元数据搜索的 JSON 索引,除此之外还支持主键和二级索引、GIS 索 引等。
-
支持混合负载的多模计算层:支持向量、全文、标量等条件的混合搜索,提升 RAG 场景查询结果的准确性。提供 AI Function 功能,以支撑数据库内的实时推理。支持完整的 ACID 事务特性及基于 MVCC 的多版本并发访问能力,提供适用于混合负载的查询优化器、自适应执行的高效执行引擎及灵活的 PL UDF 功能,更好地满足多样的业务需求。
-
统一应用接口:兼容 MySQL 原生驱动,提供基于 SQL 的支持多模数据的统一查询语言。并在此基础上实现了面向开发者更加友好的向量库/混搜 SDK。同时适配近 30 种应用开发框架,也包含 LangChain、LlamaIndex、Dify 等 AI 应用开发框架。提供 MCP Server,无缝接入 AI 生态。
核心优势
-
快速构建
数行 Python 代码即可构建 AI 应用,轻量架构在 1C2G 上即可跑 VectorDBBench。
-
混合搜索
向量、全文与标量过滤在一次查询中完成,支持粗排 + 精排的多阶段搜索链路。
-
多模数据与索引
在一个引擎内同时支持标量、向量、文本、JSON、GIS 等多模数据及索引。
-
AI 内置
在数据库内完成向量嵌入、推理、提示词管理与重排,支持 document-in/data-out 的完整 RAG 流程。
-
SQL 原生
源于成熟的 OceanBase 引擎,支持实时写入、实时可查, ACID 事务保证,兼容 MySQL 生态。
AI Native
从搜索到推理,全栈赋能 AI 应用开发。
混合搜索
- 一条 SQL 查询中支持基于向量的语义召回和基于关键字的召回,优化的多路召回
- 查询重排序支持权重、RRF,也支持基于大模型的重排序
- 支持标量过滤下压存储的优化,还可以使用多表关联搜索相关数据
向量&全文搜索
- 支持稠密向量、稀疏向量,支持曼哈顿距离、欧式距离、内积、余弦距离等多种类型向量距离的计算
- 向量索引支持基于内存的 HNSW、HNSW-SQ、HNSW-BQ 和基于磁盘的 IVF、IVF-PQ 等索引类型,优化向量存储成本
- 全文搜索支持关键字、短语及布尔表达式等多种匹配模式,支持 BM25 排序
AI 函数
DBMS_AI_SERVICE包用 SQL 对内置大模型服务进行管理,并支持注册外部大模型服务- 通过
AI_EMBED函数在 SQL 中把文本转换为向量嵌入 - 通过
AI_COMPLETE函数在 SQL 中执行文本生成,支持用提示词模板化复用 - 通过
AI_RERANK函数在 SQL 中使用重排序大模型对 文本进行排序
适用场景
RAG 与知识检索增强
大型模型受限于训练数据,RAG 为其引入实时、准确的外部知识源,以提升回答质量并降低幻觉。seekdb 通过向量搜索、全文搜索、混合搜索、内置 AI 函数与高效索引实现高精度搜索,并以多级权限管控保证多源知识库的隐私安全。
适用场景:
- 企业知识库问答
- 智能客服响应
- 行业信息检索
- 个人知识助手
AI 辅助编程
面向 AI 辅助编程场景,seekdb 支持对代码仓库构建向量和全文索引,基于代码关键词或代码语义,进行高效的代码搜索和生成补全。其次,seekdb 提供了高效的数据组织能力,支持代码片段的结构化存储(如语法树、依赖关系图谱)与非结构化存储(如原始代码文本),并通过动态元数据管理实现对代码属性(如语言类型、函数名、参数列表)的灵活扩展与高效查询。
语义搜索引擎
传统搜索依赖关键词匹配,难以理解真实意图。语义搜索基于嵌入和向量搜索技术理解查询语义,并支持文本、图像等多模态关联。seekdb 的混合搜索与多模型查询让搜索更准确、更智能。
适用场景:
- 商品搜索与推荐
- 以文搜图
- 以图搜商品
Agentic 智能体应用
Agentic AI 具备主动决策、任务规划和环境感知能力。seekdb 为智能体应用提供元数据管理、记忆体存储、多模型数据查询、多模态数据加工、检索增强生成、内置 AI 函数和推理、数据隐私管控等一站式解决方案。
适用场景:
- 个人生活助手
- 企业运营自动化
- 行业垂直智能体
- 智能体开发平台
AI 驱动的智能编程
AI 编程利用自然语言理解与代码语义分析,实现代码生成、智能补全、缺陷修复、测试用例编写、代码重构等功能。seekdb 用语义搜索提升代码生成质量,以多模型存储管理代码与文档,通过多级隔离与闪回查询支持多项目与版本管理,适配本地与云端开发。
适用场景:
- IDE 编码插件
- 设计稿生成网页
- 本地智能 IDE
- Web 在线 IDE