了解 seekdb
OceanBase seekdb(简称 seekdb)是一款 AI 原生混合搜索数据库,在一个数据库中融合向量、文本、结构化与半结构化数据能力,并通过内置 AI Functions 支持多模混合搜索与智能推理。
能力矩阵
| 功能 | OceanBase seekdb | OceanBase 数据库 | MySQL 9.0 | Chroma | Elasticsearch | DuckDB | Milvus | PostgreSQL 和 pgvector |
|---|---|---|---|---|---|---|---|---|
| 嵌入式数据库 | 支持 | 不支持 | 不支持 (8.0 版本中移除了) | 支持 | 不支持 | 支持 | 支持 | 不支持 |
| 单机数据库 | 支持 | 支持 | 支持 | 支持 | 支持 | 支持 | 支持 | 支持 |
| 分布式数据库 | 不支持 | 支持 | 不支持 | 不支持 | 支持 | 不支持 | 支持 | 不支持 |
| MySQL 兼容 | 支持 | 支持 | 支持 | 不支持 | 不支持 | 支持 | 不支持 | 不支持 |
| 向量搜索 | 支持 | 支持 | 不支持 | 支持 | 支持 | 支持 | 支持 | 支持 |
| 全文搜索 | 支持 | 支持 | 支持 | 不支持 | 支持 | 支持 | 部分支持 | 支持 |
| 混合搜索 | 支持 | 支持 | 不支持 | 不支持 | 支持 | 不支持 | 支持 | 部分支持 |
| OLTP | 支持 | 支持 | 支持 | 不支持 | 不支持 | 不支持 | 不支持 | 支持 |
| OLAP | 支持 | 支持 | 不支持 | 不支持 | 部分支持 | 支持 | 不支持 | 支持 |
| 开源协议 | Apache 2.0 | MulanPubL 2.0 | GPL 2.0 | Apache 2.0 | AGPLv3 + SSPLv1 + Elastic 2.0 | MIT | Apache 2.0 | PostgreSQL License |
产品架构

-
部署模式:支持嵌入式和服务器两种部署模式。嵌入式模式下可将 seekdb 直接集成进 Python 应用,便于进行个人开发。
-
多模数据与索引层:支持向量、文本、JSON、GIS 等多模数据类型,并提供高效的索引支持。包括 HNSW/IVF 向量索引及索引量化算法,覆盖多种分词器和查询模式的基于 BM25 相关性计算的全文索引,适用于混合搜索的混合索引,适用于元数据搜索的 JSON 索引,除此之外还支持主键和二级索引、GIS 索引等。
-
支持混合负载的多模计算层:支持向量、全文、标量等条件的混合搜索,提升 RAG 场景查询结果的准确性。提供 AI Function 功能,以支撑数据库内的实时推理。支持完整的 ACID 事务特性及基于 MVCC 的多版本并发访问能力,提供适用于混合负载的查询优化器、自适应执行的高效执行引擎及灵活的 PL UDF 功能,更好地满足多样的业务需求。
-
统一应用接口:兼容 MySQL 原生驱动,提供基于 SQL 的支持多模数据的统一查询语言。并在此基础上实现了面向开发者更加友好的向量库/混搜 SDK。同时适配近 30 种应用开发框架,也包含 LangChain、LlamaIndex、Dify 等 AI 应 用开发框架。提供 MCP Server,无缝接入 AI 生态。
核心优势
-
快速构建
数行 Python 代码即可构建 AI 应用,轻量架构在 1C2G 上即可跑 VectorDBBench。
-
混合搜索
向量、全文与标量过滤在一次查询中完成,支持粗排 + 精排的多阶段搜索链路。
-
多模数据与索引
在一个引擎内同时支持标量、向量、文本、JSON、GIS 等多模数据及索引。
-
AI 内置
在数据库内完成向量嵌入、推理、提示词管理与重排,支持 document-in/data-out 的完整 RAG 流程。
-
SQL 原生
源于成熟的 OceanBase 引擎,支持实时写入、实时可查, ACID 事务保证,兼容 MySQL 生态。
AI Native
从搜索到推理,全栈赋能 AI 应用开发。
混合搜索
- 一条 SQL 查询中支持基于向量的语义召回和基于关键字的召回,优化的多路召回
- 查询重排序支持权重、RRF,也支持基于大模型的重排序
- 支持标量过滤下压存储的优化,还可以使用多表关联搜索相关数据
向量&全文搜索
- 支持稠密向量、稀疏向量,支持曼哈顿距离、欧式距离、内积、余弦距离等多种类型向量距离的计算
- 向量索引支持基于内存的 HNSW、HNSW-SQ、HNSW-BQ 和基于磁盘的 IVF、IVF-PQ 等索引类型,优化向量存储成本
- 全文搜索支持关键字、短语及布尔表达式等多种匹配模式,支持 BM25 排序
AI 函数
DBMS_AI_SERVICE包用 SQL 对内置大模型服务进行管理,并支持注册外部大模型服务- 通过
AI_EMBED函数在 SQL 中把文本转换为向量嵌入 - 通过
AI_COMPLETE函数在 SQL 中执行文本生成,支持用提示词模板化复用 - 通过
AI_RERANK函数在 SQL 中使用重排序大模型对文本进行排序
适用场景
RAG 与知识检索增强
大型模型受限于训练数据,RAG 为其引入实时、准确的外部知识源,以提升回答质量并降低幻觉。seekdb 通过向量搜索、全文搜索、混合搜索、内置 AI 函数与高效索引实现高精 度搜索,并以多级权限管控保证多源知识库的隐私安全。
适用场景:
- 企业知识库问答
- 智能客服响应
- 行业信息检索
- 个人知识助手
AI 辅助编程
面向 AI 辅助编程场景,seekdb 支持对代码仓库构建向量和全文索引,基于代码关键词或代码语义,进行高效的代码搜索和生成补全。其次,seekdb 提供了高效的数据组织能力,支持代码片段的结构化存储(如语法树、依赖关系图谱)与非结构化存储(如原始代码文本),并通过动态元数据管理实现对代码属性(如语言类型、函数名、参数列表)的灵活扩展与高效查询。
语义搜索引擎
传统搜索依赖关键词匹配,难以理解真实意图。语义搜索基于嵌入和向量搜索技术理解查询语义,并支持文本、图像等多模态关联。seekdb 的混合搜索与多模型查询让搜索更准确、更智能。
适用场景:
- 商品搜索与推荐
- 以文搜图
- 以图搜商品
Agentic 智能体应用
Agentic AI 具备主动决策、任务规划和环境感知能力。seekdb 为智能体应用提供元数据管理、记忆体存储、多模型数据查询、多模态数据加工、检索增强生成、内置 AI 函数和推理、数据隐私管控等一站式解决方案。
适用场景:
- 个人生活助手
- 企业运营自动化
- 行业垂直智能体
- 智能体开发平台
AI 驱动的智能编程
AI 编程利用自然语言理解与代码语义分析,实现代码生成、智能补全、缺陷修复、测试用例编写、代码重构等功能。seekdb 用语义搜索提升代码生成质量,以多模型存储管理代码与文档,通过多级隔离与闪回查询支持多项目与版本管理,适配本地与云端开发。
适用场景:
- IDE 编码插件
- 设计稿生成网页
- 本地智能 IDE
- Web 在线 IDE
企业应用 AI 化升级
AI 将企业应用从“被动执行”升级为“主动协作”。seekdb 在提供 AI 应用存储方案的同时,也高度兼容 MySQL 语法和视图,并通过并行执行和行存列存混合存储技术提供高性能的混合负载处理,使传统系统无需大规模迁移即可获得 AI 化能力,覆盖办公、流程、经营等全场景智能化。
适用场景:
- 文档智能处理
- 经营分析洞察
- 财务管理系统
端设备智能化与边缘 AI
手机、车机、工业网关等端设备相对于数据中心和云端的服务器,端设备采用低功耗处理器和小容量存储。seekdb 通过轻量架构支持嵌入式或轻量服务器模式,在低资源占用下提供完整的 SQL 能力、JSON、混合搜索等能力,与 OceanBase 云端服务无缝协同,构建端云一体的智能系统。
适用场景:
- 个人智能助理
- 智能车载终端
- AI 教育辅导
- AI 陪伴机器人
- 智慧医疗终端