跳到主要内容

让 Cursor AI 助手秒懂 seekdb

在 AI 辅助编程时代,开发者越来越依赖智能工具来提升编码效率。然而,当你在 Cursor 中询问 seekdb 相关问题时,AI 可能无法给出准确的回答,因为它不了解 seekdb 这款新兴的 AI 原生搜索数据库。

本文以使用 AI 助手创建一个 seekdb 混合搜索应用为例,介绍如何通过 seekdb Cursor Extension,让 Cursor AI 助手拥有 seekdb 专业知识,从而在开发过程中获得精准的技术指导。

seekdb Cursor Extension 介绍

seekdb Cursor Extension 是一款 Cursor 扩展,它通过在 .cursor/rules 目录下添加规则,使 Cursor AI 助手能够检索 seekdb 官方文档,从而理解 seekdb 数据库知识,使其能够:

  • 理解 seekdb 数据库概念:向量搜索、混合搜索、AI 函数等
  • 提供准确的代码建议:基于官方文档生成符合最佳实践的代码
  • 回答 seekdb 相关问题:直接在编辑器中获取技术支持
  • 加速开发流程:减少查阅文档的时间,专注于业务逻辑

核心特征

  • 一键安装:通过 Cursor 扩展市场快速安装。
  • 完整文档:检索 seekdb 官方文档知识库,涵盖向量搜索、混合搜索、AI 函数等全面技术文档。
  • 双模式支持:优先从 GitHub 获取最新文档,本地文档作为备份。

工作原理

seekdb Cursor Extension 的工作原理非常简单:

  • 规则文件注入:扩展将 seekdb 官方文档和 .mdc 规则文件添加到 .cursor/rules 目录。
  • AI 上下文增强:Cursor 会自动读取 .cursor/rules 目录中的内容,作为 AI 助手的上下文知识。
  • 智能检索:当你询问 seekdb 相关问题时,AI 助手会基于这些文档提供准确的回答。

步骤一:安装扩展

  1. 在 Cursor 中打开扩展市场(Ctrl+Shift+X 或 Cmd+Shift+X)。
  2. 搜索 "seekdb"。
  3. 点击 Install 安装扩展。

步骤二:添加 seekdb 文档

  1. 使用 Cursor 打开一个项目目录(文档将添加到该目录下)

  2. 打开命令面板:

    • Windows/Linux: 按 Ctrl+Shift+P
    • macOS: 按 Cmd+Shift+P
  3. 输入并选择命令:

    • 输入 "seekdb" 或 "Add seekdb Docs"。
    • 选择 Add seekdb Docs 命令。
  4. 文档将自动添加:

    • .cursor/rules/seekdb-docs 目录(官方文档)。
    • .cursor/rules/seekdb.mdc 文件(规则文件)。
  5. 重新加载窗口使规则生效

安装完成!现在你可以直接向 Cursor AI 助手询问任何 seekdb 相关问题了。

步骤三:使用 AI 助手创建一个 seekdb 混合搜索应用

安装扩展并添加文档后,在 Cursor 中开始一个新对话,输入以下问题:

我想用 Python 创建一个简单的 seekdb 应用,实现文档的混合搜索功能,请帮我写代码

Cursor AI 助手会给出准确的回答:

"""
seekdb 混合搜索快速入门示例

这是一个最简化的混合搜索示例,帮助你快速上手。
"""

import pyseekdb

# 1. 创建客户端(嵌入式模式,无需部署数据库)
client = pyseekdb.Client()

# 2. 创建集合
collection = client.get_or_create_collection(name="my_docs")

# 3. 添加文档
documents = [
"机器学习是人工智能的核心技术",
"Python 是最流行的机器学习编程语言",
"深度学习需要大量的训练数据",
"自然语言处理让计算机理解人类语言",
"向量数据库用于存储和检索向量数据",
]

metadatas = [
{"category": "AI", "year": 2024},
{"category": "Programming", "year": 2024},
{"category": "AI", "year": 2023},
{"category": "AI", "year": 2024},
{"category": "Database", "year": 2024},
]

ids = [f"doc_{i}" for i in range(len(documents))]

collection.add(ids=ids, documents=documents, metadatas=metadatas)
print(f"已添加 {len(documents)} 个文档")

# 4. 执行混合搜索
# 结合全文搜索(包含"机器学习")和向量语义搜索(查找与"AI技术"相似的内容)
results = collection.hybrid_search(
query={
"where_document": {"$contains": "机器学习"}, # 全文搜索:包含关键词
"n_results": 10,
},
knn={
"query_texts": ["AI技术"], # 向量搜索:语义相似性
"n_results": 10,
},
rank={"rrf": {}}, # 使用 RRF 算法融合结果
n_results=3,
include=["documents", "metadatas"],
)

# 5. 打印结果
print("\n混合搜索结果:")
for i, (doc_id, doc, meta) in enumerate(
zip(results["ids"][0], results["documents"][0], results["metadatas"][0]), 1
):
print(f" [{i}] {doc}")
print(f" 元数据: {meta}\n")

# 6. 清理(可选)
# client.delete_collection("my_docs")

步骤四:运行示例

  1. 安装 pyseekdb

    pip install pyseekdb
  2. 创建文件并运行

    将上述代码保存为 quick_start_hybrid_search.py,然后运行:

    python quick_start_hybrid_search.py
  3. 查看结果

    已添加 5 个文档

    混合搜索结果:
    [1] 机器学习是人工智能的核心技术
    元数据: {'year': 2024, 'category': 'AI'}

    [2] 深度学习需要大量的训练数据
    元数据: {'year': 2023, 'category': 'AI'}

    [3] Python 是最流行的机器学习编程语言
    元数据: {'year': 2024, 'category': 'Programming'}

    混合搜索结合了关键词匹配(包含 "机器学习" 的文档)和语义搜索(与 "AI 技术" 语义相近的文档),通过 RRF(Reciprocal Rank Fusion)算法融合两路检索结果,返回最相关的文档。

步骤五:移除文档

如果你不再需要 seekdb 文档,可以轻松移除:

  1. 打开命令面板(Ctrl+Shift+PCmd+Shift+P)。
  2. 输入 Remove seekdb Docs
  3. 选择该命令执行。

文档将从 .cursor/rules 目录中移除。