跳到主要内容
版本:V1.1.0

通义千问

通义千问(Qwen)Embedding 模型是 Qwen 系列的最新专有模型,专为文本嵌入和排序任务而设计。该系列基于 Qwen3 系列的密集基础模型,提供了从 0.6B 到 8B 不同参数规模的模型,覆盖了从轻量级边缘部署到高性能数据中心的全场景需求。其核心优势在于继承了基础模型卓越的多语言能力(支持超过 100 种语言和多种编程语言)、长文本理解(高达 32K 的上下文窗口) 以及强大的逻辑推理能力。

提示

使用 Qwen 服务需要遵循第三方平台的收费规则,可能产生相应费用。请在继续前,访问其官网或查阅相关文档,确认并接受其收费标准。如不同意,请勿继续操作。

依赖与鉴权

  • 已安装 pyseekdb 库。

  • 创建 Dashscope API Key,用于身份验证。

示例:创建 Qwen Embedding Function

在代码中导入并初始化 QwenEmbeddingFunction。通常,API 密钥通过环境变量管理。

  • 基本用法

    指定模型名称,使用默认环境变量 DASHSCOPE_API_KEY 进行初始化。

    from pyseekdb.utils.embedding_functions import QwenEmbeddingFunction

    # 使用 text-embedding-v1 模型
    ef = QwenEmbeddingFunction(
    model_name="text-embedding-v1"
    )
  • 高级用法与自定义配置

    自定义 API 密钥的环境变量名称,并根据模型版本设置 dimensionstimeout 等参数。

    from pyseekdb.utils.embedding_functions import QwenEmbeddingFunction

    # 自定义环境变量名并设置超时
    ef = QwenEmbeddingFunction(
    model_name="text-embedding-v1",
    api_key_env="DASHSCOPE_API_KEY",
    timeout=30
    )

    # 使用动态维度的模型,并指定输出维度为 512
    ef = QwenEmbeddingFunction(
    model_name="text-embedding-v3",
    dimensions=512 # Reduce from default 1024 to 512
    )

参数说明:

  • model_name:Qwen Embedding 模型名称,例如 text-embedding-v1text-embedding-v3。不指定时默认为 text-embedding-v1
  • api_key_env:API Key 所在的环境变量名,默认是 DASHSCOPE_API_KEY
  • timeout:请求超时时间(秒),可选。
  • dimensions:输出向量维度(仅当模型支持动态维度时生效,如 text-embedding-v3 可从默认 1024 调整为更小值),可选。