通义千问
通义千问(Qwen)Embedding 模型是 Qwen 系列的最新专有模型,专为文本嵌入和排序任务而设计。该系列基于 Qwen3 系列的密集基础模型,提供了从 0.6B 到 8B 不同参数规模的模型,覆盖了从轻量级边缘部署到高性能数据中心的全场景需求。其核心优势在于继承了基础模型卓越的多语言能力(支持超过 100 种语言和多种编程语言)、长文本理解(高达 32K 的上下文窗口) 以及强大的逻辑推理能力。
提示
使用 Qwen 服务需要遵循第三方平台的收费规则,可能产生相应费用。请在继续前,访问其官网或查阅相关文档,确认并接受其收费标准。如不同意,请勿继续操作。
依赖与鉴权
-
已安装 pyseekdb 库。
-
创建 Dashscope API Key,用于身份验证。
示例:创建 Qwen Embedding Function
在代码中导入并初始化 QwenEmbeddingFunction。通常,API 密钥通过环境变量管理。
-
基本用法
指定模型名称,使用默认环境变量
DASHSCOPE_API_KEY进行初始化。from pyseekdb.utils.embedding_functions import QwenEmbeddingFunction
# 使用 text-embedding-v1 模型
ef = QwenEmbeddingFunction(
model_name="text-embedding-v1"
) -
高级用法与自定义配置
自定义 API 密钥的环境变量名称,并根据模型版本设置
dimensions、timeout等参数。from pyseekdb.utils.embedding_functions import QwenEmbeddingFunction
# 自定义环境变量名并设置超时
ef = QwenEmbeddingFunction(
model_name="text-embedding-v1",
api_key_env="DASHSCOPE_API_KEY",
timeout=30
)
# 使用动态维度的模型,并指定输出维度为 512
ef = QwenEmbeddingFunction(
model_name="text-embedding-v3",
dimensions=512 # Reduce from default 1024 to 512
)
参数说明:
model_name:Qwen Embedding 模型名称,例如text-embedding-v1、text-embedding-v3。不指定时默认为text-embedding-v1。api_key_env:API Key 所在的环境变量名,默认是DASHSCOPE_API_KEY。timeout:请求超时时间(秒),可选。dimensions:输出向量维度(仅当模型支持动态维度时生效,如text-embedding-v3可从默认 1024 调整为更小值),可选。