跳转至主要内容
版本: v0.1

API 参考

vllm.ai/v1alpha1

Package v1alpha1 包含了 v1alpha1 API 组的 API Schema 定义

资源类型

Decision

Decision 定义了基于规则组合的路由决策

出现于

字段描述默认值验证
name stringName 是该决策的唯一标识符最大长度: 100
最小长度: 1
必填: {}
priority integerPriority 定义了该决策的优先级(数值越高 = 优先级越高)
当策略为 "priority" 时使用
0最大值: 1000
最小值: 0
description stringDescription 提供该决策的人类可读描述最大长度: 500
signals SignalCombinationSignals 定义了信号组合逻辑必填: {}
modelRefs ModelRef 数组ModelRefs 定义了该决策的模型引用(目前仅支持一个模型)最大项数: 1
最小项数: 1
必填: {}
plugins DecisionPlugin 数组Plugins 定义了应用于该决策的插件最大项数: 10

DecisionPlugin

DecisionPlugin 定义了决策的插件配置

出现于

字段描述默认值验证
type stringType 是插件类型 (semantic-cache, jailbreak, pii, system_prompt, header_mutation)枚举: [semantic-cache jailbreak pii system_prompt header_mutation]
必填: {}
configuration RawExtensionConfiguration 是作为原始 JSON 对象的插件特定配置无模式 (Schemaless): {}

DomainSignal

DomainSignal 定义了用于分类的领域类别

出现于

字段描述默认值验证
name stringName 是该领域的唯一标识符最大长度: 100
最小长度: 1
必填: {}
description stringDescription 提供该领域的人类可读描述最大长度: 500

EmbeddingSignal

EmbeddingSignal 定义了基于嵌入的信号提取规则

出现于

字段描述默认值验证
name stringName 是该信号的唯一标识符最大长度: 100
最小长度: 1
必填: {}
threshold floatThreshold 是匹配的相似度阈值 (0.0-1.0)最大值: 1
最小值: 0
必填: {}
candidates string 数组Candidates 是用于语义匹配的候选短语列表最大项数: 100
最小项数: 1
必填: {}
aggregationMethod stringAggregationMethod 定义了如何聚合多个候选相似度max枚举: [mean max any]

IntelligentPool

IntelligentPool 定义了包含其配置的模型池

出现于

字段描述默认值验证
apiVersion stringvllm.ai/v1alpha1
kind stringIntelligentPool
metadata ObjectMeta有关 metadata 的字段,请参阅 Kubernetes API 文档。
spec IntelligentPoolSpec
status IntelligentPoolStatus

IntelligentPoolList

IntelligentPoolList 包含 IntelligentPool 的列表

字段描述默认值验证
apiVersion stringvllm.ai/v1alpha1
kind stringIntelligentPoolList
metadata ListMeta有关 metadata 的字段,请参阅 Kubernetes API 文档。
items IntelligentPool 数组

IntelligentPoolSpec

IntelligentPoolSpec 定义了 IntelligentPool 的期望状态

出现于

字段描述默认值验证
defaultModel stringDefaultModel 指定当没有选择特定模型时使用的默认模型最大长度: 100
最小长度: 1
必填: {}
models ModelConfig 数组Models 定义了此池中可用模型的列表最大项数: 100
最小项数: 1
必填: {}

IntelligentPoolStatus

IntelligentPoolStatus 定义了 IntelligentPool 的观测状态

出现于

字段描述默认值验证
conditions Condition 数组Conditions 表示 IntelligentPool 状态的最新可用观测结果
observedGeneration integerObservedGeneration 反映了最近观测到的 IntelligentPool 的生成版本
modelCount integerModelCount 表示池中模型的数量

IntelligentRoute

IntelligentRoute 定义了智能路由规则和决策

出现于

字段描述默认值验证
apiVersion stringvllm.ai/v1alpha1
kind stringIntelligentRoute
metadata ObjectMeta有关 metadata 的字段,请参阅 Kubernetes API 文档。
spec IntelligentRouteSpec
status IntelligentRouteStatus

IntelligentRouteList

IntelligentRouteList 包含 IntelligentRoute 的列表

字段描述默认值验证
apiVersion stringvllm.ai/v1alpha1
kind stringIntelligentRouteList
metadata ListMeta有关 metadata 的字段,请参阅 Kubernetes API 文档。
items IntelligentRoute 数组

IntelligentRouteSpec

IntelligentRouteSpec 定义了 IntelligentRoute 的期望状态

出现于

字段描述默认值验证
signals SignalsSignals 定义了用于路由决策的信号提取规则
decisions Decision 数组Decisions 定义了基于信号组合的路由决策最大项数: 100
最小项数: 1
必填: {}

IntelligentRouteStatus

IntelligentRouteStatus 定义了 IntelligentRoute 的观测状态

出现于

字段描述默认值验证
conditions Condition 数组Conditions 表示 IntelligentRoute 状态的最新可用观测结果
observedGeneration integerObservedGeneration 反映了最近观测到的 IntelligentRoute 的生成版本
statistics RouteStatisticsStatistics 提供关于已配置决策和信号的统计信息

KeywordSignal

KeywordSignal 定义了基于关键词的信号提取规则

出现于

字段描述默认值验证
name stringName 是该规则的唯一标识符(也用作类别名称)最大长度: 100
最小长度: 1
必填: {}
operator stringOperator 定义了关键词的逻辑运算符 (AND/OR)枚举: [AND OR]
必填: {}
keywords string 数组Keywords 是要匹配的关键词列表最大项数: 100
最小项数: 1
必填: {}
caseSensitive booleanCaseSensitive 指定关键词匹配是否区分大小写false

LoRAConfig

LoRAConfig 定义了 LoRA 适配器配置

出现于

字段描述默认值验证
name stringName 是该 LoRA 适配器的唯一标识符最大长度: 100
最小长度: 1
必填: {}
description stringDescription 提供该 LoRA 适配器的人类可读描述最大长度: 500

ModelConfig

ModelConfig 定义了单个模型的配置

出现于

字段描述默认值验证
name stringName 是该模型的唯一标识符最大长度: 100
最小长度: 1
必填: {}
reasoningFamily stringReasoningFamily 指定推理语法家族(例如 "qwen3"、"deepseek")
必须在全局静态配置的 ReasoningFamilies 中定义
最大长度: 50
pricing ModelPricingPricing 定义了该模型的成本结构
loras LoRAConfig 数组LoRAs 定义了该模型可用的 LoRA 适配器列表最大项数: 50

ModelPricing

ModelPricing 定义了模型的计费结构

出现于

字段描述默认值验证
inputTokenPrice floatInputTokenPrice 是每个输入 token 的成本最小值: 0
outputTokenPrice floatOutputTokenPrice 是每个输出 token 的成本最小值: 0

ModelRef

ModelRef 定义了不带评分的模型引用

出现于

字段描述默认值验证
model stringModel 是模型的名称(必须存在于 IntelligentPool 中)最大长度: 100
最小长度: 1
必填: {}
loraName stringLoRAName 是要使用的 LoRA 适配器名称(必须存在于该模型的 LoRAs 中)最大长度: 100
useReasoning booleanUseReasoning 指定是否为此模型启用推理模式false
reasoningDescription stringReasoningDescription 提供何时使用推理的上下文最大长度: 500
reasoningEffort stringReasoningEffort 定义推理努力程度 (low/medium/high)枚举: [low medium high]

RouteStatistics

RouteStatistics 提供关于 IntelligentRoute 配置的统计信息

出现于

字段描述默认值验证
decisions integerDecisions 表示决策的数量
keywords integerKeywords 表示关键词信号的数量
embeddings integerEmbeddings 表示嵌入信号的数量
domains integerDomains 表示领域信号的数量

SignalCombination

SignalCombination 定义了如何组合多个信号

出现于

字段描述默认值验证
operator stringOperator 定义了组合条件的逻辑运算符 (AND/OR)枚举: [AND OR]
必填: {}
conditions SignalCondition 数组Conditions 定义了信号条件的列表最大项数: 50
最小项数: 1
必填: {}

SignalCondition

SignalCondition 定义了单个信号条件

出现于

字段描述默认值验证
type stringType 定义了信号类型 (keyword/embedding/domain)枚举: [keyword embedding domain]
必填: {}
name stringName 是引用的信号名称最大长度: 100
最小长度: 1
必填: {}

Signals

Signals 定义了信号提取规则

出现于

字段描述默认值验证
keywords KeywordSignal 数组Keywords 定义了基于关键词的信号提取规则最大项数: 100
embeddings EmbeddingSignal 数组Embeddings 定义了基于嵌入的信号提取规则最大项数: 100
domains DomainSignal 数组Domains 定义了用于分类的 MMLU 领域类别最大项数: 14