跳转至主要内容

🏆论文与演讲

当伟大的思想汇聚在一起,创新便会蓬勃发展 ❤️

🏆研究出版物

🏆
研究出版物

何时推理:针对 vLLM 的语义路由器 (When to Reason: Semantic Router for vLLM)

作者:Chen Wang, Xunzhuo Liu, Yuhan Liu, Yue Zhu, Xiangxi Mo, Junchen Jiang, Huamin Chen
会议/期刊:NeurIPS - MLForSys
我们提出了一种语义路由器,它可以根据查询的推理需求对其进行分类,并仅在有益时选择性地应用推理。
vLLM语义路由器
🏆
研究出版物

针对异构 LLM 工作负载的类别感知语义缓存 (Category-Aware Semantic Caching for Heterogeneous LLM Workloads)

作者:Chen Wang, Xunzhuo Liu, Yue Zhu, Alaa Youssef, Priya Nagpurkar, Huamin Chen
我们提出了一种类别感知语义缓存,其中相似性阈值、TTL 和配额随查询类别而变化,并采用混合架构将内存中 HNSW 搜索与外部文档存储分离。
vLLM语义路由器
🏆
研究出版物

语义推理路由协议 (SIRP)

作者:Huamin Chen, Luay Jalil
组织:互联网工程任务组 (IETF)
本文档详细说明了语义推理路由协议 (SIRP),这是一个用于 AI 推理系统中内容级分类和语义路由的框架。
vLLM语义路由器
🏆
研究出版物

智能体 AI 推理 API 的多提供商扩展 (Multi-Provider Extensions for Agentic AI Inference APIs)

作者:H. Chen, L. Jalil, N. Cocker
组织:互联网工程任务组 (IETF) - 网络管理研究小组
本文档规定了智能体 AI 推理 API 的多提供商扩展。发布日期:2025 年 10 月 20 日。拟定状态:信息化。到期日期:2026 年 4 月 23 日。
vLLM语义路由器

🏆会议演讲

🤗
会议演讲

智能 LLM 路由:Kubernetes 中多模型 AI 编排的新范式

演讲者:Chen Wang, Huamin Chen
会议:KubeCon NA 2025
这场研究驱动的演讲介绍了一种新型架构范式,补充了近期在大语言模型及时智能推理路由方面的进展。
vLLM语义路由器
🤗
会议演讲

vLLM 语义路由器:释放智能路由的力量

演讲者:Xunzhuo Liu
会议:vLLM Meetup 北京站
深入探讨 vLLM 语义路由器的功能,展示智能路由如何为高效的 LLM 推理开启新的可能性。
vLLM语义路由器
🤗
会议演讲

AI 驱动的 vLLM 语义路由器

演讲者:Huamin Chen
活动:vLLM 办公时间 (Office Hours)
概述 vLLM 语义路由器中 AI 驱动的功能,展示最新进展和社区贡献。
vLLM语义路由器