Flywheel-IVA:预算感知的训推一体化智能视频分析系统

  • 打印
  • 收藏
收藏成功


打开文本图片集

一、前言

视频智能系统正在从“单路离线理解”走向“多路长时序、实时”场景。城市安防、智慧交通、工业质检与多媒体检索均要求在毫秒级延迟与高并发约束下完成检测、跟踪、理解、检索、对话等复合任务[l。尽管视频基础模型ViFM与Video-LLM近年来在多任务能力上大幅跃迁[2-3],但其推理代价通常与输入长度、分辨率线性相关,甚至超线性增长,使端到端SLA难以满足[4。(剩余4894字)

目录
monitor