基于轻量化知识蒸馏的文本多分类模型设计

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要:轻量化模型设计成为研究热点,而知识蒸馏作为一种有效压缩大模型的方法,受到广泛关注。因此,文章提出了基于轻量化知识蒸馏的文本多分类模型设计,首先构建了基于瓶颈结构的轻量级适配器架构,实现了对教师模型关键知识的高效压缩存储;其次设计了多任务知识融合机制,通过动态权重分配策略智能整合来自不同历史快照的知识信息;最后提出了表示空间重新校准策略,采用对比学习思想优化任务间的边界划分,显著提升了类增量学习场景下的分类性能。(剩余5297字)

目录
monitor
客服机器人