基于监督学习与深度强化学习的任务型对话模型设计与实现

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘 要:【目的】探讨智能对话系统中任务型对话模型的设计,提出一个基于监督学习和强化学习的任务型对话系统框架。【方法】采用监督学习和强化学习相结合的方法。首先,将开放域对话模型的生成回复嵌入到任务型回复的过程中,构建一个综合的对话模型。其次,利用监督学习和迁移学习的方法,构建对话策略模型,用于指导对话系统的决策过程。(剩余8605字)

monitor