探寻欺骗性价值对齐的应对逻辑:从“意图”到“共生”

  • 打印
  • 收藏
收藏成功


打开文本图片集

摘要: 欺骗性价值对齐的出现使得旨在确保人工智能安全并为人类带来福祉的价值对齐备受质疑,因此,对其的应对是价值对齐必须解决的一个关键问题。依据“意图”与“主体”两个要素所形成的欺骗性价值对齐行为象限可构筑应对欺骗性价值对齐的概念框架;以理性认知面对与欺骗“共生”的价值对齐,可形成应对欺骗性价值对齐的认识论基础。(剩余17285字)

monitor