生成式人工智能价值对齐的规范进路与制度前景

  • 打印
  • 收藏
收藏成功

【摘要】价值对齐是指人工智能系统在任务执行与内容生成过程中,其目标指向、行为倾向及输出结果,应与人类社会广泛认可的价值体系保持一致,这是人工智能伦理治理的基础。当前生成式人工智能的价值对齐,受制于技术路径对外部目标设定的依赖,难以在结构上确保伦理一致性。化解这一规范性困境,需在系统内部构建“理由空间”与“元级机制”,使其能够在冲突情境中进行权衡,并具备动态修正目标的能力,从而在决策过程中内嵌规范性支撑。(剩余14446字)

monitor
客服机器人