可解释的视觉问答研究进展

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

摘要：在视觉问答（VQA）任务中，“可解释”是指在特定的任务中通过各种方法去解释模型为什么有效。现有的一些VQA模型因为缺乏可解释性导致模型无法保证在生活中能安全使用，特别是自动驾驶和医疗相关的领域，将会引起一些伦理道德问题，导致无法在工业界落地。主要介绍视觉问答任务中的各种可解释性实现方式，并分为了图像解释、文本解释、多模态解释、模块化解释和图解释五类，讨论了各种方法的特点并对其中的一些方法进行了细分。（剩余35709字）

试读结束

购买全文6.00元下一篇基于GAT与SVM的区块链异常交易检测

计算机应用研究

2024年01期

¥12.00/本