• 打印
  • 收藏
收藏成功
分享

基于词替换的对抗文本生成研究


打开文本图片集

摘  要:对抗样本的存在对自然语言处理领域的众多应用存在安全威胁,对抗攻击方法的研究有助于评估甚至提高深度神经网络模型的鲁棒性。现有的词级文本对抗攻击在生成对抗样本的过程中,依赖于单词重要性评分并排序,但效率低下,需要频繁访问目标模型来获取重要性分数。文章针对该问题,提出通过训练替代模型计算单词重要性分数,并结合语义相似度分层采样后得到的目标模型决策概率差值,对原始输入中的单词进行排序。(剩余8287字)

网站仅支持在线阅读(不支持PDF下载),如需保存文章,可以选择【打印】保存。

目录
monitor