基于编辑序列的跨语言重构检测方法

  • 打印
  • 收藏
收藏成功


打开文本图片集

文章编号:1008-1542(2024)06-0627-09

摘  要:

针对基于深度学习的重构检测方法中开发人员没有一致性地记录重构操作,导致提交的信息不可靠以及语言单一性问题,提出了一种新的跨语言重构检测方法RefCode。首先,采用重构收集工具从不同编程语言中收集提交信息、代码变更信息和重构类型,通过代码变更信息生成编辑序列,将所有数据组合为数据集;其次,将CodeBERT预训练模型与BiLSTM-attention模型相结合,在数据集上进行训练和测试;最后,从6个方面对模型进行评估,以验证方法的有效性。(剩余19392字)

monitor