基于预训练模型的代码分类研究

打印
收藏

收藏成功

微博 QQ空间微信

打开文本图片集

摘要：代码分类是软件开发与管理的基础工作，有利于代码的重用、理解、查找和维护。现有的有监督学习方法需要大量带标签数据作为训练样本，而数据的标注成本很高，针对这一问题，提出了基于预训练的代码分类方法。首先，对代码进行消除空白、去除低频符号等预处理工作;其次，采用一种基于BERT的预训练模型（CodeBERT）在无标注样本上提取代码的语法、语义和上下文语境等相关特征;最后，基于预训练模型在小样本上微调代码分类器。（剩余534字）

试读结束

购买全文3.00元下一篇基于协同过滤的知识推荐模型研究

软件工程

2023年10期

¥6.00/本