基于编辑序列的跨语言重构检测方法研究
DOI:
作者:
作者单位:

河北科技大学信息科学与工程学院

作者简介:

通讯作者:

中图分类号:

基金项目:

河北省自然科学基金项目F2023208001;河北省引进留学人员资助项目C20230358


Author:
Affiliation:

Fund Project:

  • 摘要
  • |
  • 图/表
  • |
  • 访问统计
  • |
  • 参考文献
  • |
  • 相似文献
  • |
  • 引证文献
  • |
  • 资源附件
  • |
  • 文章评论
    摘要:

    针对基于深度学习的重构检测方法中存在的问题,即开发人员没有一致性地记录重构操作,导致的提交信息不可靠以及语言单一性问题,提出了一种的跨语言重构检测方法RefCode。首先,采用重构收集工具从不同编程语言中收集提交信息、代码变更信息和重构类型,再通过代码变更信息生成编辑序列,将所有数据组合为数据集;然后,将CodeBERT预训练模型与BiLSTM-attention模型相结合,在数据集上进行训练和测试;最后,从六个方面对模型进行评估,以验证方法的有效性。结果表明,RefCode相较于只采用提交信息作为LSTM模型输入的重构检测方法,在精度和召回率方面均实现了约50%的显著提升。研究结果实现了跨语言重构检测,并有效弥补了提交信息不可靠的缺陷。

    Abstract:

    参考文献
    相似文献
    引证文献
引用本文
分享
文章指标
  • 点击次数:
  • 下载次数:
  • HTML阅读次数:
  • 引用次数:
历史
  • 收稿日期:2023-12-20
  • 最后修改日期:2024-04-08
  • 录用日期:2024-04-28
  • 在线发布日期:
  • 出版日期:
文章二维码