登录 | 注册 | 退出 | 公司首页 | 繁体中文 | 满意度调查
综合馆
基于后缀树的二进制可执行代码的克隆检测算法
  • 摘要

    如何发现代码克隆,是软件维护和软件侵权纠纷案件中的一个关键问题.由于商业保密等原因,在商业软件的侵权纠纷案中往往无法使用基于源代码比对的克隆检测技术.因此,针对这类无法获得源代码进行代码克隆检测的场景,文中提出一种针对二进制可执行文件分析的代码克隆检测方法.首先,通过反编译与指令类型抽象得到二进制可执行目标文件的指令类型序列;然后,对指令类型序列构建后缀树,利用后缀树的性质获取函数级的指令序列间的克隆信息,并通过消除沙砾指令进一步提高检测性能;最后,基于M IPS32指令集,使用Linux内核和经过混淆处理的代码分别作为克隆级别0-级别2与级别1-级别4的二进制可执行文件代码克隆测试样本,并与源代码检测工具进行对比测试.结果表明,所提算法在缺少源代码的场景下同样能进行细粒度的克隆分析,且对各级代码克隆均具有较好的检测性能.

  • 作者

    张凌浩  桂盛霖  穆逢君  王胜  ZHANG Ling-hao  GUI Sheng-lin  MU Feng-jun  WANG Sheng 

  • 作者单位

    国网四川省电力公司电力科学研究院 成都610000/电子科技大学计算机科学与工程学院 成都611731;中国电子科技集团公司第三十研究所 成都610041/电子科技大学计算机科学与工程学院 成都611731

  • 刊期

    2019年10期 ISTIC PKU

  • 关键词

    代码克隆  二进制可执行文件  后缀树  性能优化 

相似文献 查看更多>>
34.204.183.113