悦月直播免费版app下载 - 悦月直播app大全下载最新版本免费安装软件

基于預訓練Transformer語言模型的源代碼剽竊檢測研究

  • 打印
  • 收藏
收藏成功


打開文本圖片集

摘要: 為解決源代碼剽竊檢測的問題, 以及針對現(xiàn)有方法需要大量訓練數(shù)據(jù)且受限于特定語言的不足, 提出了一種基于預訓練Transformer 語言模型的源代碼剽竊檢測方法, 其結合了詞嵌入、相似度計算和分類模型。該方法支持多種編程語言, 不需要任何標記為剽竊的訓練樣本, 即可達到較好的檢測性能。實驗結果表明,該方法在多個公開數(shù)據(jù)集上取得了先進的檢測效果, F1 值接近。(剩余6625字)

monitor