参考論文:コードクローン検出において比較する候補の絞り方
軽量な類似度計算によるプロジェクト間のソースファイル集合の再利用検出.pdf
ソースコードから作成した木構造の断片について、LSHを用いてクラスタリングすることで高速にコードクローンを検出[13]。
DECKARD: Scalable and accurate tree-based detection of code clones (smu.edu.sg)
ソースコードから作成したTF-IDFベクトルについて、cross-polytope LSHを用いてクラスタリングし、コードブロック単位でのコードクローンを検出[14]。
転置インデックスを使って比較するべき候補を絞ることで、効率的にコードクローンを検出[15]。
コメント
コメントを投稿