https://www.cs.princeton.edu/cass/papers/www11.pdf
K近邻图的构建在很多基于Web的应用上是一个重要的操作,比如协同过滤(基于用户的邻居作推荐)、相似性搜索等。一个有效地构建方法将使K近邻图的应用更加广泛。
暴力构建K近邻图的时间复杂度为O ( n 2 ) O(n^2)O(n 2 ),为了能更高效的构建K近邻图,现存的工作扩展性都不太好,而且一般都特定于具体的相似性度量。
有效的K近邻图构建仍然是一个开放的问题,解决该问题的已知方案中没有一个是通用、有效和可扩展的。因此,本文提出了NN-Descent方法,该方法具有以下优点:
如何有效地构建一个K近邻图,具体如下: