我们有大量的存储库。我们希望在这些存储库上实现基于语义(功能)的代码搜索。现在,我们已经实现了基于关键字的代码搜索,其中我们爬取了所有存储库文件并使用 elasticsearch 对其进行索引。但这并不能解决我们的问题,因为一些存储库的注释和记录都很差,因此搜索特定的代码/库变得很困难。
所以我的问题是:在这个领域是否有任何开源库或任何以前的工作可以帮助我们索引存储库文件的语义,以便搜索代码变得容易,这也将有助于我们代码的可重用性. 我发现了一些研究论文,如语义代码浏览、基于语义的代码搜索等,但由于没有给出实际的实现,所以没有用。所以你能推荐一些好的库或项目来帮助我实现同样的目标吗?
PS:-此外,像 Koders、Google、cocycles.com 等公司也开始了基于功能的代码搜索。但是他们中的大多数人在没有给出任何适当反馈的情况下关闭了他们的操作,谁能告诉我他们面临什么样的困难。