我正在尝试为编程语言实现自动完成算法。我希望它具有上下文意识,这意味着建议必须相对于用户当前键入的语句出现。
解决这个问题的最佳方法是什么?我应该研究什么算法?
我正在尝试为编程语言实现自动完成算法。我希望它具有上下文意识,这意味着建议必须相对于用户当前键入的语句出现。
解决这个问题的最佳方法是什么?我应该研究什么算法?
您实际上不需要解析语言来执行此操作。
假设您有一个有效符号列表,您只需要在用户按下自动完成键(例如,TAB)时选择最有可能的完成。您可以按符号在代码中的频率对符号进行加权。您还可以按符号类型加权,赋予变量名比保留字更大的权重。例如,如果用户键入“th[TAB]”并且他们有一个名为“themes”的变量出现了 50 次,那么这可能是最高完成,而保留字“then”可能是第二个。
要生成频率加权,您需要计算每个符号在代码中出现的次数。这可以使用标准的字符串搜索算法来完成。
如果你有一个解析器,你可以做更多花哨的事情。例如,如果您确定一个类的所有方法,并且用户输入一个类实例的符号,后跟一个句点,您可以自动显示方法列表,因为这些是唯一有效的可能性。
顺便说一句:构建符号列表将取决于语言。例如,如果是 Java,则可以使用内置的自省方法来识别所有已定义的符号。
您需要一个能够识别您的语言语法的状态机。此外,状态转换应根据其概率进行加权。
如果您的引擎的状态为public static
,则状态转换的权重class
可能高于abstract
。这对于显示实际数量的选项作为建议是必要的。