-2

长话短说,我有一个随机程序的 WinAPI 调用列表,我想对其进行一些数据分析(fe 分类或序列标签)。

显然,我不能使用符号名称,所以我想知道是否有任何方法可以根据函数的上下文(通过与词嵌入类比)将函数表示为向量,或者上下文和函数目的之间没有或非常弱的依赖性。

因此,简而言之,我正在寻找将 WinAPI 函数映射到其向量表示的算法(或至少是一些想法开始),具体取决于函数上下文(参数列表)。

4

1 回答 1

0

所以你想要一个适合分类的参数列表的向量表示?您需要决定是否需要参数名称或参数类型的列表,但一般方法应该适用于两者:

  1. 使用将每个参数名称(或类型)映射到数字(符号 id)的符号表。
  2. 将每个符号 id 转换为一个小向量,该向量具有与符号表中的条目一样多的条目,并且在与您的符号 id 对应的位置上具有 1,否则全为零。(这称为 one-hot 编码)
    1. 对函数的所有参数执行此操作,并将向量连接成一个长向量。确保第一个参数的向量首先进入长向量,第二个参数第二个等等。
    2. 您现在有了一个上下文向量,您可以将其用作分类器中的特征向量。
于 2017-08-01T11:02:12.340 回答