0

首先,我对深度学习非常陌生,如果我没有提出不符合网站标准的问题,我很抱歉。

我有一系列与许多功能相关的序列(您可以从这里arm assembly opcodes查看整个csv文件)。如果我给出一个特定的函数序列,如下所示。

// This is the disassembly sequence of a function named bit()

// just assume four opcodes `b0 0a 46 01` belong to certain other library
83 b0 0a 46 01 90 02 a8 01 70 ff e7 01 98 01 68 01 22 52 05 91 43 01 60 02 a8 00 78 40 05 00 90 ff e7 01 98 01 68 00 9a 11 43 01 60 01 98 03 b0 70 47 

我已经建立了一个小型深度学习模型(通过遵循 NLP 教程)来在传递上述字节序列时在八类函数中进行分类。但是,我需要的是除了识别函数标签之外,识别属于特定库的字节序列。例如,在上面的函数中b0 0a 46 01相信不同的库。所以我想在传递整个函数序列时识别这样的子序列。我相信它类似于图像中的对象检测,而不是仅仅识别图像本身,而是识别模型中的对象。

坦率地说,我不知道这样的要求在深度学习中是否可能,如果可能的话,我想知道我可以查找和学习的任何资源/教程以实现我的目标。再一次,对不起,如果我问一些没有意义的事情。如果可能的话,感谢任何帮助。

4

1 回答 1

0

您将其视为对象检测问题的想法似乎是有道理的。在这个用例中,Yolo 模型应该相当不错: https ://pjreddie.com/darknet/yolo/ 。也许您可以用 1D 卷积代替 2D 卷积以适应您的用例。此外,第一步创建嵌入来对操作码进行编码可能会有所帮助,尽管您可能已经实现了这部分。我希望这有帮助。

于 2019-11-11T17:42:47.457 回答