我需要做一个实验,我是 NLP 的新手。我读过解释理论问题的书籍,但在实践方面,我发现很难找到指南。所以请谁知道 NLP 中的任何事情,尤其是实际问题告诉我并指出正确的道路,因为我觉得我迷路了(有用的书籍、有用的工具和有用的网站)
我要做的是获取一个文本并在其中找到特定的单词,例如狗、猫等动物,然后我需要在每一侧提取这个单词和 2 个单词。例如
I was watching TV with my lovely cat last night.
提取的文本将是
(my lovely cat last night)
这将是我对机床的训练示例
Q1:将有大约 100 个与我上面解释的类似的训练示例。我使用 tocknizer 来提取单词,但我如何提取特定的单词(对于我们的示例,所有类型的动物),每边有 2 个单词。例如,我需要使用标签吗?或者你的想法是什么?
Q2:如果我有这些训练样例,我该如何准备合适的数据集给机床进行训练?我应该在这个数据集中写什么来指定动物,我应该提供其他特征吗?以及如何将其排列在数据集中。
你的很多话可能对我有很大帮助请不要犹豫告诉你所知道的