我确实有一组不同的名称标记以及组合不同名称的数据。例如。如果该名称有 3 个标记,如“abc def ghi”并给出名称“abcdef”或“abcdefghi”,我想识别该组合名称字符串的不同有效标记。我们可以构建一个名称标记字典并使用一些 NLP 技术或 python 库来实现这一点吗?请就如何开始提供您的意见。
问问题
109 次
1 回答
0
如果您需要在字符串中查找子字符串,您只需要一个标记列表和一个循环:
tokens = ['abc', 'def', 'ghi']
name = 'abcdef'
for token in tokens:
if token in name:
print(token, 'is part of', name)
另请参阅是否需要在字符串中查找子字符串的位置。
于 2020-01-31T06:51:18.677 回答