0

从用户给定的工作描述输入中,我需要使用 python 及其库来提取关键字或短语。我愿意接受社区的建议和指导,了解哪些图书馆最有效,如果以防万一,它很简单,请指导。

用户输入示例:

user_input = "i want a full stack developer. Specialization in python is a must".

预期输出:

keywords = ['full stack developer', 'python']

4

2 回答 2

2

好吧,一个好的关键字集是一个好方法。但是,关键是如何构建它。有很多方法可以做到这一点。

首先,最简单的是搜索网络中设置的开放关键字。这取决于你的运气和你的知识。您的关键字(例如“python、java、机器学习”)是 Stackoverflow、招聘网站中的常见标签。不要触犯法律!

第二个是IR(Information Extraction),它比上一个更复杂。算法有很多,比如“TextRank”、“Entropy”、“Apriori”、“HMM”、“Tf-IDF”、“Conditional Random Fields”等等。

好幸运。

对于匹配关键字/阶段,Trie Tree速度更快。

于 2019-03-26T14:59:33.340 回答
-2

好吧,我回答了我自己的问题。无论如何感谢那些回答的人。

keys = ['python', 'full stack developer','java','machine learning']
keywords = []
for i in range(len(keys)):
    word = keys[i]
    if word in keys:
        keywords.append(word)
    else:
        continue
print(keywords) 

输出符合预期!

于 2019-03-26T09:35:48.487 回答