从用户给定的工作描述输入中,我需要使用 python 及其库来提取关键字或短语。我愿意接受社区的建议和指导,了解哪些图书馆最有效,如果以防万一,它很简单,请指导。
用户输入示例:
user_input = "i want a full stack developer. Specialization in python is a must".
预期输出:
keywords = ['full stack developer', 'python']
从用户给定的工作描述输入中,我需要使用 python 及其库来提取关键字或短语。我愿意接受社区的建议和指导,了解哪些图书馆最有效,如果以防万一,它很简单,请指导。
用户输入示例:
user_input = "i want a full stack developer. Specialization in python is a must".
预期输出:
keywords = ['full stack developer', 'python']
好吧,一个好的关键字集是一个好方法。但是,关键是如何构建它。有很多方法可以做到这一点。
首先,最简单的是搜索网络中设置的开放关键字。这取决于你的运气和你的知识。您的关键字(例如“python、java、机器学习”)是 Stackoverflow、招聘网站中的常见标签。不要触犯法律!
第二个是IR(Information Extraction),它比上一个更复杂。算法有很多,比如“TextRank”、“Entropy”、“Apriori”、“HMM”、“Tf-IDF”、“Conditional Random Fields”等等。
好幸运。
对于匹配关键字/阶段,Trie Tree
速度更快。
好吧,我回答了我自己的问题。无论如何感谢那些回答的人。
keys = ['python', 'full stack developer','java','machine learning']
keywords = []
for i in range(len(keys)):
word = keys[i]
if word in keys:
keywords.append(word)
else:
continue
print(keywords)
输出符合预期!