我目前正在编写一个脚本(在 R 中),以从来自各种公司高管传记的句子中提取职称。我有一个职位列表和传记中的句子列表,我想知道如何提取每个句子中的职位列表。我已经尝试将句子分解成单词(与职位名称相同)并使用 %in% 匹配它们,它可以工作,但它不会提取整个短语(董事会只是“董事会”和“董事”我不能包含“of”,因为一堆不需要的 of 将被拉出”
job_title <- list("board of directors", "VP of sales")
sentences <- list("He was a member of the board of directors", "He joined as
VP of sales", "He was born in 1968")
所以基本上我想要一些代码来查看每个句子,将其与 job_title 匹配并提取职位名称,以便结果是:“董事会”和“销售副总裁”列表。非常感谢!