问题标签 [udpipe]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 查找字符串和查找表之间所有可能的短语匹配
我有一个带有一堆文本字符串的数据框。在第二个数据框中,我有一个短语列表,用作查找表。我想在查找表中搜索所有可能的短语匹配的文本字符串。
我的问题是某些短语有重叠的单词。例如:“鸡蛋”和“绿色鸡蛋”。
在结果中,您可以看到返回的是“the cat”而不是“cat”,返回的是“green eggs”而不是“eggs”。
如何在文本字符串和查找表之间找到所有可能的短语匹配?
我应该补充一点,我并不拘泥于任何特定的包裹。我只是在这里使用 udpipe,因为我最熟悉它。
r - 使用 R 和 pos 标记将字符串拆分为多个句子
我不知道这是否是正确的地方,但如果可能的话,你能帮我用 R 将文本分成几个句子吗?我有一个数据库,其中包含对员工执行的活动的描述。我想把这段文字分成几个句子,然后从每个句子中提取动词-名词对。我可以逐行执行此操作,但是由于行数很多,因此需要很长时间,所以我想知道你们是否知道如何为整个专栏执行此操作。你们可以在以下位置查看数据库:https ://docs.google.com/spreadsheets/d/1NiMj37q8_hJhuNFCiQcjO6UBvI9_-OM4/edit?usp=sharing&ouid=115543599430411372875&rtpof=true&sd=true
我可以像下面的代码一样一一做,但我想为整个描述做