问题标签 [udpipe]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
169 浏览

tm - R按组提取列中最常见的单词/ ngram

我希望为每个组(第一列)从“标题”列中提取主要关键字。

数据

“所需标题”列中的所需结果:

想要的

可重现的数据:

我已经研究过记录链接解决方案,但这主要是为了对完整标题进行分组。任何建议都会很棒。

0 投票
1 回答
49 浏览

r - 将带注释的 NLP 模型转换为 R 中的数据帧时如何解决内存分配问题

我正在尝试将大小为 1.2GB 的带注释的 NLP 模型转换为数据帧。我在 R 中使用 Udpipe 包进行自然语言处理,代码如下:

请注意,我有 32GB RAM 并将所有可用内存分配给 R 以运行代码。我还尝试删除存储在 R 环境空间中与运行上述代码无关的大型对象。R 似乎无法为任务分配足够的内存,结果是以下错误消息:

我的问题有两个:

  1. 上面的错误信息是什么意思?
  2. 有哪些解决方法可以解决此问题?
0 投票
0 回答
65 浏览

r - 如何在 udpipe 中跨各个组运行 RAKE 功能

给定以下示例数据框:

给定以下代码:

我希望得到以下输出:

在此处输入图像描述

我希望这个输出,因为我试图按问题对 RAKE 输出进行分组,而不是跨越两个问题:

但是,我的输出如下所示:

在此处输入图像描述

尽管关键字 Crock Pot 在 Q2 组中只使用了一次,在 Q1 组中使用了 3 次,但我得到了相同的 rake 分数,频率为 4。

检查函数中group参数的注释keywords_rake会发现以下内容:

具有来自 x 的 1 列或多列的字符向量,表示例如文档 id 或句子 id。将在该组中计算关键字,以便不跨句子或文档查找关键字。

我的问题:

我是否group错误地使用了参数?我应该如何使用 RAKE 算法在单个问题中获得关键字的 rake 分数,而不是在所有问题中?我知道我可以遍历问题,但是在添加开销之前,我想检查是否有内置的方法来处理这个问题。我是否错误地考虑了这个功能?

0 投票
0 回答
115 浏览

r - UDpipe模型的问题

我正在尝试使用 R 对从 Twitter 中提取的数据进行情感分析研究。我在编写时使用的是 udpipe 库

我跑了,引发了一个异常:

相对回溯是:

然后我开始调试,控制台上出现了:

lemmaUDP 函数是我的老师创建的,如果有用我也将它的定义粘贴在这里,但与手动完成相同

0 投票
1 回答
60 浏览

r - 如何使用自定义字典扩充 udpipe 模型?

有没有办法将自定义用户定义单词的字典添加到udpipe models

例如,下面使用默认english模型,一些词应该已经被识别为关键字,例如R, Python, SQL, javascript, Excel, noSQL

我想english用我自己的自定义词来扩充默认模型,以便该textrank_keywords函数能够更好地识别相关关键字。

0 投票
1 回答
59 浏览

sql - R Udpipe包安装到SQL Server错误

当我尝试通过 SQL Server 中的外部脚本调用运行 UDPIPE 时,出现以下错误。

我通常通过将软件包直接安装到 R(4.1 版)中来安装软件包,然后将它们复制到我的 SQL Server R 库目录中。它适用于所有其他软件包,但 UDPIPE 会引发此错误,并且谷歌搜索尚未找到解决方案。

注意: Udpipe 和 data.table 在 R 独立版本中工作正常。

任何帮助将不胜感激。

(我正在运行 SQL Server 2019 并将 R 升级到 4.1,这与我的独立 R 相匹配)。

0 投票
1 回答
92 浏览

sql - R SQL Server 文件不存在错误-但确实存在

我在 SQL Server 2019 中运行 R 3.5.2。

使用以下命令加载预训练的 udpipe 模型:

这在 Rstudio 和 R 中可以正常工作。但是,当作为 SQL 外部脚本运行时,出现以下错误:

但是文件在那里,它确实存在,并且通过 Rstudio 加载没有问题。

任何建议都会非常有帮助。

完整代码仅供参考:

仅供参考的完整错误:

谢谢

0 投票
1 回答
28 浏览

r - R - NLP - 提取对

  • 大家好,我是 R 的 NLP 算法的新手。我想从 pdf 中提取一对(动词名词)?我被困在一个词频话题上。就像“在刑事和民事诉讼及其他法律诉讼中代表客户,起草法律文件,或就法律交易管理或建议客户。可能专注于单一领域,也可能在多个法律领域广泛执业。”
  • 我想提取这些的动词名词。我会怎么做?
0 投票
0 回答
66 浏览

r - r udpipe 共现函数抛出错误'在调用范围内找不到 i,它也不是列名'

我想知道在同一个 doc id 中使用了多少次名词和形容词。

我发现包的cooccurrence()功能udpipe可以完美地达到这个目的。这是我的数据框:

这是函数调用:

但是,每次调用该函数时,都会出现此错误:

我不明白发生了什么事。你能帮助我吗?我对 udpipe 包完全没有经验。

会话信息:

0 投票
0 回答
27 浏览

python - 如何在 Python 中正确移动依赖树中的节点?

在一些 Udpipe 函数的帮助下,我刚刚进入了 NLP(语法)的基础知识。作为第一个任务,我决定将简单肯定句的树转换为疑问句的树:

我做很多不同的运动。→ 你做很多不同的运动吗?

原句的树:

首先,我尝试交换代词“I”和动词“Do”的位置,将动词放在句子的开头,然后是代词(Do I many different sports.):

但这是我在树中得到的(看起来它交换了很多而不是出于某种原因):

此外,如果我尝试重新运行代码的最后一部分,我会收到以下错误:

我真的不知道为什么它与许多人而不是一起运作以及我做错了什么。