问题标签 [udpipe]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 将带注释的 NLP 模型转换为 R 中的数据帧时如何解决内存分配问题
我正在尝试将大小为 1.2GB 的带注释的 NLP 模型转换为数据帧。我在 R 中使用 Udpipe 包进行自然语言处理,代码如下:
请注意,我有 32GB RAM 并将所有可用内存分配给 R 以运行代码。我还尝试删除存储在 R 环境空间中与运行上述代码无关的大型对象。R 似乎无法为任务分配足够的内存,结果是以下错误消息:
我的问题有两个:
- 上面的错误信息是什么意思?
- 有哪些解决方法可以解决此问题?
r - 如何在 udpipe 中跨各个组运行 RAKE 功能
给定以下示例数据框:
给定以下代码:
我希望得到以下输出:
我希望这个输出,因为我试图按问题对 RAKE 输出进行分组,而不是跨越两个问题:
但是,我的输出如下所示:
尽管关键字 Crock Pot 在 Q2 组中只使用了一次,在 Q1 组中使用了 3 次,但我得到了相同的 rake 分数,频率为 4。
检查函数中group
参数的注释keywords_rake
会发现以下内容:
具有来自 x 的 1 列或多列的字符向量,表示例如文档 id 或句子 id。将在该组中计算关键字,以便不跨句子或文档查找关键字。
我的问题:
我是否group
错误地使用了参数?我应该如何使用 RAKE 算法在单个问题中获得关键字的 rake 分数,而不是在所有问题中?我知道我可以遍历问题,但是在添加开销之前,我想检查是否有内置的方法来处理这个问题。我是否错误地考虑了这个功能?
r - UDpipe模型的问题
我正在尝试使用 R 对从 Twitter 中提取的数据进行情感分析研究。我在编写时使用的是 udpipe 库
我跑了,引发了一个异常:
相对回溯是:
然后我开始调试,控制台上出现了:
lemmaUDP 函数是我的老师创建的,如果有用我也将它的定义粘贴在这里,但与手动完成相同
r - 如何使用自定义字典扩充 udpipe 模型?
有没有办法将自定义用户定义单词的字典添加到udpipe models
?
例如,下面使用默认english
模型,一些词应该已经被识别为关键字,例如R
, Python
, SQL
, javascript
, Excel
, noSQL
。
我想english
用我自己的自定义词来扩充默认模型,以便该textrank_keywords
函数能够更好地识别相关关键字。
sql - R Udpipe包安装到SQL Server错误
当我尝试通过 SQL Server 中的外部脚本调用运行 UDPIPE 时,出现以下错误。
我通常通过将软件包直接安装到 R(4.1 版)中来安装软件包,然后将它们复制到我的 SQL Server R 库目录中。它适用于所有其他软件包,但 UDPIPE 会引发此错误,并且谷歌搜索尚未找到解决方案。
注意: Udpipe 和 data.table 在 R 独立版本中工作正常。
任何帮助将不胜感激。
(我正在运行 SQL Server 2019 并将 R 升级到 4.1,这与我的独立 R 相匹配)。
sql - R SQL Server 文件不存在错误-但确实存在
我在 SQL Server 2019 中运行 R 3.5.2。
使用以下命令加载预训练的 udpipe 模型:
这在 Rstudio 和 R 中可以正常工作。但是,当作为 SQL 外部脚本运行时,出现以下错误:
但是文件在那里,它确实存在,并且通过 Rstudio 加载没有问题。
任何建议都会非常有帮助。
完整代码仅供参考:
仅供参考的完整错误:
谢谢
r - R - NLP - 提取对
- 大家好,我是 R 的 NLP 算法的新手。我想从 pdf 中提取一对(动词名词)?我被困在一个词频话题上。就像“在刑事和民事诉讼及其他法律诉讼中代表客户,起草法律文件,或就法律交易管理或建议客户。可能专注于单一领域,也可能在多个法律领域广泛执业。”
- 我想提取这些的动词名词。我会怎么做?
r - r udpipe 共现函数抛出错误'在调用范围内找不到 i,它也不是列名'
我想知道在同一个 doc id 中使用了多少次名词和形容词。
我发现包的cooccurrence()
功能udpipe
可以完美地达到这个目的。这是我的数据框:
这是函数调用:
但是,每次调用该函数时,都会出现此错误:
我不明白发生了什么事。你能帮助我吗?我对 udpipe 包完全没有经验。
会话信息:
python - 如何在 Python 中正确移动依赖树中的节点?
在一些 Udpipe 函数的帮助下,我刚刚进入了 NLP(语法)的基础知识。作为第一个任务,我决定将简单肯定句的树转换为疑问句的树:
我做很多不同的运动。→ 你做很多不同的运动吗?
原句的树:
首先,我尝试交换代词“I”和动词“Do”的位置,将动词放在句子的开头,然后是代词(Do I many different sports.):
但这是我在树中得到的(看起来它交换了很多而不是我出于某种原因):
此外,如果我尝试重新运行代码的最后一部分,我会收到以下错误:
我真的不知道为什么它与许多人而不是我一起运作以及我做错了什么。