问题标签 [stringi]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 使用键迭代替换字符串中的文本
我正在寻找使用键迭代替换字符串中的文本。我有下面的代码,但我想知道是否有更简单或更有效的方法来做到这一点
r - 安装包“stringr”和“stringi”的退出状态非零
请帮我在 R 中安装 stringr 和 stringi 包。结果是:
我已尝试遵循链接中的建议我应该如何处理“package 'xxx' is not available (for R version xyz)”警告?,结果是下一个(不是肯定的):
- 名字没问题
- 只需设置所有可能的存储库
- 包当然在存储库中
- 'stringr' 当然是一个包
- 我的 R 没有过时,我最近升级到 3.2.0 版本
- 'stringr' 不是存档包
这没有给出积极的结果:
install.packages("stringr", type = "source")
将包安装到 'C:/Users/kozlovpy/Documents/R/win-library/3.2'
(因为 'lib' 未指定)
还安装依赖项 'stringi'
пробую URL ' https://mran.revolutionanalytics.com/snapshot/2015-08-27/src/contrib/stringi_0.5-5.tar.gz '
内容类型 'application/octet-stream' 长度 3639183 字节 (3.5 MB )
已下载 3.5 MB
пробую URL ' https://mran.revolutionanalytics.com/snapshot/2015-08-27/src/contrib/stringr_1.0.0.tar.gz ' 下载
内容类型 'application/octet-stream' 长度 34880 字节 (34 KB)
34 KB
- 安装源包 'stringi' ...
** пакет 'stringi' удачно распакован, MD5 sums проверены
Предупреждение: работающая команда 'sh ./configure.win' имеет статус 127
ERROR' 包配置失败:
- 删除“C:/Users/kozlovpy/Documents/R/win-library/3.2/stringi”
错误:依赖项“stringi”不适用于包“stringr”
- 删除 'C:/Users/kozlovpy/Documents/R/win-library/3.2/stringr'
Скачанные исходники пакетов находятся в
'C:\Users\kozlovpy\AppData\Local\Temp\RtmpgnfwL4\downloaded_packages'
Предупреждения:
1: работающая команда/R/R/x/64-3-2~1.2~1~1 '" C:\Users\kozlovpy\AppData\Local\Temp\RtmpgnfwL4\downloaded_packages' R"
CMD INSTALL -l "C:\Users\kozlovpy\Documents\R\win-library\3.2"
C:\Users\kozlovpy\AppData\Local\Temp\RtmpgnfwL4/downloaded_packages/stringi_0.5-5.tar.gz ' имеет статус 1
2: В install.packages("stringr", type = "source") :
установка пакета 'stringi' имеет ненулевой статус выхода
3: работающая команда '"C:/PROGRA 1.2/bin/x64/R"
CMD INSTALL -l "C:\Users\kozlovpy\Documents\R\win-library\3.2"
C:\Users\kozlovpy\AppData\Local\Temp\RtmpgnfwL4/downloaded_pac
kages/stringr_1.0.0.tar.gz' имеет статус 1
4: В install.packages("stringr", type = "source") :
установка пакета 'stringr' имеет ненулевой статус выхода- 安装源包 'stringi' ...
Github 包显示下一个:
install_github("hadley/stringr")
下载 github repo hadley/stringr@master Ошибка
в loadNamespace(i, c(lib.loc, .libPaths()), versionCheck = vI[[i]]) :
没有名为' stringi'
install_github("Rexamine/stringi")
下载 github repo Rexamine/stringi@master Ошибка
в loadNamespace(i, c(lib.loc, .libPaths()), versionCheck = vI[[i]]) :
没有包称为“字符串”options(install.packages.check.source = "no") 也没有帮助
- 试图进入不同的回购 - 没有希望。
任何猜测我做错了什么?
r - str_replace "NA" 的意外行为
我正在尝试将字符串转换为数字,但遇到了一些意外行为str_replace
。这是一个最小的工作示例:
在我看来,第二个示例应该可以工作,因为它应该只用NA
(这是字符向量中的有效值)替换向量中的第二个条目。但它没有:内部str_replace
将所有三个条目转换为NA
.
这里发生了什么?我浏览了文档str_replace
,stri_replace_all
但没有看到明显的解释。
编辑:stringr_1.0.0
澄清一下,这是stringi_1.0-1
在 R 3.1.3、Windows 7 上使用的。
r - 在 R 中使用 stringi 和 stringr 将 utf-8 自动翻译成 ascii - 转义字符 \u 出错
我正在努力将 utf-8 自动翻译成 ascii 字母。
在数据框中,我有以下源自希腊字母的序列:
通过手动将序列转换为
我使用以下命令使用stringi得到了正确的转录:
现在,我想通过stringr自动翻译:
结果是:
不能通过stringi翻译
可能对您提出的问题是如何通过stringr和stringi将原始 utf-8 字符串转换为 ascii 字母,因为在我的数据框中有很多这些字符串序列?
我在 R 上运行 RStudio 版本 0.99.825
RStudio 和 R 作为便携式应用程序运行。
先感谢您
亲切的问候
马库斯
regex - (跳过)(失败)使用 stringi 解析错误
我正在阅读/学习The Greatest Regex Trick Ever我们说我们想要一些东西,除非......使用(*SKIP)(*FAIL)
. 好的,所以我在下面的玩具示例中使用了它,它在基础 R 中工作,但在stringi中有以下错误。我是否需要对stringi做一些不同的事情才能使语法正常工作?
regex - R中的正则表达式“吃掉”字符串的一部分
我想将一个字符串分成两组。该字符串的结构非常简单,但我无法使其工作。
它总是一些字母,后跟日期,而日期显然以数字开头。我在https://regex101.com/尝试了以下正则表达式,并有效地正确分隔了字符串:
但是当我在 R 中尝试时它失败了:
如果我引入双方括号,那么它会“吃掉”第一组的最后一个字符,以及第二组的第一个字符:
我是否使用没关系perl=TRUE
。如果我使用结果也是一致stringi::stri_split
的,所以这是我的正则表达式中的一个问题。
在这种情况下使用的正确正则表达式是什么?
r - 用字符串替换单词
我正在尝试使用 stringi 替换某些单词stri_replace
,但是在替换单词的相似部分时遇到了问题。在下面的示例中,我正在修复三角形的拼写错误,但它似乎变得混乱,因为 'tri' 是 'trian' 的一部分,是 'triangle' 的一部分,它就像 'trainglegle'。我不太熟悉stri_replace
,有什么我遗漏的论点吗?谢谢你的帮助。
regex - 基于代码点的字符调试
我有一个从it.dbpedia.org中提取的带有多个编码“错误”的字符向量。事实上,每个重音字符都被错误地渲染为,"\"Democrazia è Libertà - La Margherita\"@it"
而不是\"Democrazia è Libertà - La Margherita\"@it
.
我在这里找到了这种编码问题的调试图。我仍然注意到“实际”和“预期”字符之间的关系不是一对一(如我所料)而是一对多。然后我的字符“Ô可能会翻译为“Á”、“Í”、“Ï”、“Д、“Ý”、“à”。换句话说,我不能对实际/预期字符使用模式/替换解决方案。
我可以使用带有 Unicode 代码点/预期字符的模式/替换解决方案吗?如何传递给gsub()
unicode 代码点而不是实际字符?
我应该使用包stringi
来解决编码问题吗?如何?
更新:我刚刚注意到问题出在源头:SPARQL 的 XML 输出。
注意:与这个未回答的问题有关。
regex - 从字符串和文本数据中提取年份
我需要从具有这些性质的值的向量中提取开始年份和结束年份。
我期待这样的输出。有人有建议吗?