“stringi”的相关标签问题_Stack Overflow中文网

0 投票

2 回答

72 浏览

r - 使用键迭代替换字符串中的文本

我正在寻找使用键迭代替换字符串中的文本。我有下面的代码，但我想知道是否有更简单或更有效的方法来做到这一点

r stringi

2015-11-27T21:16:06.023

0 投票

5 回答

16151 浏览

r - 安装包“stringr”和“stringi”的退出状态非零

请帮我在 R 中安装 stringr 和 stringi 包。结果是：

我已尝试遵循链接中的建议我应该如何处理“package 'xxx' is not available (for R version xyz)”警告？，结果是下一个（不是肯定的）：

名字没问题
只需设置所有可能的存储库
包当然在存储库中
'stringr' 当然是一个包
我的 R 没有过时，我最近升级到 3.2.0 版本
'stringr' 不是存档包
这没有给出积极的结果：

install.packages("stringr", type = "source")
将包安装到 'C:/Users/kozlovpy/Documents/R/win-library/3.2'
（因为 'lib' 未指定）
还安装依赖项 'stringi'

пробую URL ' https://mran.revolutionanalytics.com/snapshot/2015-08-27/src/contrib/stringi_0.5-5.tar.gz '
内容类型 'application/octet-stream' 长度 3639183 字节 (3.5 MB )
已下载 3.5 MB

пробую URL ' https://mran.revolutionanalytics.com/snapshot/2015-08-27/src/contrib/stringr_1.0.0.tar.gz ' 下载
内容类型 'application/octet-stream' 长度 34880 字节 (34 KB)
34 KB
- 安装源包 'stringi' ...
  ** пакет 'stringi' удачно распакован, MD5 sums проверены
  Предупреждение: работающая команда 'sh ./configure.win' имеет статус 127
  ERROR' 包配置失败：
- 删除“C:/Users/kozlovpy/Documents/R/win-library/3.2/stringi”
  错误：依赖项“stringi”不适用于包“stringr”
- 删除 'C:/Users/kozlovpy/Documents/R/win-library/3.2/stringr'
Скачанные исходники пакетов находятся в
'C:\Users\kozlovpy\AppData\Local\Temp\RtmpgnfwL4\downloaded_packages'
Предупреждения:
1: работающая команда/R/R/x/64-3-2~1.2~1~1 '" C:\Users\kozlovpy\AppData\Local\Temp\RtmpgnfwL4\downloaded_packages' R"
CMD INSTALL -l "C:\Users\kozlovpy\Documents\R\win-library\3.2"
C:\Users\kozlovpy\AppData\Local\Temp\RtmpgnfwL4/downloaded_packages/stringi_0.5-5.tar.gz ' имеет статус 1
2: В install.packages("stringr", type = "source") :
установка пакета 'stringi' имеет ненулевой статус выхода
3: работающая команда '"C:/PROGRA 1.2/bin/x64/R"
CMD INSTALL -l "C:\Users\kozlovpy\Documents\R\win-library\3.2"
C:\Users\kozlovpy\AppData\Local\Temp\RtmpgnfwL4/downloaded_pac
kages/stringr_1.0.0.tar.gz' имеет статус 1
4: В install.packages("stringr", type = "source") :
установка пакета 'stringr' имеет ненулевой статус выхода
Github 包显示下一个：

install_github("hadley/stringr")
下载 github repo hadley/stringr@master Ошибка
в loadNamespace(i, c(lib.loc, .libPaths()), versionCheck = vI[[i]]) :
没有名为' stringi'
install_github("Rexamine/stringi")
下载 github repo Rexamine/stringi@master Ошибка
в loadNamespace(i, c(lib.loc, .libPaths()), versionCheck = vI[[i]]) :
没有包称为“字符串”
options(install.packages.check.source = "no") 也没有帮助
试图进入不同的回购 - 没有希望。

任何猜测我做错了什么？

r stringr stringi

2015-12-10T12:18:46.237

0 投票

4 回答

2212 浏览

r - str_replace "NA" 的意外行为

我正在尝试将字符串转换为数字，但遇到了一些意外行为str_replace。这是一个最小的工作示例：

在我看来，第二个示例应该可以工作，因为它应该只用NA（这是字符向量中的有效值）替换向量中的第二个条目。但它没有：内部str_replace将所有三个条目转换为NA.

这里发生了什么？我浏览了文档str_replace，stri_replace_all但没有看到明显的解释。

编辑：stringr_1.0.0澄清一下，这是stringi_1.0-1在 R 3.1.3、Windows 7 上使用的。

r stringr stringi

2015-12-17T15:10:11.217

0 投票

1 回答

907 浏览

r - 在 R 中使用 stringi 和 stringr 将 utf-8 自动翻译成 ascii - 转义字符 \u 出错

我正在努力将 utf-8 自动翻译成 ascii 字母。

在数据框中，我有以下源自希腊字母的序列：

通过手动将序列转换为

我使用以下命令使用stringi得到了正确的转录：

现在，我想通过stringr自动翻译：

结果是：

不能通过stringi翻译

可能对您提出的问题是如何通过stringr和stringi将原始 utf-8 字符串转换为 ascii 字母，因为在我的数据框中有很多这些字符串序列？

我在 R 上运行 RStudio 版本 0.99.825

RStudio 和 R 作为便携式应用程序运行。

先感谢您

亲切的问候

马库斯

r escaping string-conversion stringr stringi

2015-12-22T10:13:36.207

0 投票

1 回答

153 浏览

regex - （跳过）（失败）使用 stringi 解析错误

我正在阅读/学习The Greatest Regex Trick Ever我们说我们想要一些东西，除非......使用(*SKIP)(*FAIL). 好的，所以我在下面的玩具示例中使用了它，它在基础 R 中工作，但在stringi中有以下错误。我是否需要对stringi做一些不同的事情才能使语法正常工作？

regex r stringi

2016-01-14T22:49:45.417

0 投票

1 回答

62 浏览

regex - R中的正则表达式“吃掉”字符串的一部分

我想将一个字符串分成两组。该字符串的结构非常简单，但我无法使其工作。

它总是一些字母，后跟日期，而日期显然以数字开头。我在https://regex101.com/尝试了以下正则表达式，并有效地正确分隔了字符串：

但是当我在 R 中尝试时它失败了：

如果我引入双方括号，那么它会“吃掉”第一组的最后一个字符，以及第二组的第一个字符：

我是否使用没关系perl=TRUE。如果我使用结果也是一致stringi::stri_split的，所以这是我的正则表达式中的一个问题。

在这种情况下使用的正确正则表达式是什么？

regex r string-split stringi

2016-01-21T22:12:09.773

0 投票

0 回答

64 浏览

r - data.table - “by”中的键与串联列表

我已阅读常见问题解答，但现在仍然清楚在相当大的 data.table 的串联列表中使用键与使用该键的含义是什么？

从我的实验中，我只看到性能，但不确定是否还有其他东西。

两种情况下的输出相同

r data.table stringi

2016-01-22T19:54:29.177

0 投票

2 回答

184 浏览

r - 用字符串替换单词

我正在尝试使用 stringi 替换某些单词stri_replace，但是在替换单词的相似部分时遇到了问题。在下面的示例中，我正在修复三角形的拼写错误，但它似乎变得混乱，因为 'tri' 是 'trian' 的一部分，是 'triangle' 的一部分，它就像 'trainglegle'。我不太熟悉stri_replace，有什么我遗漏的论点吗？谢谢你的帮助。

r nlp stringi

2016-01-29T19:49:25.297

0 投票

0 回答

46 浏览

regex - 基于代码点的字符调试

我有一个从it.dbpedia.org中提取的带有多个编码“错误”的字符向量。事实上，每个重音字符都被错误地渲染为，"\"Democrazia Ã¨ LibertÃ - La Margherita\"@it"而不是\"Democrazia è Libertà - La Margherita\"@it.

我在这里找到了这种编码问题的调试图。我仍然注意到“实际”和“预期”字符之间的关系不是一对一（如我所料）而是一对多。然后我的字符“Ã”可能会翻译为“Á”、“Í”、“Ï”、“Ð”、“Ý”、“à”。换句话说，我不能对实际/预期字符使用模式/替换解决方案。

我可以使用带有 Unicode 代码点/预期字符的模式/替换解决方案吗？如何传递给gsub()unicode 代码点而不是实际字符？

我应该使用包stringi来解决编码问题吗？如何？

更新：我刚刚注意到问题出在源头：SPARQL 的 XML 输出。

注意：与这个未回答的问题有关。

regex r character-encoding stringi

2016-02-27T08:31:18.043

0 投票

2 回答

2906 浏览

regex - 从字符串和文本数据中提取年份

我需要从具有这些性质的值的向量中提取开始年份和结束年份。

我期待这样的输出。有人有建议吗？

regex r lubridate stringi

2016-02-29T21:49:26.680

问题标签 [stringi]

Reference