问题标签 [stringi]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
72 浏览

r - 使用键迭代替换字符串中的文本

我正在寻找使用键迭代替换字符串中的文本。我有下面的代码,但我想知道是否有更简单或更有效的方法来做到这一点

0 投票
5 回答
16151 浏览

r - 安装包“stringr”和“stringi”的退出状态非零

请帮我在 R 中安装 stringr 和 stringi 包。结果是:

我已尝试遵循链接中的建议我应该如何处理“package 'xxx' is not available (for R version xyz)”警告?,结果是下一个(不是肯定的):

  1. 名字没问题
  2. 只需设置所有可能的存储库
  3. 包当然在存储库中
  4. 'stringr' 当然是一个包
  5. 我的 R 没有过时,我最近升级到 3.2.0 版本
  6. 'stringr' 不是存档包
  7. 这没有给出积极的结果:

    install.packages("stringr", type = "source")
    将包安装到 'C:/Users/kozlovpy/Documents/R/win-library/3.2'
    (因为 'lib' 未指定)
    还安装依赖项 'stringi'

    пробую URL ' https://mran.revolutionanalytics.com/snapshot/2015-08-27/src/contrib/stringi_0.5-5.tar.gz '
    内容类型 'application/octet-stream' 长度 3639183 字节 (3.5 MB )
    已下载 3.5 MB

    пробую URL ' https://mran.revolutionanalytics.com/snapshot/2015-08-27/src/contrib/stringr_1.0.0.tar.gz ' 下载
    内容类型 'application/octet-stream' 长度 34880 字节 (34 KB)
    34 KB

    • 安装包 'stringi' ...
      ** пакет 'stringi' удачно распакован, MD5 sums проверены
      Предупреждение: работающая команда 'sh ./configure.win' имеет статус 127
      ERROR' 包配置失败:
    • 删除“C:/Users/kozlovpy/Documents/R/win-library/3.2/stringi”
      错误:依赖项“stringi”不适用于包“stringr”
    • 删除 'C:/Users/kozlovpy/Documents/R/win-library/3.2/stringr'

    Скачанные исходники пакетов находятся в
    'C:\Users\kozlovpy\AppData\Local\Temp\RtmpgnfwL4\downloaded_pa​​ckages'
    Предупреждения:
    1: работающая команда/R/R/x/64-3-2~1.2~1~1 '" C:\Users\kozlovpy\AppData\Local\Temp\RtmpgnfwL4\downloaded_pa​​ckages' R"
    CMD INSTALL -l "C:\Users\kozlovpy\Documents\R\win-library\3.2"
    C:\Users\kozlovpy\AppData\Local\Temp\RtmpgnfwL4/downloaded_pa​​ckages/stringi_0.5-5.tar.gz ' имеет статус 1
    2: В install.packages("stringr", type = "source") :
    установка пакета 'stringi' имеет ненулевой статус выхода
    3: работающая команда '"C:/PROGRA 1.2/bin/x64/R"
    CMD INSTALL -l "C:\Users\kozlovpy\Documents\R\win-library\3.2"
    C:\Users\kozlovpy\AppData\Local\Temp\RtmpgnfwL4/downloaded_pa​​c
    kages/stringr_1.0.0.tar.gz' имеет статус 1
    4: В install.packages("stringr", type = "source") :
    установка пакета 'stringr' имеет ненулевой статус выхода

  8. Github 包显示下一个:

    install_github("hadley/stringr")
    下载 github repo hadley/stringr@master Ошибка
    в loadNamespace(i, c(lib.loc, .libPaths()), versionCheck = vI[[i]]) :
    没有名为' stringi'
    install_github("Rexamine/stringi")
    下载 github repo Rexamine/stringi@master Ошибка
    в loadNamespace(i, c(lib.loc, .libPaths()), versionCheck = vI[[i]]) :
    没有包称为“字符串”

  9. options(install.packages.check.source = "no") 也没有帮助

  10. 试图进入不同的回购 - 没有希望。

任何猜测我做错了什么?

0 投票
4 回答
2212 浏览

r - str_replace "NA" 的意外行为

我正在尝试将字符串转换为数字,但遇到了一些意外行为str_replace。这是一个最小的工作示例:

在我看来,第二个示例应该可以工作,因为它应该只用NA(这是字符向量中的有效值)替换向量中的第二个条目。但它没有:内部str_replace将所有三个条目转换为NA.

这里发生了什么?我浏览了文档str_replacestri_replace_all但没有看到明显的解释。

编辑:stringr_1.0.0澄清一下,这是stringi_1.0-1在 R 3.1.3、Windows 7 上使用的。

0 投票
1 回答
907 浏览

r - 在 R 中使用 stringi 和 stringr 将 utf-8 自动翻译成 ascii - 转义字符 \u 出错

我正在努力将 utf-8 自动翻译成 ascii 字母。

在数据框中,我有以下源自希腊字母的序列:

通过手动将序列转换为

我使用以下命令使用stringi得到了正确的转录:

现在,我想通过stringr自动翻译:

结果是:

不能通过stringi翻译

可能对您提出的问题是如何通过stringrstringi将原始 utf-8 字符串转换为 ascii 字母,因为在我的数据框中有很多这些字符串序列?

我在 R 上运行 RStudio 版本 0.99.825

RStudio 和 R 作为便携式应用程序运行。

先感谢您

亲切的问候

马库斯

0 投票
1 回答
153 浏览

regex - (跳过)(失败)使用 stringi 解析错误

我正在阅读/学习The Greatest Regex Trick Ever我们说我们想要一些东西,除非......使用(*SKIP)(*FAIL). 好的,所以我在下面的玩具示例中使用了它,它在基础 R 中工作,但在stringi中有以下错误。我是否需要对stringi做一些不同的事情才能使语法正常工作?

0 投票
1 回答
62 浏览

regex - R中的正则表达式“吃掉”字符串的一部分

我想将一个字符串分成两组。该字符串的结构非常简单,但我无法使其工作。

它总是一些字母,后跟日期,而日期显然以数字开头。我在https://regex101.com/尝试了以下正则表达式,并有效地正确分隔了字符串:

但是当我在 R 中尝试时它失败了:

如果我引入双方括号,那么它会“吃掉”第一组的最后一个字符,以及第二组的第一个字符:

我是否使用没关系perl=TRUE。如果我使用结果也是一致stringi::stri_split的,所以这是我的正则表达式中的一个问题。

在这种情况下使用的正确正则表达式是什么?

0 投票
0 回答
64 浏览

r - data.table - “by”中的键与串联列表

我已阅读常见问题解答,但现在仍然清楚在相当大的 data.table 的串联列表中使用键与使用该键的含义是什么?

从我的实验中,我只看到性能,但不确定是否还有其他东西。

两种情况下的输出相同

0 投票
2 回答
184 浏览

r - 用字符串替换单词

我正在尝试使用 stringi 替换某些单词stri_replace,但是在替换单词的相似部分时遇到了问题。在下面的示例中,我正在修复三角形的拼写错误,但它似乎变得混乱,因为 'tri' 是 'trian' 的一部分,是 'triangle' 的一部分,它就像 'trainglegle'。我不太熟悉stri_replace,有什么我遗漏的论点吗?谢谢你的帮助。

0 投票
0 回答
46 浏览

regex - 基于代码点的字符调试

我有一个从it.dbpedia.org中提取的带有多个编码“错误”的字符向量。事实上,每个重音字符都被错误地渲染为,"\"Democrazia è Libertà - La Margherita\"@it"而不是\"Democrazia è Libertà - La Margherita\"@it.

我在这里找到了这种编码问题的调试图。我仍然注意到“实际”和“预期”字符之间的关系不是一对一(如我所料)而是一对多。然后我的字符“Ô可能会翻译为“Á”、“Í”、“Ï”、“Д、“Ý”、“à”。换句话说,我不能对实际/预期字符使用模式/替换解决方案。

我可以使用带有 Unicode 代码点/预期字符的模式/替换解决方案吗?如何传递给gsub()unicode 代码点而不是实际字符?

我应该使用包stringi来解决编码问题吗?如何?

更新:我刚刚注意到问题出在源头:SPARQL 的 XML 输出。

注意:与这个未回答的问题有关。

0 投票
2 回答
2906 浏览

regex - 从字符串和文本数据中提取年份

我需要从具有这些性质的值的向量中提取开始年份和结束年份。

我期待这样的输出。有人有建议吗?