问题标签 [stringi]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - 一个字符串中的多个数字
我有以下值(以及数十万个字段中的类似格式):
我想使用stringr
orstringi
和(可能)正则表达式变成
我一直没有成功使用stringi::stri_split_regex
表单的命令
谢谢你。
r - Issue with syllabification and regex
I have a pdf file that I am reading as a text.
The problem I am having has to do with syllabification occurring between numbers.
Link to file on github.
If you search the document, you'll see examples like 530000101378- 659. This is supposed to be a single number 530000101378659.
I've tried different regex versions, but all failed.
This is the remaining code:
In every instance, the output in count is two seperate words
I assume the regex is failing in combining the elements from different lines. But im not sure how to fix it.
Any help is much appreciated.
r - Rstudio如何让stringi包安装工作?一切都很好,直到 dyn.load 失败
在更新到最新版本后机智结束:我的 Ubuntu 16.04LTS 更新/升级、我的 R 版本、我的 Rstudio-server 版本、我的 libicu-dev 版本,验证 anaconda 提供了我的 python 但不是我的 R 语言。还有什么可以帮助的?这个 stringi 包也可能是我的新问题的根源(以前没有问题)无法创建 r markdown 文档(看起来像 Knittr 使用 stringi),使用 R 语言的 jupyter notebook,无法安装ggplot2等
g++ 已经是最新版本(4:5.3.1-1ubuntu1)
libicu-dev 已经是最新版本(55.1-7ubuntu0.2)
这是 rstudio 控制台输出(长):
...(剪断)...
是否有其他一些诊断方法可以尝试?顺便说一句,stringi 在 R3.3 中运行良好,但现在我有了 R3.4。
r - 如何从r中的文本文件中提取文本的特定部分?
我有很多包含下面给出的文本的文本文件。
\\论文:hep-th/9201003
发件人:DIJKGRAAF%IASNS.BITNET@pucc.PRINCETON.EDU
日期:美国东部时间 92 年 1 月 2 日星期四 14:06 (54kb)
标题:交集理论、可积层次和拓扑场论
作者:罗伯特·迪克格拉夫
评论:73 页,大部分数字未收录。1991 年 7 月 16 日至 27 日在 Cargese 暑期学校就“量子场论中的新对称原理”进行的讲座。
\\ 在这些讲义中,我们回顾了关于黎曼曲面模空间的交集理论、KdV 类型的可积层次、矩阵模型和拓扑量子场论之间的各种关系。我们特别解释了为什么 Kontsevich 所考虑的矩阵积分类型自然地表现为与最小模型相关的 tau 函数。我们的出发点是拓扑 (p,1) 模型的字符串方程的极其简单的形式,其中所谓的 Baker-Akhiezer 函数由(广义)Airy 函数给出。\\
我有 10 个文件夹,范围从 1992 年到 2003 年。每个文件夹都包含数千个文件。每个文件都有上面给出的结构。我想提取每个文件的最后一部分并保存在新文件中。这部分是论文的摘要。每个文件都有不同的摘要。我已经为我的问题编写了以下代码,但无法获得目标。
r - 如何替换字符串中的匹配项并索引每个匹配项
一个特定的字符串可以包含我试图匹配的模式的多个实例。例如,如果我的模式是<N(.+?)N>
并且我的字符串是"My name is <N Timon N> and his name is <N Pumba N>"
,那么就有两个匹配项。我想用包含要替换匹配项的索引的替换项替换每个匹配项。
所以在我的字符串"My name is <N Timon N> and his name is <N Pumba N>"
中,我想将字符串更改为读取"My name is [Name #1] and his name is [Name #2]"
。
我该如何做到这一点,最好使用单个功能?最好使用stringr
or中的函数stringi
?
r - 用 1 个打印对替换或删除多个反斜杠
如何用一个反斜杠替换多个反斜杠?我知道在一个字符串中,一个反斜杠表示\\
为如下所示:
所以我想替换替换这个字符串中的所有反斜杠:'thre\\\\fd'
用一个(打印为两个),当用 cat 包裹时会产生:thre\fd
。我认为stringi包有一种方法可以轻松地做到这一点,但不知道怎么做。
MWE(不正确的输出)
所需的分类输出
r - stringi 包中 stringr::word 的等效函数
我浏览了包手册以找到与包stringi
中的功能等效的功能,但找不到。我正在寻找它的原因是因为我想为我的语言环境设置排序选项并且没有给我所有的选项。stringi 包中是否有与包中的 word() 函数相同的函数?请参阅下面的示例,我想要在单词“José”之后的下三个单词,以不同的方式书写。在包中,该函数允许为允许的排序强度设置参数,因此所有形式的“José”都会被考虑在内。word()
stringr
stringr
stringi
stringr
stringi
stri_opts_collator
strength=1
使用stringi
,我可以提取所有形式的“José”:
我想做这样的事情:
r - 如何使用 stringi 包删除数据框中的字符?
我目前有一个股票 KPI 数据框,我想从数据中删除“$”字符。但是,除了强制使用stringi包之外,我只能使用一行代码。查看文档,“ stri_replace_all_fixed ”是让我印象深刻的函数,但在运行该函数时,我的数据框失去了格式。我尝试将lapply和stri_replace_all_fixed函数结合起来无济于事。关于如何解决这个问题的指针将不胜感激。
r - R Studio 安装 stringi 失败
我正在尝试调用knit
which 告诉我它需要更新版本,rmarkdown
它需要 package stringi
。
安装时stringi
出现以下错误:
我该如何解决这个问题,这样我才能最终knit
平静.RMD
下来?
编辑(解决方案):
- 从以下位置下载 Windows 二进制文件(r-release:stringi_1.1.6.zip)
https://cran.r-project.org/web/packages/stringi/index.html
- 安装方式
> install.packages(".../Downloads/stringi_1.1.6.zip", repos = NULL, type = "source")