问题标签 [stringr]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
3888 浏览

html - 如何将“”字符更改为 R 中的普通空格

我正在使用 R 进行网络抓取,并且我有一个脚本可以复制链接的文本,然后使用此字符串使用 RSelenium 跟踪链接。不幸的是,当我运行脚本时,这似乎不适用于一个特定的字符串,但是当我用手动输入的字符串替换保存的字符串时,它工作正常。稍微深入研究一下页面的 html,就会发现其中一个空格字符实际上是一个字符,这就是字符串无法匹配的原因。如何用 R 中的普通空格替换?我尝试使用 stringr 库和 str_replace 命令,如下所示:

但这似乎不起作用。有什么我明显做错了吗?有没有办法让 R 显示一个字符串,其中所有奇怪的格式字符都可见?

0 投票
3 回答
402 浏览

regex - 用不同的替换顺序替换字符串中匹配单个模式的多个位置

使用stringr包,很容易以向量化的方式执行正则表达式替换。

问题:我该如何执行以下操作:

替换每个单词

不同的替代品,例如增加数量

请注意,不能假设简单的分隔符,实际用例更复杂。


stringr::str_replace_all似乎不起作用,因为它

为应用于所有单词的每个替换生成一个向量,或者它具有不确定和/或重复的输入条目,因此

将无法达到目的。

0 投票
1 回答
1339 浏览

regex - stringr 包中的 Perl 正则表达式

perl()函数在最新版本的 stringr 中被弃用,取而代之的是regex(). 但是,我似乎无法复制早期的行为。

要将字符串向量的第一个字母大写,这曾经有效:

但是,这不再有效:

但是使用 base R 可以:

有没有办法用 stringr 包做到这一点?

0 投票
1 回答
191 浏览

regex - RegEx 和 stringr 包

我是一个 R 新手,我的编程作业遇到了麻烦。

输入是一首诗:

现在我需要提取所有大写字母并将它们组合成一个单词。我正在使用以下代码执行此操作:

然后我取消列出poem_cap

下一个合乎逻辑的步骤是应用str_c

但是 R 一直在输出不同的字母!如果我复制 的输出one_word2,用逗号分隔并应用于str_c输出,它可以工作:

为什么会这样?我犯了一个错误吗?我如何转变为我可以使用的one_word2东西?str_c

0 投票
2 回答
71 浏览

r - 如何删除一行,字符串以空格开头?

我的数据集如下

我想删除以“”开头的字符串

所以结果变量将是

我用过

获取具有“”的行

请帮助我有什么有效的方法来删除它?

0 投票
1 回答
140 浏览

regex - 使用 stringr 和 regex 将解析的语料库转换为数据框

我正在尝试使用 stringr 和正则表达式将已解析的语料库转换为 R 中的数据框(我已经读过也许我不应该将正则表达式用于此类工作,但我花了很多时间在这我想知道是否有解决方案)。语料库看起来像这样:

我已经接近了我想要使用的东西:

问题是我只想要出现在等之间的东西,<w type = \"\"不是那些字符本身,所以像这样(对于前两个词):

再次,理解我应该学习,比如说,XML这种数据的包,我可以用正则表达式得到我想要的吗?

0 投票
1 回答
5213 浏览

r - 无法安装包 Stringr

我试图在 R 中安装 stringr 包但失败了。

我试图检查这一点,但我不知道需要做什么如何从存档安装 stringi 库并安装本地 icu52l.zip

我刚刚运行了这段代码,但无济于事。

0 投票
2 回答
243 浏览

r - 使用 R 识别字符串中连续出现的特定字母的延伸

我想确定下面数据框中的字符串列是否在字符串的前 20 个字符内重复字母“V”或“G”至少 5 次。

样本数据:

例如,第一行中的字符串在前 20 个字符位置内具有“VVVVG”。同样,第三行中的字符串具有“VVGGV”。

所需的输出应如下所示:

0 投票
1 回答
687 浏览

r - 字符串匹配记录以计算数据框中的所有实例

我正在尝试从数据框中符合某些条件的行中提取所有字符串,例如每行中有多少单词匹配“玉米”。这是输入。

我正在尝试获得这样的输出

0 投票
1 回答
1523 浏览

regex - 对许多记录使用 str 替换删除 json 文档中的部分字符串

我想替换此文件中导致无效 json 参数的字符串。我可以手动删除第一个字符串“_id”:ObjectId(“539163d7bd350003”),并可以将此json转换为数据框。有没有办法可以用 str_replace 之类的函数替换 json 文件的所有实例。我尝试了以下但无法使其工作。有什么建议么?