问题标签 [strsplit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
3 回答
1223 浏览

r - 当可能的输出已知时加速`strsplit`

我有一个带有因子列的大型数据框,我需要通过分隔符将因子名称拆分为三个因子列。这是我目前的方法,对于大型数据框(有时数百万行)非常慢:

有什么办法可以加快这个操作?我注意到每个类别“物种”、“大小等级”和“受感染”的数量都很少(<5),我提前知道这些是什么。

笔记:

  • stringr::str_split_fixed执行此任务,但不会更快
  • 数据框实际上最初是通过调用reshape::melt一个数组生成的,其中Class及其关联的级别是一个维度。如果有更快的方式从那里到达这里,那就太好了。
  • data.rdshttp://dl.getdropbox.com/u/3356641/data.rds
0 投票
2 回答
436 浏览

r - R:我必须在 String 中进行 Softmatch

我必须在一列数据框中使用给定的输入字符串进行软匹配,例如

我想从提供的列名“col”中检索“John Collingson”和“J Collingson”

请帮助

0 投票
1 回答
333 浏览

r - R:如何将一个单元格中的字符串分成连续的几个单元格?

我有以下数据

一个单元格中的字符串,并且每行中字符串的长度不同

我想要以下结果

一个单元格中的一个词

有人可以帮忙吗?

0 投票
4 回答
4942 浏览

r - 从字符串中删除某些模式

我有一个如下所示的向量:

我想将其转换为:

那就是我想从我的字符串向量中删除数字和单个字符。

任何帮助将不胜感激。

0 投票
2 回答
128 浏览

r - Strsplit后,输出不是预期的格式

我的名为“locaddr”的输入文件有以下记录:

我使用以下代码将 R 中的 STRSPLIT 函数应用于此文件:

我得到的最终输出是:

从上面可以明显看出,所需的输出是每条记录中的最后三个术语。但相反,我几乎混合了那里的所有东西。

我的要求是,虽然地址都是可变长度的,但在 STRSPLIT 之后,我只需要选择最后三个术语并将它们输入为 Street, City Country。

非常感谢您的帮助和时间。

0 投票
3 回答
672 浏览

regex - 拆分字符串而不丢失字符

我希望在某个字符处拆分字符串,同时将该字符保留在第二个结果字符串中。我可以实现几乎所有所需的操作,除了我丢失了我在 中指定的字符strsplit,我猜这被称为分隔符。

有没有办法要求strsplit保留分隔符?或者我必须使用某种正则表达式吗?谢谢你的任何建议。这似乎是一个非常基本的问题。对不起,如果它是重复的。我更喜欢使用base R。

这是一个显示我到目前为止的示例:

0 投票
2 回答
2566 浏览

r - 当一个变量实际上是两列时,expand.grid

我有一个包含地区、县和年份的数据集。如果给定的区/县组合出现在任何一年,我希望该组合在每年都出现。以下是我想出的两种方法。第一种方法使用一个函数来创建区、县和年的组合,并且只需要六行代码。底部方法使用 , 和 的组合pasteexpand.grid并且strsplit更加复杂/复杂。

可能有比上述任何一种方法更有效的方法。例如,有没有一种方法expand.grid可以实现区/县/年组合,可能只需要 1 或 2 行代码?

谢谢你的任何建议。我的功能可以完成这项工作,但这个问题对我来说是一个学习机会。我更喜欢base R。

这是示例数据集:

这是期望的结果:

这是迄今为止我最直接的解决方案,它使用一个函数来表示每年的每个区/县组合:

这是我最初的、更复杂的解决方案:

0 投票
3 回答
328 浏览

r - 在R中拆分字符串,不同的拆分参数元素

我导入了一些没有列名的数据,所以现在我有超过一百万行和 1 列(而不是 5 列)。

每行的格式如下:

并得到

我知道这与回收 split 参数有关,但我似乎无法弄清楚如何得到我想要的:

每一行作为第五个元素都有不同的消息,但在第四个元素之后,我只想将字符串的其余部分保持在一起。

任何帮助,将不胜感激。

0 投票
1 回答
6764 浏览

r - 字符向量上的“下标越界”

我有一个向量“nameAlpha”,例如 c("Mark Twain", "Phil Hall", "Michael P. O'Connor", " ",...)。我想将每个名字传递给另一个向量“nameAlpha_first”。我运行这个

但我明白了

可能是因为向量的元素很少是空的吗?我如何移动来修复它?

0 投票
2 回答
162 浏览

regex - R:一个命令中从字符串到二维数据帧的正则表达式?

我有一个包含此类键值对的字符串 s,我想从中构造数据框,

是什么赋予了:

首先,我希望在使用正则表达式后没有 NA 和 ""。我认为它应该类似于 {2,} 表示从第二次出现匹配所有内容,但我不能在 R 中做到这一点。

我想做的另一个想法是:拥有一个带有如下列的数据框:

我想遍历每一行并将其数值拆分为由键命名的列。

显示几行的示例,我希望它看起来像:

在此处输入图像描述