问题标签 [strsplit]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
271 浏览

regex - 使用 strsplit(...) 将文本向量拆分为 R 块

请帮助我完成我的小项目。

拥有大量文本元素。每个元素都应该被分成一个小的句子列表。每个小列表应作为一个元素“保存”到初始大列表的新列中,与原始文本元素相同的位置(“行”)。

分割标准是"/$", "und/KON", "oder/KON". 这应该保留在新的小列表元素的头部。

我尝试过使用正则表达式,例如"/$|und/KON|oder/KON"转义"$", "|", "/". 我也尝试更改参数perl = TRUEfixed = TRUE并且FALSE。每次我尝试注意都会发生。似乎|没有正确解释。你有什么建议来解决这个问题?

0 投票
1 回答
2879 浏览

regex - R:使用多个正则表达式模式和异常拆分文本

text在句子中拆分字符元素的向量。拆分标准的模式不止一种 ( "and/ERT", "/$")。模式中也有例外(:/$., and/ERT then, ./$. Smiley)。

尝试:匹配应该拆分的情况。"^&*"在那个地方插入一个不寻常的图案 ( )。strsplit具体模式

问题:我不知道如何正确处理异常。在某些明确的情况下,"^&*"应该消除异常模式 (),并在运行之前恢复原始文本strsplit

代码:

0 投票
3 回答
137 浏览

regex - R:仅当特殊的正则表达式条件不匹配时才拆分

仅当在 in之后的一个单词and/ERT中没有被“/V”取代时,您将如何拆分:

0 投票
1 回答
2857 浏览

regex - R: Extract capital letters and special characters with strsplit and perl REGEX syntax

How you would extract only the / with the following capital letters, and the whole [[:punct:]]/$[[:punct:]].

Thank you! :)

0 投票
2 回答
1743 浏览

r - strsplit 成可变数量的列

这是我之前问过的这个问题的后续:R for loop: create a new column with the count of a sub str from a different column

我有一张大桌子(100+ 列,50k+ 行)。其中一列包含以下格式的数据:

我想去:

需要填充的列不止 3 列,我只是将其剥离为示例。我的脚本创建了要填充的适当数量的列,我只需要代码,我假设它是一个 for 循环,将字符串拆分为 'col' on ',',然后将拆分字符串放入后续列中。

谢谢你的帮助!

0 投票
2 回答
3513 浏览

r - strsplit in R: How do I split one-column data separated by comma into multiple columns?

I am reading data from a website: https://raw.github.com/johnmyleswhite/ML_for_Hackers/master/02-Exploration/data/01_heights_weights_genders.csv

(1) At first I attempted to read the data directly into R with the following code:

But I received the following error:

So I simply copied the data into a .csv file. I saved this file as "Raw_Data.csv" in a directory. The data is, however, all in one column.

(2) I read this file into R via the following code

What I would like to do is split this one column into three, with the column names as "Gender", "Height", "Weight". What I tried was this:

However, I get this error:

Thank you in advance for your help!

0 投票
1 回答
601 浏览

arrays - Matlab strsplit错误

我有一个名为 data 的变量,它是一个 5574x1 元胞数组。目前,每个元素都是代表一个句子的字符数组。我想在空格上拆分每个数组。所以我试着这样做:

new_data = {strsplit(data{:})}

Matlab 给了我这个错误:

但是,当我这样做时:

它工作得很好。我似乎无法弄清楚两者之间的区别是什么。为什么第一个不起作用?任何帮助表示赞赏。

0 投票
2 回答
9957 浏览

r - 在R中使用strsplit拆分逗号分隔的混合文本和数字字符串

我有很多形式的字符串,name1, name2 and name3, 0, 1, 2或者name1, name2, name3 and name4, 0, 1, 2想将向量拆分为 4 个元素,其中第一个元素是名称的整个文本字符串。问题是 strsplit 不区分文本和数字,并且在第一种情况下将字符串拆分为 5 个元素,在第二个示例中拆分为 6 个元素。如何告诉 R 动态跳过具有可变名称的字符串的文本部分?

0 投票
1 回答
591 浏览

string - 将逗号分隔的字符串拆分为几列并将 0 分配给 nospace

在我data.frame的一个向量x中,包含以下格式的文本字符串(每个字符串中有六个值(从 0 到 100),用逗号分隔):

这是我遇到问题的实际向量的链接:x.cvs x.cvs

不幸的是,“0”的值被记录为两个逗号之间,或第一个逗号之前,或最后一个逗号之后的“空无空格”。

首先能够将其转换为:

但最重要的是,我想把这个向量分成6个不同的向量x1、x2、x3、x4、x5、x6,每个向量都从字符串中取值,并将逗号之间的“no space”替换为“0” ,例如,结果应该是:

如果逗号之间有一个值,我认为 strsplit() 会起作用,但是由于没有值,甚至没有空格,我不确定在没有得到 NA 的情况下正确的方法是什么。

我尝试了以下方法,但它确实给了我很多错误:

我收到错误...

0 投票
2 回答
1110 浏览

regex - 如何拆分列 | 分成多列

在 R 中:我有一个多行但只有一列的数据框。每行都有一长串字符,周期性地用 | 标记。每次有 | 时我都想拆分字符 标记,以便有很多列。

每个字符串都以日期开头,然后具有与城市相对应的数字。变量名也列成一个字符串,需要用“.”隔开。标记。

非常感谢任何帮助!