问题标签 [strsplit]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - 使用 strsplit(...) 将文本向量拆分为 R 块
请帮助我完成我的小项目。
拥有大量文本元素。每个元素都应该被分成一个小的句子列表。每个小列表应作为一个元素“保存”到初始大列表的新列中,与原始文本元素相同的位置(“行”)。
分割标准是"/$"
, "und/KON"
, "oder/KON"
. 这应该保留在新的小列表元素的头部。
我尝试过使用正则表达式,例如"/$|und/KON|oder/KON"
转义"$"
, "|"
, "/"
. 我也尝试更改参数perl = TRUE
,fixed = TRUE
并且FALSE
。每次我尝试注意都会发生。似乎|
没有正确解释。你有什么建议来解决这个问题?
regex - R:使用多个正则表达式模式和异常拆分文本
想text
在句子中拆分字符元素的向量。拆分标准的模式不止一种 ( "and/ERT"
, "/$"
)。模式中也有例外(:/$.
, and/ERT then
, ./$. Smiley
)。
尝试:匹配应该拆分的情况。"^&*"
在那个地方插入一个不寻常的图案 ( )。strsplit
具体模式
问题:我不知道如何正确处理异常。在某些明确的情况下,"^&*"
应该消除异常模式 (),并在运行之前恢复原始文本strsplit
。
代码:
regex - R:仅当特殊的正则表达式条件不匹配时才拆分
仅当在 in之后的一个单词and/ERT
中没有被“/V”取代时,您将如何拆分:
regex - R: Extract capital letters and special characters with strsplit and perl REGEX syntax
How you would extract only the /
with the following capital letters, and the whole [[:punct:]]/$[[:punct:]]
.
Thank you! :)
r - strsplit 成可变数量的列
这是我之前问过的这个问题的后续:R for loop: create a new column with the count of a sub str from a different column
我有一张大桌子(100+ 列,50k+ 行)。其中一列包含以下格式的数据:
我想去:
需要填充的列不止 3 列,我只是将其剥离为示例。我的脚本创建了要填充的适当数量的列,我只需要代码,我假设它是一个 for 循环,将字符串拆分为 'col' on ',',然后将拆分字符串放入后续列中。
谢谢你的帮助!
r - strsplit in R: How do I split one-column data separated by comma into multiple columns?
I am reading data from a website: https://raw.github.com/johnmyleswhite/ML_for_Hackers/master/02-Exploration/data/01_heights_weights_genders.csv
(1) At first I attempted to read the data directly into R with the following code:
But I received the following error:
So I simply copied the data into a .csv file. I saved this file as "Raw_Data.csv" in a directory. The data is, however, all in one column.
(2) I read this file into R via the following code
What I would like to do is split this one column into three, with the column names as "Gender", "Height", "Weight". What I tried was this:
However, I get this error:
Thank you in advance for your help!
arrays - Matlab strsplit错误
我有一个名为 data 的变量,它是一个 5574x1 元胞数组。目前,每个元素都是代表一个句子的字符数组。我想在空格上拆分每个数组。所以我试着这样做:
new_data = {strsplit(data{:})}
Matlab 给了我这个错误:
但是,当我这样做时:
它工作得很好。我似乎无法弄清楚两者之间的区别是什么。为什么第一个不起作用?任何帮助表示赞赏。
r - 在R中使用strsplit拆分逗号分隔的混合文本和数字字符串
我有很多形式的字符串,name1, name2 and name3, 0, 1, 2
或者name1, name2, name3 and name4, 0, 1, 2
想将向量拆分为 4 个元素,其中第一个元素是名称的整个文本字符串。问题是 strsplit 不区分文本和数字,并且在第一种情况下将字符串拆分为 5 个元素,在第二个示例中拆分为 6 个元素。如何告诉 R 动态跳过具有可变名称的字符串的文本部分?
string - 将逗号分隔的字符串拆分为几列并将 0 分配给 nospace
在我data.frame
的一个向量x
中,包含以下格式的文本字符串(每个字符串中有六个值(从 0 到 100),用逗号分隔):
这是我遇到问题的实际向量的链接:x.cvs
x.cvs
不幸的是,“0”的值被记录为两个逗号之间,或第一个逗号之前,或最后一个逗号之后的“空无空格”。
首先能够将其转换为:
但最重要的是,我想把这个向量分成6个不同的向量x1、x2、x3、x4、x5、x6,每个向量都从字符串中取值,并将逗号之间的“no space”替换为“0” ,例如,结果应该是:
如果逗号之间有一个值,我认为 strsplit() 会起作用,但是由于没有值,甚至没有空格,我不确定在没有得到 NA 的情况下正确的方法是什么。
我尝试了以下方法,但它确实给了我很多错误:
我收到错误...
regex - 如何拆分列 | 分成多列
在 R 中:我有一个多行但只有一列的数据框。每行都有一长串字符,周期性地用 | 标记。每次有 | 时我都想拆分字符 标记,以便有很多列。
每个字符串都以日期开头,然后具有与城市相对应的数字。变量名也列成一个字符串,需要用“.”隔开。标记。
非常感谢任何帮助!