问题标签 [stringr]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - 在正则表达式中,神秘错误:断言'tree->num_tags == num_tags'在执行正则表达式时失败:文件'tre-compile.c',第634行
假设将 900 多个公司名称粘贴在一起以使用管道分隔符“firm.pat”形成正则表达式模式。
使用一个名为“bio”的数据框,它有一个名为“comment”的大字符变量(每行 250 行,每行 100 多个单词),我想用空格替换所有公司名称。gsub
调用和调用都str_replace_all
返回相同的神秘错误。
traceback()
没有启发我。
其他三篇帖子提到了 SO 上的神秘错误,一个传递参考并引用了另外两个倾斜参考,但没有讨论。
我知道这个问题缺少可重现的代码,但即便如此,我如何找出错误解释的内容?更好的是,我如何避免抛出错误?少数公司似乎不会出现该错误,但我无法检测到模式或阈值。我正在运行 Windows 8、RStudio、每个包的更新版本。
谢谢你。
regex - r 中的正则表达式。分组和捕获
我正在尝试在 R cran 中使用 regexp,使用 library stringr
。我正在学习str_match
和str_replace
功能。我不明白为什么当我使用括号进行分组时它们会给出不同的结果:
r - 重新建模我的 data.frame/excel 电子表格的形状
这是我在这个论坛上的第一个问题。
我想重新建模我的数据集的结构。我想将“团队”列分成两列。一个是主队,一个是客队。我也想将结果分成两列。主场进球和客场进球。新列的“真实”进球前不应有零。
前
后
R可以为我解决这个问题吗?我需要哪些包?我希望能够为许多具有不同联赛和部门但结构相同的 Excel 电子表格执行此操作。
有人可以帮助我和我的data.frame吗?
regex - 如果字符串 B 包含(但不完全匹配)字符串 A,则将其替换为字符串 C
我有一个match_df
显示“匹配规则”的数据框:该列old
应替换new
为其应用的数据框中的列。
我想在数据框上应用上面的匹配规则working_df
我想要的结果是
这意味着我不是在寻找完全匹配的。我宁愿在working_df$value
包含字符串的任何部分后立即替换整个字符串match_df$old
。
我喜欢R 中发布的解决方案:使用 gsub 替换字符,如何创建函数?,但它仅适用于完全匹配。我尝试了gsub
, str_replace_all
fromstringr
但我找不到适合我的解决方案。SOF 上有很多精确匹配的解决方案,但我找不到一个可以理解的解决方案。
非常感谢任何帮助。
regex - Regex and file processing
This question relates to R but really isn't language specific per se. I have a bunch of csv files with this general format "sitename_03082015.csv". The files have 5 columns and various rows
I ultimately want to read in all the files and merge which I can do but during the merge I want to read the site name and date and add it to each related line so the output looks like this
With my R code I can do the following:
With the below R code I can merge all the files but that will be without the added columns of site name and date that I want.
I just can't get my head around how to do the extracts for site and date adding and populating the columns to create my ideal dataframe which is the second table above.
The solution that best worked for me was posted below :)
r - 在R中提取括号中的文本
两个相关的问题。我有文本数据的向量,例如
并希望轻松地将其分成包含括号外文本的向量:
和一个包含括号内文本的向量:
有什么简单的方法可以做到这一点?另一个困难是这些可能会变得很大并且有大量(无限)括号。因此,我不能简单地抓住括号中的文本“前/后”,需要一个更智能的解决方案。
regex - 从R中的向量中提取子字符串
我正在尝试从非结构化文本中提取子字符串。例如,假设一个国家名称向量:
如何传递此字符值向量以从非结构化文本中提取精确匹配。
在此示例中,所需的输出将是:
到目前为止,我一直在使用gsub
删除所有不匹配项,然后删除然后删除具有空值的行。我也一直在使用str_extract
stringr 包,但没有成功让正则表达式的参数正确。任何帮助将不胜感激!
regex - 用R中的数字函数替换字符串
我有一个字符串向量:
我想将此字符向量中的十进制数转换为百分比数字。我通常使用包stingr
来使用regex
. 所以我的想法是这样的:
这就是我所期望的:
但这是我的输出
r - 在R中根据“^”拆分字符串
我需要拆分并获取之前的所有字符^
示例:我在数据框中有一列读取
并且同一数据框中的结果列应为:
我尝试使用stringr
, strsub{base}
, stringi
, gsubfn
. 但他们抛出了奇怪的结果,因为^
. 我无法更换^
,因为这张桌子实在是太大了。
r - 隔离文本中的特定数值
我有大量文本要在各种属性的文本 csv 文件中进行搜索,以查找属性的平方米数值实际是多少。例如:
我知道我可以使用以下方法来提取数值:
它应该返回一个数字向量'120'。但是,我想知道是否有更复杂的方法来实现这一点,因为文本中可能存在其他不相关的数值?
有没有办法搜索“平方米”并返回它前面的数字?非常感谢您的任何评论。