问题标签 [grepl]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R:使用 grepl,如何仅列出正确的
我有一个数据列表,我试图将它们分成 AM 和 PM 组。
我做了
它将我的列表分成 AM/PM 组。但是,我只想查看那些评估为的TRUE
(即 PM)。
有人有什么主意吗?
r - 如何将表条目与 R 中的第二个表的列表条目匹配?
我有两个表,table1 有一列字符串。我想在另一个表 table2 中找到每个字符串的匹配项,但在相应的 table2 列中,每个单元格都包含每个行条目的列表。
到目前为止,我已经弄清楚如何使用 grepl 来匹配特定的条目:
对于某些 i、j 和 k。i 和 j 是固定的,因为它们分别是表 1 和表 2 中的行数,但 k 是一些正值,所以我有这样的东西:
我不太确定要为 k 循环放什么。
一旦我确定了包含 table1 字符串的 table2 行,我想做的是报告来自不同 table2 列的相应值并将这些值附加到 table1 中的相应字符串行,所以我猜我'将需要更多的 for 循环......是否有诸如此类的多个引用问题的快捷方式?
一些示例数据(请注意,table2 列表中也缺少值,但我假设在匹配这些值时会被忽略,其他条目是字符类):
表格1
表 2(更新)
输出
表格1
从使用dput
我得到
附录:关于我最初使用的grepl
,Table2中的一些标签与Table1中的标签只有部分匹配,但名称在Table1中是唯一的,所以我想申请匹配Table1标签,例如Graham
(Table1)到Graham
(Table2) 和Graham Green
(Table2) 例如
表 2(版本 2)
输出 Table1 将是相同的。
r - 如何在 grepl 函数中的 R 中进行 perl 正则表达式匹配?
我在 R 中有一个函数,它使用 grepl 命令如下:
这似乎不起作用 - 'x' 输入是一个字符类型字符串(一个句子),我想在匹配时围绕 'x' 创建单词边界,因为我不希望该术语拉出我正在搜索的表中包含一些类似术语的其他术语。
有什么建议么?
r - 过滤具有特定后缀的行
我在一个名为 df 的表中有 12 列数据,第一列包含数千个字符串,例如AA150502-01, AA150502-02, BB150502-01, BB150502-03, etc
.
我想过滤表格,以便只看到以 suffix 结尾的行"-01"
,我该怎么做?
到目前为止,我有:
我需要对 . 之前的前缀使用某种通配符"-01"
。
r - 如何在数据框的其他列中的一列中搜索字符串
我有一个表格,叫它 df,有 3 列,第一个是产品的标题,第二个是产品的描述,第三个是一个单词字符串。我需要做的是在整个表上运行一个操作,创建 2 个新列(称它们为“exists_in_title”和“exists_in_description”),它们的值为 1 或 0,表示第 3 列是否存在于第 1 列或第 2 列中。我需要它只是一个 1:1 的操作,例如,调用第 1 行“A”,我需要检查单元格 A3,是否存在于 A1 中,并使用该数据创建列 exists_in_title,然后检查是否 A3存在于 A2 中,并使用该数据创建列 exists_in_description。然后移动到 B 行并进行相同的操作。我有数千行数据,因此一次 1 次执行这些数据是不现实的,
我玩过 grepl、pmatch、str_count,但似乎没有一个能真正满足我的需要。我认为 grepl 可能是最接近我需要的,这是我编写的两行代码的示例,它们在逻辑上可以按照我的意愿执行,但似乎没有用:
但是,当我运行它们时,我收到以下消息,这使我相信它无法正常工作:“参数'模式'的长度 > 1,并且只会使用第一个元素”
任何有关如何做到这一点的帮助将不胜感激。谢谢!
r - 在 R 中使用 grepl
在哪些情况下,这两种不同的实施方式会产生不同的结果?
如果这些方法总是给出相同的结果,那么推荐哪种方法?为什么?谢谢
r - 如何在R中更改部分字符串
我有一个关于 R 中的字符串操作的问题。我有一个包含两列的数据框:
我想将NAME列中包含单词“test”的所有案例更改为一个名称 - 例如“TEST”。我准备了如下代码,但它不起作用 - 没有找到应有的情况。NAME 变量中的观察没有任何特定的模式。你能告诉我如何解决吗?
regex - Extracting users from twitter status in R. Non-trivial cases like RT@user @user:
I want to extract usernames from a tweet where these usernames may be:
- followed by some non-alphanumerical characters.
- not preceded by a white space.
For instance, from this:
I would like to get a vector like
(with or without the "@")
This is my current script:
How can I do it properly?
r - R:选择一个或,但不能同时选择
我对编码完全陌生,所以如果这应该很容易解决或找到,请原谅我 - 也许它是如此简单以至于到目前为止没有人费心解释,或者我只是没有使用正确的关键字进行搜索。
我的数据集中有一列包含所有可能组合的字母 f、n、i。现在我只想找到那些包含 f 或 n 的行,但不能同时包含它们。所以这可能是 f,或 fi,或 n,或 ni。然后我想在箱线图中比较这两组行。所以理想情况下我会有两个盒子:一个包含属于组 f 的所有数据点,包括 fi,另一个包含属于组 n 的所有数据点,包括 ni。
我的数据集示例:
现在我想要得到的是这个子集:
然后以某种方式在一组中分别有 1、2、3 和 4、5、6,以绘制在箱线图中。
到目前为止,我只成功地获得了一个子集,它只有 f 或 n 的条目,但没有 fi、ni 等,这不是我想要的,使用以下代码:
并创建一个包含所有不同组的子集,其中包含 f 和 n:
我读到了“异或”运算符 xor 但是当我尝试像这样使用它时:
它只是给了我一个充满 NA 的数据框。但即使这确实有效,我想我也只能制作一个包含四个组 f、n、fi 和 ni 的箱线图,我只想要两个组。那么我怎样才能让该代码工作,我该如何从那里继续呢?
我希望这对于第一个问题来说不会太糟糕!在这上面花了太多时间后,我有点睡眼惺忪。非常感谢任何关于我的问题、在哪里寻找答案或如何改进问题的帮助!
regex - 使用 grepl 从模式列表中查找匹配模式
我使用 grepl 来检查字符串是否包含一组模式中的任何模式(我使用 '|' 来分隔模式)。反向搜索没有帮助。如何识别匹配的模式集?
附加信息:这可以通过编写一个循环来解决,但它非常耗时,因为我的集合有 > 100,000 个字符串。可以优化吗?
例如:让字符串为a <- "Hello"