“re”的相关标签问题_Stack Overflow中文网

0 投票

4 回答

209 浏览

python - 正则表达式从字符串中提取用户名/名称

我的字符串包含名称，有时在字符串中包含用户名，后跟日期时间戳：

我想从此字符串中提取用户名：

我尝试了不同的正则表达式模式，最接近我提取的是：

使用以下正则表达式模式：

2020-04-11T10:09:01.740

0 投票

1 回答

63 浏览

python - 正则表达式模式在英语 POS 标记语料库中查找后缀、结束引号和单词的所有匹配项

我正在从事一个 NLP 项目，在该项目中，我得到了一个 POS 标记的句子数据集。数据集的格式（也应提供例句）是

（'单词'，'pos_tag'）

除非这个词有一个单引号（像 're,'s,n't 和结尾引号的 '' 这样的词缀）在这种情况下格式是

（“单词”，“pos_tag”）

我用来处理这个数据集的代码段如下

该模式由两个要检测的模式 cond1|cond2 组成。

cond1 匹配并提取语料库中的所有单词。

cond2 旨在匹配 '', n't, 's 和 're，它们包含在双引号中，就像我之前提到的那样，但第二个条件不起作用。

期望的结果是所有 post 标记令牌的列表

有人可以提供正确的正则表达式模式来检测我提到的案例吗？

以下是要解析的包含 're, n't, 's 和 '' 的例句

[('We', 'PRP'), ("'re", 'VBP'), ('talking', 'VBG'), ('about', 'IN'), ('years', 'NNS' ), ('ago', 'IN'), ('before', 'IN'), ('anyone', 'NN'), ('heard', 'VBD'), ('of', 'IN' ), ('asbestos', 'NN'), ('have', 'VBG'), ('any', 'DT'), ('questionable', 'JJ'), ('properties', 'NNS' ), ('.', '.')]

[(' ', ''), ('我们', 'PRP'), ('有', 'VBP'), ('没有', 'DT'), ('有用的', 'JJ'), ('信息' , 'NN'), ('on', 'IN'), ('whether', 'IN'), ('users', 'NNS'), ('are', 'VBP'), ('at' , 'IN'), ('risk', 'NN'), (',', ','), ("''", "''"), ('said', 'VBD'), (' T -1', '-NONE-'), ('James', 'NNP'), ('A.', 'NNP'), ('Talcott', 'NNP'), ('of', 'IN '), ('Boston', 'NNP'), ("'s", 'POS'), ('Dana-Farber', 'NNP'), ('Cancer', 'NNP'), ('Institute' ,'NNP'), ('.', '.')]

[('The', 'DT'), ('US', 'NNP'), ('is', 'VBZ'), ('one', 'CD'), ('of', 'IN') , ('the', 'DT'), ('few', 'JJ'), ('industrialized', 'VBN'), ('nations', 'NNS'), ('that', 'WDT') , (' T -7', '-NONE-'), ('does', 'VBZ'), ("n't", 'RB'), ('have', 'VB'), ('a ', 'DT'), ('higher', 'JJR'), ('standard', 'NN'), ('of', 'IN'), ('regulation', 'NN'), ('for ', 'IN'), ('the', 'DT'), ('smooth', 'JJ'), (',', ','), ('needle-like', 'JJ'), ( '纤维'，'NNS'), ('such', 'JJ'), ('as', 'IN'), ('crocidolite', 'NN'), ('that', 'WDT'), (' T-1', '-NONE-'), ('are', 'VBP'), ('classified', 'VBN'), ('*-5', '-NONE-'), ('as', 'IN'), ('两栖动物', 'NNS'), (',', ','), ('according', 'VBG'), ('to', 'TO'), ('Brooke', 'NNP'), ('T.', 'NNP'), ('Mossman', 'NNP'), (',', ','), ('a', 'DT'), ('professor' , 'NN'), ('of', 'IN'), ('pathology', 'NN'), ('at', 'IN'), ('the', 'DT'), ('University' , 'NNP'), ('of', 'IN'), ('Vermont', 'NNP'), ('College', 'NNP'), ('of', 'IN'), ('Medicine' , 'NNP'), ('.', '.')]

[(' ', ''), ('What', 'WP'), (' T -14', '-NONE-'), ('matters', 'VBZ'), ('is', 'VBZ'), ('what', 'WP'), ('advertisers', 'NNS'), ('are', 'VBP'), ('paying', 'VBG'), (' T -15', '-NONE -'), ('per', 'IN'), ('page', 'NN'), (',', ','), ('and', 'CC'), ('in', ' IN'), ('that', 'DT'), ('department', 'NN'), ('we', 'PRP'), ('are', 'VBP'), ('doing', ' VBG'), ('fine', 'RB'), ('this', 'DT'), ('fall', 'NN'), (',', ','), ("''","''"), ('said', 'VBD'), (' T -1', '-NONE-'), ('先生', 'NNP'), ('Spoon', 'NNP') , ('.', '.')]

感谢并感谢所有回答和帮助的尝试

python regex nlp pos-tagger re

2020-04-11T10:14:13.130

0 投票

4 回答

1110 浏览

python - 在数字和字符串python之间添加空格

我想在数字和文本之间添加空格

示例字符串：ABC24.00XYZ58.28PQR

输出：ABC 24.00 XYZ 58.28 PQR

请让我知道答案。

非常感谢。

python regex string re

2020-04-13T08:42:08.723

0 投票

1 回答

1405 浏览

python - 如何在不使用单独的替换函数的情况下循环正则表达式匹配并进行替换？

我需要替换每个模式，例如：{foo}通过FOO+ 增加的数字，以及do_something_else(...)每个匹配。例子：

'hell{o} this {is} a t{est}'=>hellO1 this IS2 a tEST3

如何在不使用替换功能的情况下做到这一点，而只是在匹配上循环？我正在寻找类似的东西：

以下代码（带有替换函数）有效，但在这里使用全局变量是一个大问题，因为实际上do_something_else()可能需要几毫秒，并且此过程可能与另一个并发运行混合main()：

python regex re

2020-04-13T13:32:25.670

0 投票

2 回答

92 浏览

python - 使用正则表达式的 Python 中的空格后跟括号（非惰性）

我正在尝试执行以下操作：从字符串列表中提取第一次出现（可能有多个）空格之前的任何内容，然后是圆括号“（”。

我尝试了以下方法：

但它给出了例如以下字符串的扭曲结果：

Carrollton（西乔治亚大学）[2]*Dahlonega（北乔治亚学院和州立大学）[2]

提前致谢

python regex regex-greedy re

2020-04-13T14:45:59.187

0 投票

1 回答

51 浏览

python - 解析带有两个分隔符的字符串 [[, {{

解析此字符串时：

m.split(';;')应该给出这个：

代替：

如何修改拆分来做到这一点？

python regex re

2020-04-13T19:03:51.043

0 投票

2 回答

270 浏览

python - Python正则表达式排除几个单词

我尝试搜索 URLS 并希望排除一些。在变量 download_artist 中，我存储了基本 URL 和 wanto 以查找其他链接，但没有上传、收藏、关注或收听。

所以我用提到的单词和 | 尝试了不同的版本。像：

或者：

但它忽略了我的 ^ 排除单词。我的错误在哪里？

python regex re

user6808121

2020-04-14T18:28:38.893

0 投票

2 回答

86 浏览

python - Python正则表达式从字符串中获取数据

我正在编写我的第一个 Python 重新代码，我对正则表达式有一些疑问。我有一个变量，其中包含

我需要提取：

并将字符串转换为删除所有空格的字符串列表

相似地

删除空格并转换为列表

该字符串中的所有其他剩余数据不应匹配。

我的代码：

此代码正在运行，但我在正则表达式中遇到问题。我当前的输出：

有的请帮帮我。

怎么写RE？

python regex python-3.x re

2020-04-15T08:24:10.977

0 投票

3 回答

65 浏览

python - 重复使用相同的前缀来查找下一个匹配项（如果有）

我有这种字符串：

没有任何 CR/LF，都在一条线上。

我想创建一个正则表达式：

当且仅当 url 以/transfer/packages/
捕获每个后续 GUID
直到引用字符串的结尾"
要找到的 GUID 的数量是未知的，并且至少是一个

到目前为止，我写道：

但它只捕获 LAST guid。我需要一些如何重用前缀/transfer/packages/并保持匹配，每次都热切地扩展搜索，而不是从前缀继续。

python regex python-3.x re

2020-04-15T08:56:52.957

0 投票

1 回答

37 浏览

python - RE.将一个单元格中的任意两个值与另一个单元格匹配

我目前正在尝试匹配两个不同电子表格中的两个单元格，到目前为止我可以做到，但现在我遇到一个问题，即一个单元格中有多个值，我想将单元格中的两个出现与一个单元格匹配有大量的信息。

例如：

（标题）- 数据 A 单元格：汽车型号变化 90-92

（年）- 数据 B 单元格：1990|1991|1992|1993|1994|1995|1996|1997|1998|1999

但我想尝试匹配标题中数据 B 的任意两个值，但不确定解决问题的最佳方法。

python regex python-3.x re

2020-04-15T10:12:59.797

问题标签 [re]

Reference