“findall”的相关标签问题_Stack Overflow中文网

0 投票

1 回答

6903 浏览

python-2.7 - BeautifulSoup，“ResultSet”对象没有属性“find_all”

我阅读了与我的问题相关的其他线程，但它没有解决问题。

我想在a表中获取所有标签（会有几个），所以我的代码是这样的：

这提高了我

cards_table是一个表，我用循环对其进行迭代，for所以不确定为什么会导致错误。请问有什么想法吗？

2013-04-08T13:10:33.083

0 投票

1 回答

135 浏览

python - python re.findall 奇怪的行为

所以我的期望是不匹配包含“whyisthismatched”的行。

Python re 文档说明如下：

（点。）在默认模式下，这匹配除换行符以外的任何字符。如果指定了 DOTALL 标志，则它匹配任何字符，包括换行符。

我的问题是这是否真的是预期的行为或错误。如果预计有人请解释为什么这些行匹配以及我应该如何修改我的模式以获得我期望的行为：

python regex findall

2013-04-09T16:34:59.790

0 投票

3 回答

533 浏览

python - Python - re.findall 返回不需要的结果

这仅返回结果[89]，我需要返回全部 89%。请问有什么办法吗？

python regex findall

2013-04-16T19:39:14.080

0 投票

1 回答

836 浏览

python - Python - 用 findall 找到最长的序列

我想使用 findall 找到一个模式的最长匹配项。我找到了一些解决方案，但仅适用于re.matchor re.finditer。有人可以给我一个建议吗？

python regex findall

2013-04-17T08:04:51.570

0 投票

2 回答

669 浏览

python - 在python中使用re.findall输出一组参数而不是每行的一组参数

我曾经readlines将文件中的所有句子拆分，我想用它re.findall来查找其中的大写字母。但是，我能得到的唯一输出是所有句子的一组大写字母，但我想要文件中每个句子的一组大写字母。

我目前正在使用 for 循环尝试此操作，但我不确定这是否是此任务的最佳操作方案。

输入：

这就是我得到的输出：

我想得到输出：

有没有办法做到这一点？我已经把我的编码放在了下面。谢谢！

python for-loop findall

2013-04-17T17:32:55.207

0 投票

2 回答

149 浏览

python - 逐行拆分句子文件并使用 findall 提取某些参数

我正在尝试浏览一个句子文件并在这些句子中逐行提取大写字母。

这是我正在处理的数据文件：

本质上，我希望程序为每一行输出“SUBJ”、“VERB”和“OBJ”。但是，对于我现在正在处理的脚本的每一行，输出是文件中每一行的所有大写字母，而不仅仅是该行中的大写字母。

这是我现在得到的输出：

第 0 行：the dog_SUBJ bit_VERB the cat_OBJ

第 1 行：the man_SUBJ ran_VERB

第 2 行：the cat_SUBJ ate_VERB the cheese_OBJ

例如，我希望程序输出第 0 行，'SUBJ'，'VERB'，'OBJ'，因为那是该行中的内容。

这是我目前正在使用的脚本：

谢谢！

python findall

2013-04-19T11:24:49.980

0 投票

1 回答

4718 浏览

python - 如何在美丽的汤中仅使用 find_all 显示文本？

有一个非常简洁的解决方案可以使用漂亮的汤显示来自 div 的文本，find这里 https://stackoverflow.com/a/8994150/1063287：

result = soup.find('div', {'class' :'flagPageTitle'}).text

我想在以下场景中应用相同的逻辑：

content = original_content("div","class1 class2")

如果我将其修改为：

content = original_content("div","class1 class2").text

我收到错误：

AttributeError: 'ResultSet' object has no attribute 'text'

谁能告诉我如何使用最初显示的相同逻辑，但在我使用上述 find_all 的情况下？（注意我使用的find_all是不输入的快捷方式，请参见此处）

谢谢你。

python text python-2.7 beautifulsoup findall

2013-04-20T09:11:15.400

0 投票

2 回答

554 浏览

grails - Grails：ArrayList - 检索速度

我正在使用当前工作方法解决速度问题，该方法在ArrayList. 根据大小，在列表中查找值可能需要超过 7 秒的时间。

我需要加快这个过程，这样我才能处理更多的数据。任何帮助将不胜感激。这是我的例子；

方法：

crmM映射内容

“[{ATTRIBUTE=AcademicIndex, INTEGRATION_TAG=Contact~nAcademic_Index}, {ATTRIBUTE=AcademicInterest, INTEGRATION_TAG=Contact~mplAcademic_Interest},........]”

grails arraylist findall collect

2013-04-26T16:06:14.740

0 投票

4 回答

532 浏览

python - 为什么 re.findall 不专门在字符串中查找三元组项目。Python

所以我有四行代码

让我先解释一下我要做什么。. . 如果这令人困惑，我很抱歉，但我会尽力解释它。

所以我正在寻找以'ATG'开头的序列，后跟任何单词字符的3个单位[例如'GGG'，'GTT'，'TTA'等]，直到它遇到'TAA'，'TAG'或“TGA”我还希望它们至少有 30 个字符长。. . 因此 {9,}?

这在某种程度上有效，但如果你注意到在seq中有ATG GAA GTT GGA TGA AAG TGG AGG TAA AGA GAA GAC GTT TGA

所以在这种情况下，如果它从第一个 'ATG' 开始并一直到下一个'TAA'、'TAG' 或 'TGA'，它应该找到 'ATGGAAGTTGGATGA '

但是，当您运行 OR_0 代码行时，它会吐出整个 seq 字符串。我不知道如何让它只考虑第一个'TAA'，'TAG'或'TGA'，然后是第一个'ATG'

如果在以 3 为单位读取时，“ATG”后面跟着另一个“ATG”，那没关系，它不应该重新开始，但如果在以 3 为单位读取时遇到“TAA”、“TAG”或“TGA”它应该停止。

我的问题，为什么 re.findall 会找到最长的 'ATG'xxx-xxx-['TAA','TAG' or 'TGA'] 序列，而不是第一次出现的 'TAA','TAG' 或 'TGA'在以 3 为单位的单词字符分隔的 ATG 之后？

再一次，如果这令人困惑，我深表歉意，但它弄乱了我基于此初始文本行的多个数据集，我正试图找出原因

python regex string findall

2013-04-28T07:48:51.223

0 投票

2 回答

159 浏览

python - 从斜杠到空格或字符查找字符串

我想知道如何找到一个介于 slach 和括号或 ']' 之间的字符串，例如。

我的想法是只为第一个xx@xx.xx和为 +44648474dataxx@xx.xxthisworddata2

我试过这个正则表达式：

但它返回<xxx@xx.xx>)并且<thisword>

我想得到的是xx@xx.xx和thisword

python regex findall

2013-04-29T12:57:21.203

问题标签 [findall]

Reference