问题标签 [findall]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python-2.7 - BeautifulSoup,“ResultSet”对象没有属性“find_all”
我阅读了与我的问题相关的其他线程,但它没有解决问题。
我想在a
表中获取所有标签(会有几个),所以我的代码是这样的:
这提高了我
cards_table
是一个表,我用循环对其进行迭代,for
所以不确定为什么会导致错误。请问有什么想法吗?
python - python re.findall 奇怪的行为
所以我的期望是不匹配包含“whyisthismatched”的行。
Python re 文档说明如下:
(点。)在默认模式下,这匹配除换行符以外的任何字符。如果指定了 DOTALL 标志,则它匹配任何字符,包括换行符。
我的问题是这是否真的是预期的行为或错误。如果预计有人请解释为什么这些行匹配以及我应该如何修改我的模式以获得我期望的行为:
python - Python - re.findall 返回不需要的结果
这仅返回结果[89]
,我需要返回全部 89%。请问有什么办法吗?
python - Python - 用 findall 找到最长的序列
我想使用 findall 找到一个模式的最长匹配项。我找到了一些解决方案,但仅适用于re.match
or re.finditer
。有人可以给我一个建议吗?
python - 在python中使用re.findall输出一组参数而不是每行的一组参数
我曾经readlines
将文件中的所有句子拆分,我想用它re.findall
来查找其中的大写字母。但是,我能得到的唯一输出是所有句子的一组大写字母,但我想要文件中每个句子的一组大写字母。
我目前正在使用 for 循环尝试此操作,但我不确定这是否是此任务的最佳操作方案。
输入:
这就是我得到的输出:
我想得到输出:
有没有办法做到这一点?我已经把我的编码放在了下面。谢谢!
python - 逐行拆分句子文件并使用 findall 提取某些参数
我正在尝试浏览一个句子文件并在这些句子中逐行提取大写字母。
这是我正在处理的数据文件:
本质上,我希望程序为每一行输出“SUBJ”、“VERB”和“OBJ”。但是,对于我现在正在处理的脚本的每一行,输出是文件中每一行的所有大写字母,而不仅仅是该行中的大写字母。
这是我现在得到的输出:
第 0 行:the dog_SUBJ bit_VERB the cat_OBJ
第 1 行:the man_SUBJ ran_VERB
第 2 行:the cat_SUBJ ate_VERB the cheese_OBJ
例如,我希望程序输出第 0 行,'SUBJ','VERB','OBJ',因为那是该行中的内容。
这是我目前正在使用的脚本:
谢谢!
python - 如何在美丽的汤中仅使用 find_all 显示文本?
有一个非常简洁的解决方案可以使用漂亮的汤显示来自 div 的文本,find
这里 https://stackoverflow.com/a/8994150/1063287:
result = soup.find('div', {'class' :'flagPageTitle'}).text
我想在以下场景中应用相同的逻辑:
content = original_content("div","class1 class2")
如果我将其修改为:
content = original_content("div","class1 class2").text
我收到错误:
AttributeError: 'ResultSet' object has no attribute 'text'
谁能告诉我如何使用最初显示的相同逻辑,但在我使用上述 find_all 的情况下?(注意我使用的find_all
是不输入的快捷方式,请参见此处)
谢谢你。
grails - Grails:ArrayList - 检索速度
我正在使用当前工作方法解决速度问题,该方法在ArrayList
. 根据大小,在列表中查找值可能需要超过 7 秒的时间。
我需要加快这个过程,这样我才能处理更多的数据。任何帮助将不胜感激。这是我的例子;
方法:
crmM映射内容
“[{ATTRIBUTE=AcademicIndex, INTEGRATION_TAG=Contact~nAcademic_Index}, {ATTRIBUTE=AcademicInterest, INTEGRATION_TAG=Contact~mplAcademic_Interest},........]”
python - 为什么 re.findall 不专门在字符串中查找三元组项目。Python
所以我有四行代码
让我先解释一下我要做什么。. . 如果这令人困惑,我很抱歉,但我会尽力解释它。
所以我正在寻找以'ATG'开头的序列,后跟任何单词字符的3个单位[例如'GGG','GTT','TTA'等],直到它遇到'TAA','TAG'或“TGA”我还希望它们至少有 30 个字符长。. . 因此 {9,}?
这在某种程度上有效,但如果你注意到在seq中有ATG GAA GTT GGA TGA AAG TGG AGG TAA AGA GAA GAC GTT TGA
所以在这种情况下,如果它从第一个 'ATG' 开始并一直到下一个'TAA'、'TAG' 或 'TGA',它应该找到 'ATGGAAGTTGGATGA '
但是,当您运行 OR_0 代码行时,它会吐出整个 seq 字符串。我不知道如何让它只考虑第一个'TAA','TAG'或'TGA',然后是第一个'ATG'
如果在以 3 为单位读取时,“ATG”后面跟着另一个“ATG”,那没关系,它不应该重新开始,但如果在以 3 为单位读取时遇到“TAA”、“TAG”或“TGA”它应该停止。
我的问题,为什么 re.findall 会找到最长的 'ATG'xxx-xxx-['TAA','TAG' or 'TGA'] 序列,而不是第一次出现的 'TAA','TAG' 或 'TGA'在以 3 为单位的单词字符分隔的 ATG 之后?
再一次,如果这令人困惑,我深表歉意,但它弄乱了我基于此初始文本行的多个数据集,我正试图找出原因
python - 从斜杠到空格或字符查找字符串
我想知道如何找到一个介于 slach 和括号或 ']' 之间的字符串,例如。
我的想法是只为第一个xx@xx.xx
和为 +44648474
data
xx@xx.xx
thisword
data2
我试过这个正则表达式:
但它返回<xxx@xx.xx>)
并且<thisword>
我想得到的是xx@xx.xx和thisword