0

我正在使用 Python(和 Pytumblr)并尝试从一些返回的数据中提取某个字符串,但我正在搜索的字符串中包含“:”。每当我运行我的脚本时,我都会收到错误消息:

File "myfile.py", line 22
    if re.search('^ion': u'..', u'b', line) :
                       ^
SyntaxError: invalid syntax

这是我的代码:

import pytumblr
import re

returned = client.submission('blog') # get the submissions for a given blog

sch = open('returned')
for line in sch:
    line = line.rstrip()
    if re.search('^ion': u'..', u'b', line) :
        print line

这段代码中是否还有另一个错误,或者有没有办法逃脱我不知道的“:”?我对 Python 很陌生,但我不认为:需要转义。

4

2 回答 2

2

这是一个语法错误,因为您的冒号不是字符串的一部分。单引号'正在关闭字符串。您的第一个参数被解析为:

'^ion'       - String 1: ^ion
:            - Syntactical colon
 u           - The syntactical character u,
               indicating you intend for the
               following string literal to be
               in unicode
'..'         - String 2: ..

如果您希望末尾的单引号^ion成为字符串的一部分,则需要使用反斜杠对其进行转义'^ion\':或者在字符串本身周围使用双引号。由于 Python 接受单引号和双引号作为字符串文字标记,'hello'并且"hello"含义相同。制作'"hello world"'"'hello world'"两个合法的字符串。

如果正则表达式是这里的痛点,那么有很多文献和工具可以提供帮助。我推荐正则表达式101

于 2017-03-25T03:59:47.810 回答
1

尝试使用双引号:

re.search("^ion': u'..', u'b", line):

或逃脱'

re.search('^ion\': u\'..\', u\'b', line):
于 2017-03-25T03:59:15.297 回答