1

假设我有如下字符串

data = "/phones/pages/nokia_overview.aspx pid=46&cid=raj 80"

现在我想从/up to的字符串中获取 url .aspx。我的意思是实际上可能有很多如上所述的字符串,但是我们希望.aspx通过忽略字符串的剩余部分来从字符串的开头到扩展名获取字符串.aspx

这里字符串的长度可能会有所不同,因为有时 url 会更大,有时会很小,所以基于 .aspx 扩展名我想从上面的字符串中获取 url

谁能让我知道我们如何在python中做到这一点

4

2 回答 2

4

由于这是标准日志格式,您可以这样做:

>>> s = "2012-11-04 23:00:07 10.1.151.54 GET /pages/index.aspx - 80 - 10.1.151.5
9 - 200 0 64 374"
>>> s.split()[4]
'/pages/index.aspx'

/phones/pages/nokia_overview.aspx pid=46&cid=raj 80根据我之前提到的完整字符串的某些要求,我已经通过执行某些操作得到了一些字符串。.aspx我的意图是从我在问题中提到的上述字符串中获取所需的字符串

>>> s = "/phones/pages/nokia_overview.aspx pid=46&cid=raj 80"
>>> s.split()[0]
'/phones/pages/nokia_overview.aspx'
于 2012-11-07T05:35:12.297 回答
1

从第一个/到下一个''剪切的简单功能

def pathPart(s):
    pos_slash = s.find('/')
    if pos_slash < 0: pos_slash = len(s)
    pos_space = s.find(' ', pos_slash)
    if pos_space < 0: pos_space = len(s)
    return s[pos_slash : pos_space]
于 2012-11-07T06:01:15.337 回答