1

我有一些tds包括链接文本或链接图像,如下所示。当我收到tdBeautifulSoup 的文字时。文本显示在这里:

我怎样才能使字符串像"u'Language pack English"u'SUSE Linux Enterprise Server for x86 5731SLX Customize'

我试过重新,但它失败了。

u'Language pack\n      \t            \t      \t\t: English'`

u'SUSE Linux Enterprise Server for x86 5731SLX\n\t \t\t    \t\t\t\t\n\t\t\t\t\n\t\t        \t\t\t    \t\t\t\t\t\xa0\xa0\nCustomize'

语言包

                                    : English

    <td>

            SUSE Linux Enterprise Server for x86 5731SLX


<br></br><img width="16" height="16" border="0" align="middle" src="//www.ibm.com/i/v14/icons/fw_bold.gif" title="Link icon" alt="Link icon"></img><a href="flowAction.wss?_eventId=customize&contextId=createProductContext_153180107005186045039023158181160233057201186025_5731SLX_2&_flowExecutionKey=_cC224C0EA-DCAC-4303-DDFD-32594E21C48B_k4D15950D-5056-DE43-BCBE-C73C228B3270"> … </a></td>



    </td>
4

1 回答 1

0

您可以使用单个空格替换多余的空格re.sub('\s+', ' ', inputstring)

正则表达式\s+匹配一个或多个 ( +) 空白字符 ( \s)。

例子:

>>> inputstring = u'hello    world! this\n\n\t\t   \tis a \ntest'
>>> re.sub('\s+', ' ', inputstring)
u'hello world! this is a test'
于 2013-07-16T06:57:49.593 回答