python - 使用 Python 正则表达式将字符串除以换行符或句点

Question

我有一个字符串：

"""Hello. It's good to meet you.
My name is Bob."""

我正在尝试找到将其拆分为按句点和换行符划分的列表的最佳方法：

["Hello", "It's good to meet you", "My name is Bob"]

我很确定我应该使用正则表达式，但是，没有使用它们的经验，我正在努力弄清楚如何做到这一点。

score 31 · Accepted Answer

你不需要正则表达式。

>>> txt = """Hello. It's good to meet you.
... My name is Bob."""
>>> txt.split('.')
['Hello', " It's good to meet you", '\nMy name is Bob', '']
>>> [x for x in map(str.strip, txt.split('.')) if x]
['Hello', "It's good to meet you", 'My name is Bob']

score 2 · Accepted Answer

对于您的示例，在点上拆分就足够了，可以选择后跟空格（并忽略空结果）：

>>> s = """Hello. It's good to meet you.
... My name is Bob."""
>>> import re
>>> re.split(r"\.\s*", s)
['Hello', "It's good to meet you", 'My name is Bob', '']

在现实生活中，您必须处理Mr. Orange,Dr. Greene和George W. Bush, 但是...

score 1 · Accepted Answer

>>> s = """Hello. It's good to meet you.
... My name is Bob."""
>>> import re
>>> p = re.compile(r'[^\s\.][^\.\n]+')
>>> p.findall(s)
['Hello', "It's good to meet you", 'My name is Bob']
>>> s = "Hello. #It's good to meet you # .'"
>>> p.findall(s)
['Hello', "#It's good to meet you # "]

score 1 · Accepted Answer

1

您可以使用此拆分

re.split(r"(?<!^)\s*[.\n]+\s*(?!$)", s)

于 2013-07-12T15:42:28.630 回答

score 0 · Accepted Answer

0

矿：

re.findall('(?=\S)[^.\n]+(?<=\S)',su)

于 2013-07-12T17:12:07.390 回答

python - 使用 Python 正则表达式将字符串除以换行符或句点

5 回答 5

Related

Reference