考虑以下字符串,它是从 pdf 中提取的目录,如下例所示,两个主题可以在一行中,每行末尾有一个换行符(如示例中所示)
A — N° 1 2 janvier 2013
TABLE OF CONTENT
Topic à one ......... 30 Second Topic .......... 33
Third - one ......... 3 Topic.with.dots .......... 33
One more line ......................... 27 last topic ...... 34
我想提取部分的名称'Topic à one'、'Second Topic'、'Third -one'、'Topic.with.dots'、'One more line'和'last topic'
匹配正则表达式的任何见解?