我在试图解析的文件中有一些文本。
考虑这个文本文件:
Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do
eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex ea commodo consequat.
1. Line 1
2. Line 2
+ Line 1
+ Line 2
+ Line 3
文本文件中有三个段落。
首先是几句话。第二个有一个句子和一个编号列表。第三是一个简单的项目符号列表。
我的问题是,在 Objective-C 中,我如何确定段落组合是否只是句子,我会将它们作为 NSString 返回,如果它是项目符号列表,我希望它们在 NSArray 中分开,如果段落是句子和编号列表的组合,我会将它们作为 NSString 和 NSArray 的字典返回。
有任何想法吗?我知道我可以使用正则表达式将它们分成数组或字符串,但我不太清楚如何检测和验证 para 是否为:
- 段落(句子)
- 项目符号列表/编号列表。
- List和Para的结合
在阅读了一堆关于正则表达式的教程和 SO 问题后,我已经尝试过了。
此表达式(?=\d*\s*[\.]?\s*)([a-z\s]+)
确实获取编号列表,但它还获取列表之前的前面文本。那是我完全被困住的地方。