Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
我有要解析的文本,它包含标点符号字母等。到目前为止,我使用了:
[\d\s\;\:\.\,\)\(]
它似乎对我来说非常有效,直到我注意到它也在日期结束时拿起了“th”。(例如 2 月 16 日)。
我怎样才能修改我当前的正则表达式以使其工作。我尝试使用整个 ^ = 字符串开头和 $ = 字符串结尾,但无法弄清楚。
[\\d\\s;:.,)(]
您不需要转义冒号和分号之类的内容,但您可能需要在 java 中对 d 和 s 进行双重转义。
由于代码中其他地方的错误,TH 可能会被选中。
另外,我不能给出好的建议,因为你对你的项目不是很清楚。但是,如果您选择标点符号来摆脱它,您可能会尝试选择您想要保留的内容,然后摆脱其他所有内容。