我正在尝试以下列方式拆分字符串。这是一个示例字符串:
"Hello this is a string.-2.34 This is an example1 string."
请注意,“”是一个 U+F8FF unicode 字符,字符串的类型是 Unicode。
我想将字符串分解为:
"Hello this is a string.","-2.34"," This is an example1 string."
我已经编写了一个正则表达式来拆分字符串,但是使用它我无法获得我想要的数字部分。(第一个字符串中的-2.34)
我的代码:
import re
import os
from django.utils.encoding import smart_str, smart_unicode
text = open(r"C:\data.txt").read()
text = text.decode('utf-8')
print(smart_str(text))
pat = re.compile(u"\uf8ff-*\d+\.*\d+")
newpart = pat.split(text)
firstpart = newpart[::1]
print ("first part of the string ----")
for f in firstpart:
f = smart_str(f)
print ("-----")
print f