我尝试对 unicode 使用基本的正则表达式,但我无法使它们在具有传统 AZ 和数字以外的字符的字符串上工作
我正在查看不属于 AZ Alphabetical 家族的多种语言的示例
text = "20किटल"
res = re.sub("^[^\W\d_]+$", lambda ele: " " + ele[0] + " ", text)
Output:
20किटल
第二次尝试:
regexp1 = re.compile('^[^\W\d_]+$', re.IGNORECASE | re.UNICODE)
regexp1.sub("^[^\W\d_]+$", lambda ele: " " + ele[0] + " ", text)
Output:
20किटल
Expected output:
**20 किटल**