我收到来自阿拉伯语音译服务的 JSON 响应。
作为第一步,我尝试使用以下内容仅提取带有音译词的响应部分Pattern
:"\"r\":\"(\\P{M}\\p{M}*)*?\"");
。当我输出整个选择时,这部分响应被正确返回:
"r":"تست\\\/0|طست\\\/1|تسة\\\/1|طسة\\\/1|تيست\\\/1|طاسة\\\/1|تيسة\\\/1|تصت\\\/2|تثت\\\/2|تسط\\\/2"
但是,当我尝试仅使用 获取组部分时m.group(1)
,输出为2
. 我期待"r":"
和之间的所有单词部分"
。
当我尝试在 Eclipse 中选择整个控制台输出时,它似乎"r":
是 LTR,其余的是 RTL。也许这打破了正则表达式。
"r":"
我怎样才能在和之间获得整个组"
?