我观察到 coreNLP 3.9.2 已开始将 enti_ties 拆分为多个,例如 'enti' 、 '_' 、 'ties' 同时标记
我尝试使用解决此问题的 tokenize.whitespace。但我认为这将停止拆分“cant't”和“dont't”的标记
我观察到 coreNLP 3.9.2 已开始将 enti_ties 拆分为多个,例如 'enti' 、 '_' 、 'ties' 同时标记
我尝试使用解决此问题的 tokenize.whitespace。但我认为这将停止拆分“cant't”和“dont't”的标记