2

我正在使用 TextBlob 库来分析法律文本。我真的很喜欢 TextBlob,但我在一些功能上苦苦挣扎。当我创建一个TextBlob对象时,它会自动将我的整个文本小写。

from textblob import TextBlob    
text_blob = TextBlob(input_text)

这对我来说很不方便,因为我想使用实体识别方法来查找法律文本中的条目,其中许多条目都是大写的(例如 LEI、ISO、成员国等)。我想保持原样,大写。任何其他方式实体识别器都不会找到所有可能的实体(或者我必须将所有内容都小写,这不是我的计划)。

有没有办法不使用 TextBlob 小写整个文本,例如传递参数:

from textblob import TextBlob    
text_blob = TextBlob(input_text, lower=False)

我已经尝试了几件事,但没有好的结果。我也没有在 TextBlob 的文档中找到答案。也许这是一个非常简单的任务。

4

0 回答 0