问题标签 [datefinder]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
119 浏览

python - 检测文本中日期的最准确方法是什么?

我正在处理敏感数据识别 (NER) 任务。面对我无法准确检测文本中的日期的事实。我已经尝试了几乎所有...

例如,我的文本中有这种类型的日期:

但不得不说,文中也有很多数字信息,比如IP地址、住宅地址、银行卡号等。

这是一个如何Spacy工作的例子:

或者例如我有电话号码"(150) 224-2215",它会将Spacy部分标记"24-2215"为日期。它也经常发生在地址和信用卡号码上。

然后我尝试了datefinderand dateparser.search,但他们检测到句子中完全不正确的部分或包含“to”一词的部分。

你能分享你的经验吗,有什么更好的方法?获得高精度日期检测的最佳方法是什么?