我意识到这是一个广泛的话题,但我正在寻找一个很好的从文本中解析含义的入门书,最好是在 Python 中。作为我想要做的一个例子,如果用户发表博客文章,例如:
“曼尼·拉米雷斯今天回归道奇队,对阵休斯顿太空人队”,
从句子中取出名词的轻量级/简单方法是什么?首先,我想我会将它限制为专有名词,但我不想仅限于此(而且我不想依赖一个简单的正则表达式,它假设任何 Title Capped 都是专有名词)。
让这个问题更糟的是,我没有要求我应该做的事情是什么?我需要现有单词的语料库才能开始吗?我需要知道哪些词法分析知识才能完成这项工作?我确实遇到了关于该主题的另一个问题,我现在正在挖掘这些资源。