1

我想开始在 Python 中使用 AI 工具。我查看了一些项目,但我发现他们的示例因我有限的经验等而令人生畏。例如,我想构建一种方法来比较两个 html 表并构建一些东西,使我能够确定这些表是否描述了相同的概念。现在我正在使用蛮力方法执行此操作,例如我有一组特定类型的已知表。我找到并提取所有行标签并创建一组独特的行标签。然后我取一个新表并将新表中的行标签与集合中的行标签进行比较,如果行标签的交集足够大,我将其声明为该特定类型的表。

虽然我的阅读表明我应该能够做一些不那么机械和更巧妙的事情,但我正在努力如何开始。

任何人都可以指出资源的方向,这些资源具有使用 AI 工具解决特定问题的可访问示例。例如,假设我在文档中遇到一个表格,我想查看该表格是否是我已经识别的几种表格之一。如何通过示例表和候选表进行检查。如何指定应考虑的表的属性?

当我查看 AI 资源的文档和示例时,我发现它们太笼统了,以至于我什至不知道如何开始。

我在阅读常见问题解答后添加了上述内容,我认为这是一个公平的问题。我不想让某人编写 pyBrain 代码来阅读我的示例表,我想找到其他人使用过它的案例或类似的东西,以便我可以研究他们的代码。

谢谢

关闭后我正在编辑它。Q 上的流量似乎是相关的。NLTK 是一个很好的起点。在发现这本书将成为一个很好的资源后,我从 iTunes 获得了该书的软拷贝。如果您需要在购买前扫描这本书,整本书都是在线的NLTK Book但是如果您认为这本书有用,请购买。

4

1 回答 1

1

David Robinson 建议使用朴素贝叶斯分类器来解决您的问题。这是个好建议。查看nltk.classify模块以了解 NB 分类器等的实现。

于 2012-09-27T22:04:27.090 回答