0

到目前为止,我已经评估了几个著名的 Java 解析器,但没有一个可以以某种方式真正免费用于商业用途。像 OpenNLP 一样,它是免费的,但使用了不可用于商业目的的训练数据。Morphadorner 在那里,但它似乎最后一次更新是在 2009 年。Stanford NLP 是完整的 GPL,而 LingPipe 提供付费许可证。

目前作为一家没有资金的初创公司,我真的不可能支付高额的许可费。我必须为我的需求实现一个基于规则的解析器,这是行业标准解决方案无法比拟的。

不过,我不是一个自由狂,我也不需要世界上只有少数人在使用的东西。我坚信,像 NLP 这样的东西越来越受欢迎,再次实施 POS Tagger 就像重新发明一个重新发明的轮子。真的没有行业标准的解决方案吗?

更新:这种心态似乎符合行业标准意味着有偿。那么如何免费提供几个 HTML 解析器库(以及其他东西)。Html 解析器比 NLP 使用得更多,但 NLP 任务仍然有相当大的需求。

更新:问题已关闭。我很快就会很高兴地发布我的使用 Wordnet 和各种漂亮规则的用于关键字提取的小型库。谢谢 AB

4

1 回答 1

4

您已经确定了一个解决方案:

斯坦福 NLP 是完整的 GPL ...

没有禁止将 GPL 用于商业项目。

问题是,如果您以二进制形式分发代码,您还必须提供源代码。这意味着您的商业模式需要基于为您的客户提供付费支持和/或服务(而不是销售软件许可证)......但是有许多公司基于类似的模式赚取了丰厚的收入。


这是关于这个主题的另一个问答,还有一些其他潜在的线索:


这种心态似乎符合行业标准意味着有偿。那么如何免费提供几个 HTML 解析器库(以及其他东西)。Html 解析器比 NLP 使用得更多,但 NLP 任务仍然有相当大的需求。

由开发此类内容的团队(或组织或公司)来决定他们如何获得许可。似乎现有的 NLP 产品都不是“像啤酒一样免费”。那是他们的选择。而且你没有权利抱怨......因为你也选择不让你的应用程序“像啤酒一样免费”。

正如我所指出的,斯坦福 NLP 是“像 Libre 一样免费”。只是你还没有准备好承担 GPL 的义务。

没有人有义务免费为您做事。作为一个潜在的企业家,你不应该期待它。

(FWIW,有像啤酒一样免费的 HTML 解析器以及许多其他事情的原因通常是问题比 NLP 容易几个数量级,或者那里有公司/组织捐赠了很多开发代码所需的资源。)

于 2013-05-27T03:24:19.400 回答