问题标签 [nlp]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
940 浏览

nlp - (人类)文档的语言

有没有办法(程序、库)大致知道文档是用哪种语言编写的?

我有一堆混合语言的文本文档(~500K)要导入启用 i18n 的 CMS(Drupal)..

我不需要完美匹配,只需要一些猜测。

0 投票
1 回答
369 浏览

nlp - 谁能给我指出一个很好的“英语”打印规则的例子

我有一个用户使用规则引擎构建的等价物。但是在显示规则列表时,我希望能够将每个规则“漂亮地打印”成看起来不错的东西**。在内部,当表示为字符串时,它们看起来像 s 表达式,所以想象一下:

任何人都可以指出一个以可读方式很好地显示规则的程序吗?

** 也需要本地化,但我想我们会把它留作额外的功劳。

0 投票
4 回答
4539 浏览

nlp - CORPUS resource

I am designing an Automatic text summarizer. One of the major modules in this project requires TRAINING CORPUS. Can someone please help me out by providing TRAINING CORPUS or referring some link to download it. Thanks in anticipation

0 投票
9 回答
1669 浏览

functional-programming - 函数式编程是自然语言编程的下一步吗?

这是我的第一个问题,所以我有点紧张,因为我不确定我是否理解得足够好。无论如何,我们走吧......

每当达到编程的新里程碑时,似乎他们总是有一个共同目标:让程序员更容易编程。

机器语言、操作码/助记符、过程/函数、结构、类 (OOP) 等总是有助于以更自然、更易于理解和更好维护的方式规划、构造和编码程序。

当然,函数式编程绝不是新鲜事物,但近年来它似乎经历了某种复兴。我也相信,当微软将 F# 添加到他们的主流编程语言中时,FP 将得到巨大的推动。

回到我最初的问题,我相信最终编程将使用自然语言(英语)完成,几乎没有限制或规则。编译器将成为 AI/NLP 系统的一部分,该系统从代码中提取信息,或者我应该说文本并将其转换为编译器可以编译的中间语言。

那么,FP 是让编程更接近自然语言编程,还是它是一个障碍,主流 OOP 会引导我们更快地走向自然语言编程?

这个问题不应该用来讨论自然语言编程的可用性或可行性,因为只有未来才能证明。

0 投票
14 回答
53140 浏览

algorithm - 确定语句/文本的积极或消极程度的算法

我需要一种算法来确定一个句子、段落或文章的语气是消极的还是积极的……或者更好的是,是消极的还是积极的。

例如:

Jason 是我见过的最糟糕的 SO 用户 (-10)

Jason 是 SO 用户 (0)

Jason 是我见过的最好的 SO 用户 (+10)

Jason 最擅长吸吮 SO (-10)

虽然,在 SO 上还可以,但 Jason 在做坏事方面是最糟糕的(+10)

不容易吧?:)

我不希望有人向我解释这个算法,但我认为在学术界的某个地方已经有很多类似的工作。如果你能指点我一些文章或研究,我会喜欢的。

谢谢。

0 投票
3 回答
277 浏览

automation - 自然语言自动化?

我记得读过一个用于 Windows 的自动化程序,它可以接受如下命令列表:

等等等等。任何人都可以命名这个程序吗?一千个谢谢。

0 投票
18 回答
97206 浏览

algorithm - 谷歌“你的意思是什么?” 算法工作?

我一直在为投资组合管理工具开发一个内部网站。有很多文本数据、公司名称等。一些搜索引擎能够非常快速地响应“您的意思是:xxxx”的查询,这给我留下了深刻的印象。

我需要能够智能地接受用户查询,并且不仅可以使用原始搜索结果进行响应,还可以使用“您的意思是吗?” 当有一个很可能的替代答案等时的响应

[我在ASP.NET中开发(VB - 不要反对我!)]

更新:好的,如果没有数百万“未付费用户”,我怎么能模仿呢?

  • 为每个“已知”或“正确”术语生成拼写错误并执行查找?
  • 其他一些更优雅的方法?
0 投票
22 回答
11412 浏览

language-agnostic - 代码高尔夫:数字到单词

代码高尔夫系列似乎相当流行。我遇到了一些将数字转换为单词表示的代码。一些例子是(编程乐趣的 2 的幂):

  • 2 -> 两个
  • 1024 -> 一千二十四
  • 1048576 -> 一百万四万八千五百七十六

我的同事提出的算法将近两百行。似乎会有更简洁的方法来做到这一点。

当前指南:

  • 欢迎以任何编程语言提交(我向 PhiLho 道歉,因为最初在这方面缺乏明确性)
  • 最大输入为 2^64(有关单词,请参见以下链接,感谢 mmeyers)
  • 首选英文输出的小规模,但欢迎任何算法。只需与编程语言一起评论所使用的方法即可。
0 投票
8 回答
70529 浏览

java - Java中的模糊字符串搜索库

我正在寻找用于模糊字符串搜索的高性能 Java 库。

有许多算法可以找到相似的字符串、Levenshtein 距离、Daitch-Mokotoff Soundex、n-gram 等。

存在哪些 Java 实现?对他们有利有弊?我知道 Lucene,任何其他解决方案或 Lucene 是最好的?

我找到了这些,有人有经验吗?

0 投票
3 回答
518 浏览

.net - 用于生成正则表达式的最终用户工具

我们有一个 SaaS 应用程序要求,允许负责构建 CMS 站点的用户在一个表单中定义多达 10 个自定义字段。作为该字段定义的一部分,我们希望添加一个字段验证选项,我们将其存储(并在运行时应用)为 reg-ex。

是否有任何工具、代码示例或类似工具提供向导式前端来构建 reg-ex。我们希望将控件或代码嵌入到我们的 .NET 站点中,以便从(伪)用户友好的术语(如果可能的话,接近自然语言)生成正则表达式。

例如,字段 1 =(5 个字母数字)后跟(1 到 3 个数字)后跟“-”,后跟 1 个字母