问题标签 [nlp]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
.net - .NET 的自然语言日期/时间解析器?
有谁知道类似于Chronic for Ruby的 .NET 日期/时间解析器(处理“明天”或“下周四下午 3 点”之类的东西)?
注意:我确实编写了 Ruby(这就是我对 Chronic 的了解),但这个项目必须使用 .NET。
language-agnostic - 什么是用于释义的好的自然语言库?
我正在寻找一个现有的库来总结或解释内容(我的目标是博客文章)——对现有的自然语言处理库有任何经验吗?
我对多种语言持开放态度,所以我对能力和准确性更感兴趣。
windows-vista - 多种语言的 Vista 语音识别
我的主要语言是西班牙语,但我使用的所有软件都是英语,包括 Windows;但是我想在西班牙语中使用语音识别。
你知道是否有一种方法可以在主要操作系统语言之外的其他语言中使用 vista 的语音识别?
nlp - 你如何实现“你的意思是”?
可能重复:
谷歌“你的意思是什么?” 算法工作?
假设您的网站中已经有一个搜索系统。<spell_checked_word>
您如何像 Google 在某些搜索查询中那样实现“您的意思是: ” ?
algorithm - 有没有一种算法可以告诉两个短语的语义相似性
输入:词组 1,词组 2
输出:语义相似度值(介于 0 和 1 之间),或者这两个短语谈论同一事物的概率
algorithm - 您如何根据文本内容进行分类?
如何根据内容自动查找文本类别?
algorithm - 如何从写成单词的数字中读取值?
众所周知,数字可以写成数字,也可以用它们的名字来称呼。虽然可以找到很多将 123 转换为 123 的示例,但我找不到如何将其反过来转换的好示例。
一些警告:
- 基数/名义或序数:“一”和“第一”
- 常见拼写错误:“四十”/“四十”
- 百/千:2100 -> “2100”和“2010”
- 分隔符:“十一百五十二”,还有“十一百五十二”或“十一百五十二”等等
- 俗语:“三十多岁”
- 分数:'三分之一','五分之二'
- 常用名称:“一打”、“半”
可能还有更多尚未列出的警告。假设算法需要非常健壮,甚至可以理解拼写错误。
我应该阅读哪些领域/论文/研究/算法来学习如何编写所有这些?信息在哪里?
PS:我的最终解析器实际上应该理解 3 种不同的语言,英语、俄语和希伯来语。也许在稍后阶段会添加更多语言。希伯来语也有男性/女性数字,例如“one man”和“one woman”有不同的“one”——“ehad”和“ahat”。俄语也有其自身的一些复杂性。
谷歌在这方面做得很好。例如:
http://www.google.com/search?q=two+thousand+and+one+hundred+plus+5+dozen+and+four+fifths+in+decimal
(反过来也可以http://www.google.com/search?q=999999999999+in+english)
algorithm - 自然语言处理的词频算法
在没有获得信息检索学位的情况下,我想知道是否存在任何算法来计算单词在给定文本中出现的频率。目标是获得人们对一组文本评论的“总体感觉”。沿着Wordle的路线。
我想要什么:
- 忽略冠词、代词等('a'、'an'、'the'、'him'、'them'等)
- 保留专有名词
- 忽略连字符,除了软种类
伸手去拿星星,这些将是桃色的:
- 处理词干和复数(例如喜欢、喜欢、喜欢、喜欢匹配相同的结果)
- 形容词(副词等)与其主语(“伟大的服务”相对于“伟大的”、“服务”)的分组
我尝试了一些使用 Wordnet 的基本内容,但我只是盲目地调整了一些东西,并希望它适用于我的特定数据。更通用的东西会很棒。
string - 如何确定随机字符串是否听起来像英语?
我有一个基于输入单词列表生成字符串的算法。如何仅分隔听起来像英语单词的字符串?IE。在保留LORD的同时丢弃RDLO。
编辑:为了澄清,它们不需要是字典中的实际单词。他们只需要听起来像英语。例如KEAL将被接受。
nlp - NLP:定性“正面”与“负面”句子
我需要您的帮助来确定分析“正面”与“负面”行业特定句子(即电影评论)的最佳方法。我以前见过诸如 OpenNLP 之类的库,但它太低级了——它只是给了我基本的句子组成;我需要的是一个更高级别的结构: - 希望有单词列表 - 希望可以在我的数据集上训练
谢谢!