问题标签 [semantic-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
rdf - 多语言 OpenCalais 之类的系统?
OpenCalais 系统给我留下了深刻的印象。它是(是/拥有)一个网络服务,您可以在其中发送文本,他们对其进行分析,然后为您提供文档所属的一系列分类(启用 RDF)标签。
但是 - 目前 - 英语是唯一支持的语言。
您知道处理多语言文档的类似系统吗?(我对意大利语很感兴趣,但多语言当然是加分项)
parsing - 抽象语法树和具体语法树有什么区别?
我一直在阅读一些关于解释器/编译器如何工作的内容,而我感到困惑的一个领域是 AST 和 CST 之间的区别。我的理解是解析器生成一个 CST,将其交给语义分析器,语义分析器将其转换为 AST。但是,我的理解是语义分析器只是确保遵循规则。我真的不明白为什么它实际上会进行任何更改以使其抽象而不是具体。
关于语义分析器,我是否缺少某些东西,或者 AST 和 CST 之间的区别是否有些人为?
nlp - 训练集——pos / neg / 中性句的比例
我将 Twitter 消息手动标记为正面、负面、中性。我试图理解是否有一些逻辑可以用来识别训练集的消息比例应该是积极/消极和中性?
因此,例如,如果我正在训练一个带有 1000 条推特消息的朴素贝叶斯分类器,那么 pos : neg :neut 的比例应该是 33 % : 33% : 33% 还是应该是 25 % : 25 % : 50 %
从逻辑上讲,在我看来,我训练(即为中性提供更多样本)系统会更好地识别中性句子,然后是它们是积极的还是消极的——这是真的吗?或者我在这里遗漏了一些理论?
谢谢拉胡尔
nlp - 如何选择特征选择算法?- 建议
是否有我可以阅读的研究论文/书可以告诉我手头的问题哪种特征选择算法最有效。
我试图简单地将 twitter 消息识别为 pos/neg(开始)。我从基于频率的特征选择开始(从 NLTK 书开始),但很快意识到对于类似的问题,不同的人选择了不同的算法
虽然我可以尝试基于频率、互信息、信息增益和各种其他算法,但列表似乎无穷无尽。我想知道是否有一种有效的方法,然后反复试验。
任何建议
.net - 使用 .Net 进行文本挖掘、事实提取、语义分析
我正在寻找任何可以让我在我的 .NET 应用程序中利用文本挖掘、事实提取和语义分析的免费工具/组件/库。
GATE项目是我需要的,但它是用 Java 编写的。.NET 世界中有类似 GATE 的东西吗?
我的挑战是从网站文本内容中提取某些事实。我计划使用一些 NLP 算法来实现这样的功能,但我不确定如何实现它们,所以如果它们可用,我将使用任何现有的解决方案。
如果您能给我一些建议,我将不胜感激。我是这个领域的新手,所以任何相关信息对我来说都非常有用。
artificial-intelligence - 专家系统中的剪枝推论
在规则系统或任何通过前向链接推理规则推断事实的推理系统中,您将如何修剪“不必要的”分支?我不确定正式术语是什么,但我只是想了解人们在推理问题时如何能够限制他们的思路,而我见过的所有语义推理者似乎都无法做到这一点。
例如,在 John McCarthy 的论文An Example for Natural Language Understanding and the AI Problems It Raises中,他描述了让程序智能地回答有关纽约时报新闻文章的问题的潜在问题。在第 4 节“非单调推理的必要性”中,他讨论了在推理故事时使用奥卡姆雷蛇来限制事实的包含。他使用的示例故事是关于抢劫家具店老板的强盗。
如果要求程序在谓词演算中形成故事的“最小完成”,它可能需要包括原始故事中未直接提及的事实。但是,它还需要某种方式知道何时限制其推论链,以免包含不相关的细节。例如,它可能希望包含参与此案的确切警察人数,但文章省略了这一点,但它不想包含每个警察都有一位母亲的事实。
prolog - 为俄语寻找一个好的语义解析器
有人知道俄语的语义解析器吗?我试图配置链接语法站点提供的链接解析器,但无济于事。
我希望有一个可以在 Mac 上运行并生成解析树的 prolog 或类似 lisp 的表示的系统(但 XML 输出也很好)。
compiler-construction - 语法与语义分析
我想知道语法规范和语义分析之间的界限在哪里。更好的是:使用详细的语法描述还是将细节留给语义阶段?例如:想象一个像 C# 这样具有枚举类型的 OO 语言,它可以从原始类型“派生”
现在,枚举的基本类型的正确性(在这种情况下:原始类型或非原始类型)是否应该成为语法检查或语义分析的主题?
compiler-construction - 生成 C/C++ 代码时表达式的关联性和优先级?
我编写了一个生成 AST 的基本编译器,正确考虑了表达式中的运算符优先级。但是,在执行代码生成以生成 C++ 代码时,我不确定如何处理括号的使用。
对于这个表达式:
下面的AST:
应该正确生成包含括号的前一个表达式,但是如果第二个运算符是加法运算符(例如),则括号将是不必要的。我宁愿只在必要时使用它们以提高可读性。
是否有任何规则规定这种行为以及如何知道何时使用括号。加号和减号在大多数语言中具有相同的优先级,我想让所有运算符都可以使用。