问题标签 [semantic-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
nlp - 如何使用 AI 判断来自不同来源的关于同一事件的两篇文章是否相同?
我怎么能说两篇关于同一事件但在语法和逻辑上不同的文章是相同的还是不同的。
例子:
案例一:
第 1 条(新闻来源 1):本财年美国贸易逆差上升
第2条(新闻来源2):美国贸易逆差在上升
结果:两者相同
案例2:
第1条(消息来源1):哈佛今年有更年轻的学生。
第2条(新闻来源2):哈佛今年对学生的入学变得更加艰难。
结果:它们是不同的。
不是逐字匹配,而是作为一个整体。如果我们可以进行意义比较,那就更好了。我使用哪些 AI 概念,如果有人可以分享一些相同的信息,将会很有帮助。有人告诉我自然语言处理可能会有所帮助。请帮忙!!
PS:请告诉我是否有相同的开源API。
word - 在语义上比较 2 个单词有哪些不同的技术?其中哪一个是最好的?
现在,我正处于一个项目的起点,我应该在这个项目中比较两个词的语义。
我开始了解 WordNet,我们在其中找到单词之间的距离,以找出它们在含义方面的相似程度。
如果您可以提出更多技术以及哪种方法是最好的,那将非常有帮助。
nlp - Brown Corpus 在基于 WordNet 的语义相似度测量中有什么用
我遇到了几种使用 WordNet 的结构和层次结构来测量语义相似度的方法,例如,Jiang and Conrath measure (JNC)、Resnik measure (RES)、Lin measure (LIN) 等。
使用 NLTK 测量它们的方式是:
如果 WordNet 是计算语义相似度的基础,那么 Brown Corpus 在这里有什么用呢?
nlp - 提取给定句子、关键字或主题的相关文本
是否有任何已知的方法(除了统计分析,但不一定将其排除为解决方案的一部分)使用自然语言处理将句子或概念相互关联。到目前为止,我只与 NLTK 和 Stanford-NLP 合作来帮助我的项目,但我对替代开源解决方案持开放态度。
以乔治奥威尔的以下文章为例(http://orwell.ru/library/essays/wiw/english/e_wiw)。假设我给应用程序的句子
也许
可能会从文章中产生线条,例如
或者
我知道这并不容易,我可能无法达到很高的准确性,但我希望对已经存在的内容以及我可以尝试开始的内容提出一些想法,或者至少根据已知和已发布的内容获得可能的最佳结果那里。
parsing - Parsing and Attribute Stack
Can someone please help me with the question below:
Consider the following grammar with action routines:
Suppose we are parsing the input:
and that our compiler uses an automatically maintained attribute stack to hold the active slice of the parse tree. Show the contents of this attribute stack immediately before the parser predicts the production par_tail → ε. Be sure to indicate where lhs and rhs point in the attribute stack.
This is an homework problem. If solution is not possible, are there any easy examples i can refer to for solving the problem? Thanks in advance!
java - 文档集合中同时出现的词之间的语义相关性
我不确定我的问题本身是否正确,可以在这里发布,但我想我会试一试。
我正在从事一个项目,我从公共知识库中获取文本数据,并希望使用此文本自动扩展基于标签的搜索查询,其中包含应该与原始查询相关的附加术语。公共知识库基本上是来自维基百科的数据集合;就我而言,是 374 万篇文章的摘要。
一开始,我只是根据原始查询执行搜索,从我的查询中获取描述匹配项的文章中使用的词,并进行简单的词频计算以获得 N 个最常用的词。
开始时这似乎是一个简单的想法,但是当我测试更多查询时,我开始遇到问题。很明显,我需要对我的自定义文本集合进行某种语义分析,但我什至不知道从哪里开始做这样的事情。我在网上找到的任何应该进行语义分析的工具都只适用于预定义的文本集合。如前所述:我需要一些可以处理自定义集合并稍后使用该索引执行搜索的东西。
有什么想法或建议吗?
sql - 这些子类化方法中的任何一种都有潜在的缺点吗?
想象一下,您有几个代表活动的表格:
- 过程活动
- 医疗活动
- 维护活动
- 物流活动
你现在意识到一切都是活动,那么,你会怎么做?
- 您创建一个名为“活动”的主表,并为这些值添加一个类型字段:流程、医疗、维护、后勤或
- 您创建一个超级活动表,并为每个子类创建一个只有主键的表,因为知道两个子类都没有唯一字段
我可以想到一些参与决策的利弊:
第一种方法:
- 活动中的 CRUD 操作将意味着在两个不同的表中工作
- 简化 ER 图
- 失去完整性约束
第二种方法:
- 维持这种关系的两个索引将保存在两个不同的地方
- 语义
在这两种方法中是否有任何潜在的性能或其他后果?
nlp - 基于释义检测查找相似文本
我有兴趣根据释义找到类似的内容(文本)。我该怎么做呢?有没有特定的工具可以做到这一点?最好在python中。
nlp - 两句话意思之间的距离
我正在寻找一种方法来测量两个句子之间的语义距离。假设我们有以下句子:
S2 是从 S1 中通过删除“cherry”、“blossoms”和“in”而创建的。我想定义一个在 S1 和 S2 之间提供较大距离的函数。原因是它们确实具有明显不同的含义,因为美丽改变了樱花而不是日本。
compiler-construction - 抽象语法树 - 编译器阶段
语义分析器的输入是 AST(抽象语法树)。我的问题是:语义分析器的输出是相同的 AST 装饰,还是应该是一棵新树?这棵树叫什么名字?要创建这个新树,我可以使用访问者模式吗?在下面的示例中,在 AST (inttofloat) 中创建了一个新节点。所以我相信它应该总是被创建一棵新树。