问题标签 [semantic-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c - 编译器的符号表和语义分析
我正在为类似 C 的语言(一种更简单的语言)构建编译器(不使用任何工具,如 lex 或 bison),并且已经通过了词法分析器和解析器。我不确定我做解析器的方式是否正确。因为,到目前为止,要进行解析,即检查语法是否正确,我根本没有使用过链表。基本上,我的解析器看起来像这样:假设语法是 -
我的程序如下所示:
我基本上有所有非终端的功能,并在适当的时候调用它们,我正在通过“strcmp”检查关键字。这种方法好吗?
从这一点来看,如何进行语义分析呢?我应该从哪里开始构建符号表?
任何建议或思考的指针都很棒!非常感谢
java - 高效的关键字检测/提取。预定义的一组关键字
如何有效地从字符串中提取具有相关性的关键字?我的关键字列表是预定义的。例如,在一篇关于 Michelle Obama 的文章中也提到了 Barack Obama,我想提取Michelle Obama
并Barack Obama
让关键字Michelle Obama
获得更高的相关性值(两者Michelle Obama
都Barack Obama
出现在我的关键字列表中)。
检查字符串中每个关键字的出现次数似乎不是很有效。我的应用程序是用 PHP 开发的,但如果我能有效地做到这一点,任何语言都可以。
我尝试了 OpenCalais,但它没有检测到我的大部分关键字。是否可以使用 Lucene 提取关键字?
c - “if”语句的代码生成 - 编译器
我正在为类似 C 的语言开发编译器,并且在语义分析和代码生成阶段遇到了一些困难。我的问题如下: 1)对于 if 语句,以下是语法:
现在,在我的目标代码中,它必须是带有 go to 语句的 3 地址代码,所以它应该
所以现在,我的问题是,如何生成“转到”语句的地址?
2)这个问题是关于语义分析的:我已经能够为单个函数构建和使用符号表。我应该使用什么方法来构建函数调用的符号表?换句话说,对于不同的词汇级别?我知道这应该以某种方式涉及拥有多棵树。一棵树对应一个功能。但是从程序中间的某个地方指向不同的树的方法是什么?
我是初学者,因此任何建议/想法将不胜感激。
merge - 上下文感知合并?
是否有任何用于编程语言的 diff/merge 工具,它以语法感知的方式工作(如 XML Diff Tool),不仅仅是逐行比较(并且可以选择忽略空格)。
我对一个实际上遵循语言语法和分隔符的程序感兴趣,它在不破坏语法正确性的情况下提出更改建议,或者将语句捆绑在多行中。示例行为是:
*在找到if(){
引入额外嵌套级别的一个时,会自动将右括号}
与它下面的几行捆绑在一起。)
*将匹配的语法元素保持在一起,避免像删除块这样的愚蠢往往会创建:
就个人而言,我很想找到能够处理 C++ 语法的软件,但了解其他语言的解决方案也会很有趣。
rdf - RDF 和 OWL 工作流程问题
我一直在通过 Protege 查看和玩 OWL,我想知道我是否正确理解“工作流程”和它的想法(从头开始构建数据库:
- 使用 Protege 或同等工具为您的数据生成 OWL 本体
- 将此模式导出到 RDF
- 使用定义为三元组中某些元素的类以及目标数据
- 将您的三重存储导出到 RDF
- 使用 openRDF/sesame 或 Jena 加载定义的数据和本体
- 根据您的 OWL 本体验证您的 RDF 三元组以确保一切正常
- 使用 SPARQL 从 RDF 三元存储中获取数据
- 使用 OWL 推理器做某事(这里不太清楚)
我想了解其他人在做什么以及他们如何解决此类问题。
另外我有一个具体的问题:
似乎猫头鹰推理器仅用于确定本体的子类超类关系。但就数据而言,您如何在 SPARQL 中查询子类 - 超类关系。例如,如果我的三重商店定义 (pizzaID1 is-a marghareta) 并且我在 SPARQL 中查询素食披萨,我如何确保返回 PizzaID1。
我认为答案与生成“全图”有关,其中明确说明了每种关系。sparql 在查询三元组时是否会进行任何自动推理,或者是否需要生成这样一个完整的图?
facebook - 基于语义的推荐 Facebook 应用程序
作为本学期的一个项目,我和朋友正在考虑制作一个基于语义的推荐 Facebook 应用程序。例如,如果我想去“去欧洲旅行”,这个应用程序打算执行以下操作:在我的朋友列表中搜索并返回所有名为“意大利旅行”甚至只包含评论的相册关于“埃菲尔铁塔”、与欧洲任何事物相关的我的朋友状态、我朋友的笔记、他们在其他网站上喜欢的链接以及出现在他们的新闻提要中的其他活动。如果我想看电影、看书或学习一门学科……等等,也是如此。
我的问题是:
这样的事情有可能在3个月内实现吗?知道我们只有 Facebook API 和语义相关主题的基础。
如果是,我们可以依赖什么本体?我们还应该有哪些其他概念作为起点?
syntax - 检查语言有效性
是否有任何 [开源] 代码库用于根据句法和语义检查句子的语言有效性?
algorithm - 最简单的特征选择算法
我正在尝试创建自己的简单特征选择算法。我要使用的数据集在这里(非常有名的数据集)。有人可以给我一个关于如何做到这一点的指示吗?
我打算为文本分类编写一个特征排名算法。这是用于电影评论的情感分析,将它们分类为正面或负面。
所以我的问题是如何为文本数据集编写一个简单的特征选择。
semantic-web - 如何确定网络上的文档是否与其他文档在语义上相关?
我的问题是,鉴于document d1 on the web and a document d2
我如何判断 d1 和 d2 在语义上相关。是否有一些 API 可以进行一定数量的自然语言处理,这可能会给我一个提示,即 d1 可能与 d2 相关联。我急需它。请帮助!
lucene - 如何从文本语料库中提取语义相关性
目标是评估大型文本语料库中术语之间的语义相关性,例如,“police”和“crime”应该比“police”和“mountain”具有更强的语义相关性,因为它们倾向于在相同的上下文中同时出现。
我读过的最简单的方法是从语料库中提取IF-IDF信息。
很多人使用潜在语义分析来寻找语义相关性。
我遇到了 Lucene 搜索引擎: http: //lucene.apache.org/
你认为提取IF-IDF合适吗?
在技术和软件工具方面(偏爱 Java),你会建议我做什么?
提前致谢!
穆龙