问题标签 [disambiguation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
database - 作者姓名消歧数据
我正在研究作者姓名消歧问题。我想做一些实验。我想对引文记录进行聚类。我需要训练数据和测试数据,其中每个出版物记录的真实作者都可用。有许多书目数据库,如 DBLP、Medline 和 Pubmed 等。我对测试阶段感到困惑。将 DBLP 分为训练和测试是否是一种好习惯?DBLP 引文记录是手动添加的吗?我可以保证每条引文记录都分配给 DBLP 中的真实作者吗?对培训和测试数据库有什么建议吗?注意:在文献中,我注意到在一些论文中,他们使用 Pubmed 进行培训,使用 DBLP 进行测试,尽管第一个用于医学出版物,第二个用于计算机。
algorithm - 哈希表如何解决桶歧义和探测?
我正在阅读 C 语言中的数据结构、算法和软件原理,以试图了解数据结构的一些内部结构,有两件事让我非常困扰:
(1) 哈希表如何处理决定桶中的哪个项目是你正在查找的项目,如果它们都具有相同的哈希?
例如
- 获取键、值
- 在键上使用哈希算法找到索引以尝试将值放入
- 如果槽被占用,但没有桶(单个条目),则创建一个桶并将当前项目放入桶中,然后将当前值放入其中。
- 现在我有一个带有一堆值的桶和一个“失物招领问题”,您无法分辨哪个值属于哪个键,因为所有键都映射到同一个哈希,并且桶中的项目没有要搜索的键桶的关键。
如果存储桶保存每个条目的键和值,这将起作用,但我很困惑,因为我找不到确认哈希表保存键及其条目的值的站点。
(2) 哈希表如何判断索引处的值是否是键的正确值,或者探测是否发现冲突并将其放在其他地方。
例如。
- 获取键、值
- 哈希键查找索引(0)
- 获取索引,使用简单的探测算法执行线性搜索,直到找到插槽(插槽 1 为空)。
- 现在我搜索我的键并找到索引 0。哈希如何知道索引 0 不是该键的正确项,但它已被探测到插槽 1?
同样,如果表保存了条目的键和值,这对我来说是有意义的,但我不确定哈希是否将键与条目的值一起保存,或者是否有另一种方法来确保哈希索引处的项目或存储桶索引是正确的项目,或者如果我误解了它。
为了澄清这个问题:哈希表是否保存键和值来消除桶和探测序列的歧义,或者他们是否使用其他东西来避免哈希的歧义?
很抱歉这个粗略的问题,但我不得不问。
提前谢谢。
expression - 表达式优先级和消歧
我目前正在努力使 Rust-lang 可以用 Rascal 解析。最初使用的语法是为 Bison 制作的,因此我将其翻译为可用的。我遇到的绊脚石是表达式。Rust 在其 Bison 文件中有四种类型的表达式,它们是nonblock_expr
,和. 我现有的翻译充满了歧义,但即使在阅读了有关该主题的 Rascal 文档以及 Rascal 和 Java 的可用语法之后,我也不知道如何解决这个问题。我想解决歧义并更好地了解如何进一步解决此问题。expr
nonparen_expr
expr_nostruct
这是我的翻译示例:
资料来源:
Rust Bison 文件:Github Rust
氧化流氓文件:Github Oxidize
添加了歧义示例 这是一个输入文件的示例(只是文件的歧义部分在 parse 的参数中)。
如下所示的输出解析树似乎对前缀表达式 (&) 的构造感到困惑。这种歧义无法在Nonblock_prefix_expression
和之间做出决定Expression "." Path_generic_args_with_colons
。我希望它能够通过Nonblock_prefix_expression
.
r - 将列表转到数据框中的各个列
我有一个数据集(下面的列),但其中一个变量有问题。
这是数据的快照。
“作者”变量是一个列表,我一直在尝试flatten
通过各种方式,但没有成功。我总是在数据集和“展平”的结果行之间得到不匹配。
这些会产生错误:
如果我做:
我得到:
最初数据来自 .json 文件。
这是列表的结构。
我相信我得到了不匹配,因为并非列表中的所有项目都有affiliations
部分,但我不知道如何解决这个问题。
理想情况下应该是:
这样我就可以毫无问题地进行展平。
我想把它变成同一个数据集的多列来测试数据author disambiguation
上的一些算法。
你们知道我怎么能做到这一点吗?任何其他为消歧做准备的逻辑都将受到欢迎。
添加dput
.
google-app-engine - App-Engine 如何使用通配符消除自定义域的歧义?
如果我将自定义域添加*.example.com
到我的应用程序引擎项目中,然后我可以有选择地将 CNAME 添加到指向 ghs.googlehosted.com 的域,以将子域转发到该项目,然后识别项目中的版本。
例如,如果我的项目有一个名为的版本和www
一个名为项目。contact
www.example.com
contact.example.com
www.example.com
www
contact.example.com
contact
为了完整性:如果我不使用*
, 而是将www.example.com
和contact.example.com
作为自定义域添加到我的项目中,则两者都将根据不同项目版本的流量分配来提供服务,无论它们是什么。
现在,如果我将*.example.com
自定义域添加到一个项目和另一个项目中,事情就会变得有趣(这就是我的问题所在) 。现在,Google App-Engine 必须根据该项目的流量分配来区分是指第一个项目的版本还是第二个项目的某个版本。dataserver.example.com
dataserver.example.com
dataserver
当我几个月前设置它时,它做了(我认为是)最合乎逻辑的事情:它选择了后者,因为dataserver.example.com
它比更具体*.example.com
,因此应该优先。但是当我昨天尝试设置另一组项目时,它反而试图为我dataserver
提供第一个项目的版本(最初不存在,因此我得到了 404,但是当我部署一个虚拟的时,我得到了背部)。
现在的问题是:App-Engine 实际上是做什么的?是随机的吗?它是先创建先服务的吗?是否有特殊性,但可能需要一段时间才能传播到所有服务器?
cobol - 如何引用模棱两可的顶级变量?
在这段代码中,我想ACCEPT
和DISPLAY
01 级别D
变量。虽然 05 级别D
很简单,D OF F
但有没有办法指定 01 级别D
?
显而易见的解决方案是“只更改变量名”,但希望有更好的方法!
ruby - 如何解决 ruby 中的名称冲突
两个模块Foo
分别Baa
定义了一个同名的方法,而name
我在特定的上下文中做了。include Foo
include Baa
当我调用时name
,如何区分是否调用or的name
方法?Foo
Baa
sparql - 如何使用 SPARQL 在 DBPedia 中的消歧/询问子资源中捕获正确的资源?
我有一个 Youtube 音乐视频的标题,我需要从 DBPedia 收集其他信息,如专辑、艺术家、发布日期等。我还想从 DBPedia 获取所有这些实体的“摘要”。我已经使用 Musicbrainz 来区分标题中的歌曲和艺术家,并且效果很好,除了少数情况。
但是我的主要问题是:当我通过歌曲询问 DBPedia(使用资源/{song} 查询)时,有时我没有得到任何答案,因为 {song} 会导致歧义。示例:resource/It's_My_Life 有 11 个消歧,其中 6 个是歌曲。我需要资源“It's_My_Life_(Bon_Jovi_song)”。我如何告诉 DBPedia 我需要某个艺术家的“MusicalWork”类型的资源?
我尝试了很多方法来使用 SPARQL 做到这一点,但我总是得到一个空的结果,我不知道我做错了什么。到目前为止,我只能获得每个消歧的摘要,但我无法获得消歧子资源的特定属性(如摘要)。
我似乎不能去父亲比这。我试过:
和
但结果总是空的。我应该如何询问资源的子资源?谁能帮我?
c# - 如何区分外部类和嵌套类
我有一种情况,我的一个类被调用SpaceMine
,而我拥有的另一个类被调用,Ability
并且其中嵌套了一个类,称为SpaceMine
:
在Foo()
中,我试图声明一个类型SpaceMine
(不是Ability.SpaceMine
)的变量,但它一直说我的变量是类型Ability.SpaceMine
。除了更改名称之外,我如何确保编译器知道我要声明的类型?
c++ - 将一组类转换为类模板并避免构造函数歧义
我会尽量使这个问题尽可能简短,但是为了让人们了解我想要实现的目标以及如何解决我当前的问题,需要展示大量代码。
这是我的原始类声明及其所有构造函数:
Register.h -原始版本
现在我把这些变成了模板类,以减少大量的代码重复。这就是我到目前为止所拥有的:
Register.h -较新版本
现在谈到将采用std::uintx_t
类型和索引值的构造函数。一些构造函数声明匹配例如:
在原始版本Reg8
中拥有Reg8(u32 val, u8 idx)
和Reg16
拥有Reg16(u32 val, u8 idx)
. 如果你仔细看Reg8(...)
,断言idx <= 0 && idx >= 3
whileReg16(...)
断言idx == 0 || idx == 1
.
但是,当我尝试将这些类模板化并移植到构造函数时,这些现在变得模棱两可。我不知道如何确定使用哪个断言来区分它是Reg8
,Reg16
等Reg32
...