问题标签 [microsoft-academic-graph]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 将作者隶属关系添加到 Microsoft Academic 评估 API 请求
我有一个用于调用 Microsoft Academic API评估方法的 Python 函数。该函数当前接受作者姓名并返回引用计数:
由于我知道我有兴趣查询的几位作者的从属关系,因此我想将affiliation 参数添加到请求中。但是,我不太了解如何去做。我试过这个:
但这返回了错误,所以显然这不太正确。
举个例子,我正在研究的一位作者是 laurens van der maaten,他的引用次数超过 40,000 次,隶属于 Facebook。因此,新功能仍应返回 40,000 多次引用计数,但使用她在 Facebook 的事实来缩小搜索范围(对于更常见的名字尤其有用)。
非常感谢这里的任何帮助。谢谢。
python - 在 Microsoft Academic API 查询中转义 '
我正在尝试使用 Microsoft Academic API 下载该作者的出版物。由于他的名字包含一个',API 会抛出一个错误。我将此 URL 传递给 API: https://api.labs.cognitive.microsoft.com/academic/v1.0/evaluate?expr=Composite(AA.AuN==%27martin kang'ethe gachukia%27)&model =latest&attributes=AA.AuId&count=10&offset=0&subscription-key=YOUR_KEY"
使用这个url时,名称中间的'被%27代替,会导致错误,因为%27表示查询词的开始和结束。
我的问题是,如何防止这种行为?有没有办法我需要逃避撇号来防止这种行为?
microsoft-academic-graph - 微软语言相似度包
我知道也许这不是问这个问题的正确地方。我也在微软问答部分问过,我还没有得到任何答案。
我希望有人对我的问题有所了解。
我正在使用 Microsoft 基于 Microsoft-academic-graph 的 LanguageSimilarity 包。这个包返回两个字符串之间的相似度分数。在这个包中,它们提供了预训练的模型并包含算法,封装在 dll(c# 代码)中。
假设我有两个大字符串并调用 languageSimilarity.ComputeSimilarity(s1,s2) 方法。假设,在该字符串中,我有一些单词(一些单词/所有单词)在该包随附的预训练词汇语料库中不可用。在这种情况下,如果模型中没有单词,它将如何返回相似度分数?
如果有人对此有任何了解,请帮助我。谢谢
azure - Microsoft Academic Graph PySpark 示例中的 MagContainer 字段
我正在尝试使用 Microsoft Academic Graph(MAG) 数据的 PySpark 教程。(https://github.com/Azure-Samples/microsoft-academic-graph-pyspark-samples/blob/master/src/AIIndex.ipynb)
我在“加载 MAG 数据”部分不断收到错误消息。即使我运行需要最少时间的第 4 行(Affiliations.txt - 由于文件大小为 5MB),运行大约需要 11 分钟,并输出以下错误消息。
shaded.databricks.org.apache.hadoop.fs.azure.AzureException:shaded.databricks.org.apache.hadoop.fs.azure.AzureException:无法使用匿名凭据访问帐户 mag-datashare 中的容器 $root,并且没有凭据在配置中为他们找到。
我已经搜索了错误消息,但无济于事。我认为我在“初始化存储帐户和容器详细信息”部分做错了,尤其是 MagContainer 和 OutputContainer 变量。
在我的存储帐户中,
- 我有一个从 Microsoft 共享的名为“mag-datashare”的容器,我试图将路径放在 MagContainer 变量中。描述以“mag-yyyy-mm-dd”的形式表示,但尝试失败。我试过'mag-datashare/mag/2021-10-11'、'mag-datashare/mag'、'mag-2021-10-11'、'mag-2021-10-11'、'mag-datashare'这一切都失败了。有些会立即失败,但有些需要 11 分钟。已搜索其他示例,但它们似乎具有不同的格式,使用了额外的 MagVersion 变量。
- 我制作了一个名为“mag-output”的容器,并将其路径放在 OutputContainer 变量中。
谁能帮我运行代码?
sparql - 使用 Fuseki(MAKG 数据集)查询在 SPARQL 中不起作用的字符串
我想在 Apache Jena Fuseki 上使用 MAKG(Microsoft Academic Knowledge Graph)( https://makg.org/)和 DBPedia 数据集(使用关键字)进行 SPARQL 查询。SERVICE
在此之前,我想为 MAKG 测试一些更简单的查询,例如:
它检索关键字等于 的论文"hydrogen"
。
使用 MAKG 端点https://makg.org/sparql,它运行良好(结果)。但是,如果我在 Apache Jena Fuseki 上测试相同的查询,它不会检索到任何行。
一般来说,当我想通过特定字符串进行查询时,它似乎不起作用。
你有什么提示吗?
先感谢您。