问题标签 [google-scholar]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
web-scraping - 允许处理/迭代/查询科学文章的免费 API/库(即 Google Scholar)?
我正在尝试找到一种可行的方法来遍历 Google Scholar(或任何其他科学图书馆)上的所有科学论文。我不需要论文内容,只需要标题、作者、引文和摘要。
我正在寻找某种类型的库/api,它们允许我迭代和处理这些论文,以及具有高查询能力的东西。
到目前为止,我发现的唯一一个是学术性的。查询似乎很不错,但是,我看不到任何迭代所有内容的选项。
有没有其他网络抓取工具可以让我这样做?
python - 从 Google Scholar 搜索结果中抓取和解析引文信息
我有一个大约 20000 篇文章标题的列表,我想从谷歌学者那里获取他们的引用数。我是 BeautifulSoup 库的新手。我有这个代码:
但它只返回标题和网址。我不知道如何从另一个标签获取引文信息。请帮帮我。
python - 识别从 Google Scholar 检索 href 的问题
无法从谷歌学者中抓取链接和文章名称。我不确定问题出在我的代码还是我用来检索数据的 xpath 上——或者可能两者兼而有之?
在过去的几个小时里,我已经尝试调试/咨询其他 stackoverflow 查询,但没有成功。
我收到的错误消息说:“AttributeError:xpath”所以我认为问题出在我用来尝试检索数据的路径上,但我也可能弄错了吗?
python - Python:如何访问生成器对象中的元素并将它们放入 Pandas 数据框或字典中?
我正在使用scholarly
python 中的模块来搜索关键字。我正在返回一个生成器对象,如下所示:
我想访问元素 'citedby' 但是当我尝试这样做next(search_query)['citedby']
时返回TypeError: 'Author' object is not subscriptable
.
我的问题是如何访问生成器对象中的元素?以及如何将该对象转换为 Pandas 数据框?
google-scholar - 如何将 CRAN 中发布的 R 包索引到 Google Scholar?
我在 CRAN 中发布了一些 R 包;但是,它们没有出现在 Google Scholar 中。有什么方法可以让我的包裹在 Google Scholar 中可见吗?例如,knitr出现在 Google Scholar 的引用条目中,如下所示:
- 谢永(2013)。knitr:R.R包版本,1(7),1中用于动态报告生成的通用包。
我应该手动将任何引用元标记上传到 Google Scholar 吗?
r - Scholar 软件包的问题 (scholar::get_article_cite_history)
我正在尝试使用学者包加载期刊文章的引用历史,据我所知,我使用的是正确的格式和语法,尽管结果输出是一个空数据框。
下面的示例应该按原样运行。我想加载“从血液生物标志物和基因表达数据定义的数据驱动哮喘内型”的引用历史,我已经提取了一篇文章的作者和文章 ID。
此结果输出是一个空数据框,带有 3 个收集列标题(年份、引用、公共标识)。预期结果应使用引用该文章的 24 篇文章的信息填充此数据框。
web-scraping - 如何找到像谷歌学者一样要刮的所有期刊的列表?
我想查找所有 isi 文章和期刊的列表,如 google 学者。
我想我们有一些像https://www.thomsonreuters.com/en.html这样的网站,里面有所有期刊的链接,我可以用这种网站找到所有期刊的链接吗?
请问你有更好的主意吗?
web-scraping - 使用 BeautifulSoup 检索 Google Scholar 结果的问题
我正在继续我在上一个问题中开始的分析。我在一个由四列组成的数据框中获得了有关特定工作论文出版物的信息:出版年份、出版顺序(每年的出版顺序,在这种情况下完全没用)、标题和作者。因此,我想使用这个数据框来抓取 Google Scholar 并检索有关引用次数的信息。因为有些论文的标题有点笼统,在某些情况下,谷歌学者的第一个结果实际上并不是我感兴趣的。因此,为了进行更量身定制的研究,在创建链接来执行我的研究包括每篇论文的标题和作者。我已经关注了这个线程编写代码。
注意:因为执行此抓取需要真实姓名,所以我宁愿不创建示例数据框。我已将 .csv 文件上传到我的 GitHub 上。
但是,我从这个脚本得到的结果只是一个列表:
我不确定问题是出在我笨拙的脚本(可能)还是因为 Google 阻止我从 Scholar 中获取太多信息。事实上,即使是我在这个线程中用作起点的脚本,它也并不总是以预期的结果返回。我希望有人能给我一些建议。先感谢您。
python - 检索 Scholarly (Python) 上的出版物信息
使用 Academicly 很容易获得 AUTHOR 信息。(https://pypi.org/project/scholarly/)。
在 Python 中很好地解释了它到 .csv 文件的转换:如何访问生成器对象中的元素并将它们放入 Pandas 数据框或字典中?
但是,我没有看到我如何只能获取出版物信息(作者、标题、期刊等)
有没有办法做到这一点?
谢谢!