问题标签 [wikipedia]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
5 回答
294252 浏览

api - 有维基百科 API 吗?

在我的 Wikipedia 用户页面上,我运行一个 Wikipedia 脚本来显示我的统计数据(编辑的页面数、新页面数、每月活动等)。

我想把这些信息放在我的博客上。

是否有一个 API 可以让我做这样的事情?

0 投票
3 回答
934 浏览

parsing - 为可能的维基百科链接解析文本的工具

是否存在可以解析文本并输出该文本的工具,超链接到维基百科条目以获取感兴趣的单词?

例如,我想要一个可以变成这样的工具:

排序列表上最流行的搜索算法是二分搜索。

进入:

排序列表上 最流行的搜索算法二分搜索

如果 Wikipedia 有一个 API 可以做到这一点,那就太好了,因为他们最有能力确定什么是“感兴趣的词”。

在我的示例中,我只是将所有直接链接到条目的组合链接,除了 The 和 most。

0 投票
4 回答
6038 浏览

python - 是否有一种解析器/方式可用于使用 Python 解析维基百科转储文件?

我有一个项目,我收集属于特定类别的所有维基百科文章,从维基百科中提取转储,并将其放入我们的数据库。

所以我应该解析维基百科转储文件来完成这些工作。我们是否有一个高效的解析器来完成这项工作?我是一名 Python 开发人员。所以我更喜欢python中的任何解析器。如果没有建议,我会尝试在 python 中编写它的一个端口并将其贡献给网络,以便其他人使用它或至少尝试一下。

所以我想要的只是一个 python 解析器来解析维基百科转储文件。我开始编写一个手动解析器来解析每个节点并完成工作。

0 投票
4 回答
545 浏览

mediawiki - 以某种方式从维基百科 XML 文件中删除内部链接?

如果我下载了 Wikipedia XML 转储,有没有办法从 XML 文件中删除所有内部链接?

谢谢

0 投票
3 回答
210 浏览

identity - 确认用户是他们所说的 Wikipedia 用户?

如果我网站上的用户说他们是 Wikipedia 用户“示例”,那么确认他们确实是 Wikipedia 用户而不是冒名顶替者的最佳方法是什么?

0 投票
3 回答
15055 浏览

c# - 连接到 Wikipedia API 的 WebRequest

这可能是一个非常简单的问题,但我似乎无法格式化帖子 webrequest/response 以从Wikipedia API获取数据。如果有人可以帮助我查看我的问题,我已经在下面发布了我的代码。

0 投票
3 回答
5056 浏览

php - 如何从维基百科获取信息到我的应用程序中

大家好,我希望从维基百科获取我在我的数据库中的条目的信息,例如一些体育场馆和国家信息。我正在使用 Zend 框架,以及如何处理返回多个不明确条目等的查询。我希望在这里能得到所有帮助...

0 投票
4 回答
3490 浏览

php - 从 Wikipedia 获取信息 - 如何获取 HTML 表单?

我正在使用 curl 从维基百科检索信息。到目前为止,我已经成功地检索了基本的文本信息,但我真的很想用 HTML 检索它。

这是我的代码:

但是,以这种方式检索的文本不足以显示:(它都是这种格式

'''Aix-les-Bains''' 是 [[Savoie]] [[Departments of France|department]] 中 [[Rhône-Alpes]] [[regions] 中的 [[Communes of France|commune]]法国|地区]]在东南部[[法国]]。

它位于 [[Lac du Bourget]] 附近,{{convert|9|km|mi|abbr=on}} 位于 [[Chambéry]] 以北的铁路旁。

==History== ''Aix'' 源自 [[Latin]] ''Aquae''(字面意思是“水域”;''cf'' [[Aix-la-Chapelle]] (Aachen) 或 [[Aix -en-Provence]]),而艾克斯在[[罗马帝国]]期间是一个浴池,甚至在它被改名为“Aquae Gratianae”以纪念在不远处被暗杀的[[Emperor Gratian]]之前,在 [[里昂]],在 [[383]]。许多罗马遗迹幸存下来。[[图片:IMG 0109 Lake Promenade.jpg|thumb|left|Lac du Bourget Promenade]]

如何获取维基百科文章的 HTML?


更新:谢谢,但我对这里有点陌生,现在我正在尝试运行 xpath 查询 [尽管是第一次],但似乎无法获得任何结果。我实际上需要在这里知道几件事。

  1. 我如何只请求文章的一部分?
  2. 如何获取所请求文章的 HTML。

我浏览了来自维基百科的关于数据挖掘的这个url - 它提出了一个想法,即使用检索到的维基百科文本作为参数向 wikipedia api 发出第二个请求,这将检索 html - 尽管到目前为止它似乎还没有工作:( -我不想把整篇文章当作一团乱七八糟的 html 来抓取并转储它。基本上我的应用程序所做的是你在地图上有一些位置和城市大头针指向 - 你点击城市标记,它会请求通过 ajax 显示城市的详细信息在相邻的 div 中。我希望从维基百科动态获取这些信息。我会担心稍后处理特定城市不存在的文章,只需要确保它在这一点上工作。

有谁知道一个很好的工作示例,它可以完成我正在寻找的工作,即阅读和解析维基百科文章的选定部分。


根据提供的 url - 它说我应该将 wikitext 发布到 wikipedia api 位置,以便它返回解析的 html。问题是,如果我发布信息,我没有得到任何响应,而是一个我被拒绝访问的错误 - 但是,如果我尝试将 wikitext 包含为 GET,它会毫无问题地解析。但是当我有太多文本需要解析时,它当然会失败。

这是维基百科api的问题吗?因为我已经破解了两天了,一点运气都没有:(

0 投票
3 回答
773 浏览

mysql - 导入维基百科数据库转储 - 杀死navicat - 任何人有任何想法?

好的,伙计们,我已经下载了 wikipedia xml 转储及其高达 12 GB 的数据:\ 对于一个表,我想将它导入到我的本地主机上的 mysql 数据库中 - 但是它是一个 12GB 的巨大文件,显然 navicats 正在度过它的甜蜜时光导入它或者它更有可能被绞死:(。

有没有办法包括这个转储或至少部分你知道一点点。


让我更正一下它的 21 GB 数据 - 并不是说​​它有帮助:\ - 有没有人知道将这样的巨大文件导入 MySQL 数据库。

0 投票
8 回答
476 浏览

programming-languages - 什么是编程语言?

维基百科说:

编程语言是一种机器可读的人工语言,旨在表达可由机器(尤其是计算机)执行的计算。编程语言可用于创建指定机器行为的程序、精确表达算法或作为人类交流的一种模式。

但这是真的吗?今天早上洗澡的时候我突然想到,一种编程语言可能只是一组约定,人类和适当安排的编译器都可以解释的东西。如果是这样的话,那么编程语言的这种定义是否具有误导性?如果不是这种情况,那么编译器和它编译的语言有什么区别?

谢谢!

z。