问题标签 [wiktionary]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
254 浏览

php - 使用大型数据库在本地安装 MediaWiki:无法生成“LocalSettings.php”

我正在尝试使用大型维基词典转储(3GB)在本地安装MediaWiki(1.29.1 或 1.27.3 )。在将 xml 转储转换为 sql 文件并将后者导入我使用此脚本创建的数据库后,我按照浏览器中的 MediaWiki 安装说明生成我的特定“LocalSettings.php”。我收到消息

此数据库中有 MediaWiki 表。要将它们升级到 MediaWiki 1.29.1,请单击继续。”

通过单击“继续”按钮,浏览器将永远处于加载状态。

我的理解是,包含维基词典转储的数据库中有一些与我正在使用的维基媒体版本不兼容的表。因此,需要更新 DB。我尝试从命令行运行 install.php 以避免浏览器超时。该命令没有返回任何内容(等待超过 2 小时后)。

我也尝试了一种解决方法:

  • 用空表创建我的数据库

  • 从浏览器生成“LocalSettings.php”(因为数据库很小,所以速度很快)

  • 将 wiki sql 转储导入我的数据库

  • 刷新 index.php 页面

然后我得到了一个带有此消息的空白页

异常处理程序中捕获的异常。设置 $wgShowExceptionDetails = true; 和 $wgShowDBErrorBacktrace = true; 在 LocalSettings.php 的底部显示详细的调试信息。

我在网上找到的关于这个问题的所有示例和教程都假设/使用一个小型或新创建的数据库。

知道有什么问题吗?真的有人尝试使用现有的 wikimedia 转储并在本地运行它吗?为什么没有这么先进的例子?

0 投票
1 回答
207 浏览

sql - 离线对维基词典进行自定义查询

我正在为学习俄语的人开发一个开源项目。我想下载一份英文版的俄语数据副本,以便我可以针对它运行一些自定义 SQL 查询。

我更喜欢在 Ubuntu 16.04 上工作。

当我访问维基词典源页面以获取有关如何执行此操作的信息时,我发现自己在兜圈子,我不确定我应该下载哪些大文件,或者在下载后如何准确地处理适当的文件。

如果您已经成功安装了允许您查询维基词典数据集的本地副本的设置,我将非常感谢您如何实现这一点的分步详细信息。

0 投票
2 回答
1056 浏览

wikipedia - 有没有办法在不抓取的情况下提取维基词典数据?

我知道维基百科有 DBPedia,但维基词典中是否存在类似的东西?我想将https://en.wiktionary.org/wiki/Category:en:Occupations之类的内容转换为 JSON 或类似格式。

0 投票
0 回答
76 浏览

sparql - dbnary SPARQL 查询产生零结果,如何查找原因?

我在使用 SPARQL 和 Wikidata 方面有一些基本经验,现在我正在尝试我在DBnary中的第一步,尝试从 Wiktionary 中提取结构化 RDF 数据。

他们给出的第一个示例加载了英语单词cat的所有可用德语翻译,效果很好

现在我尝试了同样的方法来获取意大利语单词voglia的所有英文翻译( voglia的含义在英语意大利语维基词典中都可用)。但以下 SPARQL不会产生任何结果

我也得到了许多其他词的零结果。

我怎样才能找出问题所在?是我的查询,还是数据?如何检查DBnary中是否存在 voglia 这个词?

0 投票
1 回答
1310 浏览

open-source - 我在哪里可以找到维基百科/维基词典模板的源代码?

维基百科及其姊妹网站大量使用模板。我想找到这些模板背后的源代码,即从给定模板引用呈现 HTML 的代码。

这里,我发现了一些似乎处理模板的文件,但是在查找特定文件时找不到任何结果。例如,{es-conj-ir}为给定西班牙语动词呈现变位表的模板没有出现在搜索列表中。

0 投票
0 回答
149 浏览

parsing - 如何解析维基词典模板和模块

我很难解析模块和模板

实际上我找不到如何使用 API 获取该数据

这里我举个简单的例子

https://en.wiktionary.org/wiki/%C3%A7al%C4%B1%C5%9Fmak

它使用了许多模块和模板,并且它们的解析结果不包含在转储文件中

那么我怎样才能得到解析的结果

例如要获得这个动词的变位çalışmak,这是写在源代码中的

那么如何从 API 中获取该部分的解析结果呢?

例如,维基词典在下面的页面解释了如何使用模板

https://en.wiktionary.org/wiki/Wiktionary:模板

从那里我打开了https://en.wiktionary.org/wiki/Template:en-noun

从那里它给出了一个例子{{en-noun|es}}

所以当我们打开游行页面时

https://en.wiktionary.org/wiki/march#Verb

我们看到复数形式写成{{en-verb|es}}

它被解析为march (third-person singular simple present marches, present participle marching, simple past and past participle marched)

所以我需要以某种方式得到解析的部分

所以我想要实现的很简单

我给出单词或页面 id、模板,然后我得到解析结果

例如,我给这个词march给模板{{en-verb|es}},我得到解析的结果是march (third-person singular simple present marches, present participle marching, simple past and past participle marched)

如果输出更有条理,那就更好了,但这也很好

0 投票
1 回答
108 浏览

mediawiki-api - 将维基文本从维基词典更改为可读文本

如何将 Wikitext(如 Witkionary 源代码中所见)交换为可读文本(如 Wiktionary 网站中所见)。

所以这个来源:

应视为:

它在 Wikitext 中被称为模板,但是我在文档中找不到如何将该模板更改为人类可读的文本。

以前有人遇到过类似的问题吗?

0 投票
1 回答
82 浏览

api - 查询维基词典只返回几个单词

我正在尝试从维基词典中获取所有西班牙语名词。我只需要标题,而不需要每个单词的含义。在其他类似的帖子之后,我尝试了这个查询:

但它只返回第 10 个:

我应该怎么做才能获得从 A 到 Z 的所有名词标题?

0 投票
1 回答
165 浏览

mediawiki - 英语维基词典 API:输出中缺少变格表

又一个英语维基词典解析问题。

总的来说,我准备好解析 wikitext 格式,所以标准 API 适合我。

问题是我想使用英语维基词典 API 来获取变格表。出于某种奇怪的原因,这些表由代码引用。有时它们在输出中,但在大多数情况下它们都丢失了。例如,调用像http://en.wiktionary.org/w/api.php?format=xml&action=query&titles=крот&rvprop=content&prop=revisions&redirects=1这样的俄语单词会产生:

如何将其转换为完整的变格表?

我从这里玩了一堆参数:https ://www.mediawiki.org/wiki/API:Query - 没有结果。

我发现的一种解决方法是使用新的 Wiktionary RESTful API,如下所示:https ://en.wiktionary.org/api/rest_v1/page/html/крот (参考:https ://en.wiktionary.org/api/ rest_v1/#/)。但它只返回 HTML,更难解析!

这是可以做到的最好的吗?

也许对变格表有特殊要求吗?我的意思是,如果它被生成,那么一定有办法。

0 投票
0 回答
32 浏览

dictionary - 从 xml 转储模板中提取德语动词变位

我想从维基词典 XML 转储开始获得一个规范化的德语动词变位列表。

我想我可以设法解析 XML 转储,但我不明白维基词典如何将 Flexion 模板转换为标准化显示,例如https://de.wiktionary.org/wiki/Flexion:lesen

这似乎是从:

指向此规范化代码的指针将不胜感激。我在 GitHub 上找到了许多用于维基词典的 XML 解析器,但似乎没有一个涵盖动词变位,其他有关维基词典的问题似乎也没有涵盖这一点。

提前谢谢了