问题标签 [wiktionary]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 解析 MediaWiki wiki 的 XML 转储
我正在尝试解析维基词典的 XML 转储,但可能我遗漏了一些东西,因为我没有得到任何输出。
这是一个类似但更短的 xml 文件:
<title>
如果<ns>
元素等于 0 ,我有兴趣解析元素的内容。
这是我的脚本
xml - 提取一种语言形式的维基词典的最佳方法是什么?
我已经搜索但没有找到我想要的,即:
从维基词典中提取所有意大利语单词、词源和词性的最佳和最有效的方法......包括单词的复数形式(amico、amichi)。我想将它作为纯文本(不是 blob)放入 CSV(可能太大)或 MySQL 数据库中。
我想要英语中每个意大利语单词的必要记录。
mwdumper 也不断崩溃。
任何的建议都受欢迎!
java - 列表打印为空
我在 Java 中有一个 List,它的 isEmpty() 方法对某些条目返回 false。另外,当我检查这些条目的大小时,它是一个,但是当我打印列表时它是空的 []。是因为空格导致列表大小变成一个我的代码是这样的
这是我在控制台中看到的:相关含义:会议单词列表大小:1 单词列表:[] 列表为空:false
0:
相关含义:SCHEDULED Word List Size:1 Word List:[] Is List Empty:false 0:
api - 如何访问维基词典 API 中的“另见”字段?
许多汉字(汉字)的维基词典页面在页面顶部都包含指向其他类似字符的链接。我想使用维基词典 API在查询中发送单个字符并接收类似字符的列表作为响应。不幸的是,我似乎找不到任何包含“另见”字段的查询。这种查询可能吗?
mediawiki-api - 如何从维基词典下载一类词?
我想从维基词典下载所有可数名词(类别:英语可数名词),我在/enwiktionary/latest/ 的索引上
尝试了一些语料库,但似乎很难提取我想要的类别。谁能告诉我应该使用哪个以及如何提取特定类别的单词列表?或者有没有其他方法可以做到这一点,比如使用 API?
parsing - 如何解析维基词典 API?
缺乏在线资源来演示我如何解析维基词典 API 响应,如下所示:
基本上我想要的只是英文定义,但是响应格式太奇怪了,以至于这个词的所有内容都混杂成一个不可分割的大块。
- 是否有一种 API 方法可以获取实际JSON 格式的响应,其中英文定义只是一个 JSON 键?
- 我是否必须求助于正则表达式模式才能做到这一点,这看起来如何?
- 最后,为什么 API 设计者会返回这样的数据?我想判断并说他们不知道自己在做什么,但肯定是有原因的。
mediawiki - 维基词典导入看起来不像官方网站
这是正式版。这是我导入的副本的样子:
我使用的步骤如下:
- 使用 mwdumper(Java 应用程序)生成 enwiktionary-DATE_HERE-pages-meta-current 的 SQL 转储
- 将其导入到全新安装的 mediawiki 中。
- 冉
php maintenance/refreshLinks.php
有人可以指出我正确的方向吗?
php - 使用 PHP 将维基词典 XML 数据转储到 MySQL 数据库中
好吧,我只是想解析Wikimedia提供的维基词典数据转储。
我的意图是将 XML 数据转储到 MySQL 数据库中。我没有找到有关此 XML 结构的适当文档。此外,我无法打开该文件,因为它实际上非常大(~1 GB)。
我想用一些 PHP 脚本来解析它,但我对要继续的 XML 结构一无所知。因此,如果有人已经使用 PHP 解析(或知道任何解析工具)到 MySQL,请分享详细信息。如果在 PHP 中什么都没有,其他方法也可以。
我刚刚关注了这篇文章(http://www.igrec.ca/lexicography/installing-a-local-copy-of-wiktionary-mysql/)但没有成功..:(如果有人成功了过程,请帮助。在此先感谢。
c# - API 维基词典
我正在尝试使用维基词典的 API 来了解是否定义了某些单词。我看过开源的WiktionaryNET,他们使用以下代码:
在我的控制台代码中:
在 app.config 中:
我使用相同的东西,但结果总是“Definition.Count = 0”有人知道,我该如何使用或设置来获得结果?
在此先感谢您的帮助。