我对使用 XML 转储的 Wikipedia 法语转储有疑问。我遇到了重音字符的问题。
当我安装 Mediawiki 时,我选择了 innoBdb,这是我的 MySQL 配置:
输入密码:
欢迎使用 MySQL 监视器。命令以 ; 结尾 或\g。
您的 MySQL 连接 ID 为 179
服务器版本:5.5.8-log MySQL Community Server (GPL)
mysql > status
c:/wamp/bin/mysql/mysql5.5.8/bin/mysql.exe Ver 14.14 Distrib 5.5.8,适用于 Win32 (x86)
连接 ID:179 当前数据库: 当前用户:root@localhost SSL:未使用 使用分隔符:; 服务器版本:5.5.8-log MySQL Community Server (GPL) 协议版本:10 连接:通过 TCP/IP 的本地主机 服务器字符集:latin1 Db 字符集:latin1 客户端字符集:cp850 康涅狄格字符集:cp850 TCP端口:3306 正常运行时间:3 小时 47 分 6 秒 主题:8 问题:35648 慢查询:3 打开:976 冲洗表:1 打开 表:50 每秒平均查询数:2.616
我正在使用 Mwdumper,这是我的命令代码
set class=mwdumper.jar;driver_mysql.jar
set data="frwikis_fr.xml"
java -client -classpath %class% org.mediawiki.dumper.Dumper "--output=mysql://127.0.0.1/my_wiki?user=root&password=" "--format=sql:1.5" %data%
--default-character-set=utf8
pause
转移到sql数据库很好,但是当我尝试检索文章时,重音字符不好。我能做些什么?