问题标签 [data-dump]

问问题

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

58 问题

0 投票

1 回答

513 浏览

excel - 使用excel验证数据源

我想知道是否有一个函数或公式可以用来验证样本数据源 1（多行）到数据源 2（多行）。

示例：来源 1 单元格 A1（文档）- 123 单元格 A2（div）- SED 单元格 A3（金额）- $100 单元格 A4（行）- 01

源 2 将是 doc、div、amount 和 line 的不同组合的数据转储。我想知道是否有一个公式或函数可以用来查看 Source 1 是否与 Source 2 中的任何记录匹配。它必须是完美匹配。

2015-08-13T12:29:51.813

0 投票

1 回答

42 浏览

python - 拆分文件会显着增加其大小

我将 4GB 维基词典 XML 数据转储分解为更小的文件，没有重叠，用 Python 处理它并保存不同的页面 (...)。

相同的信息，在不同的文件中拆分，正在膨胀到 18+ GB。

为什么会这样？有没有办法避免这种情况？

python xml bigdata data-dump

2015-10-29T18:19:06.847

0 投票

1 回答

2235 浏览

firebird - FBexport - isc_dsql_prepare 失败 - 无法输出

我正在使用名为 fbexport 的 firebird 工具从数据库中转储表数据。我所做的是：

启动 cmd，导航到 fbexport 所在的目录
输入命令：

FBExport.exe -D "c:\DB.GDB" -U sysdba –P masterkey -Si -V WIZYTY -F test.out

不幸的是，我收到了一个错误：

任何想法如何使它工作？

firebird data-dump fbexport

2016-03-08T15:23:32.537

0 投票

1 回答

43 浏览

database-design - 对 SO 的数据库模式感到困惑

我正在调查SEDE，因为需要开发一个内部使用的 QA 平台，注意到有一个表Votes将用户的 upvote/downvote/favorite/etc 存储到帖子中，当投票类型为 upvote 或 downvote 时，此表的 userid 为 null，如图所示在这里，但在我的 SO 个人资料的 Votes Cast 下肯定有赞成和反对的历史！这怎么会发生？StackExchange 公开的那些表是不完整的，还是我遗漏了什么？

谢谢您的回复。

database-design data-modeling qa data-dump sede

2016-05-09T12:33:18.933

0 投票

0 回答

206 浏览

python - 非常大的写入密集型 MySQL 导入

我有（我会考虑的）大量纯文本文件，大约 400GB，它们被导入 MySQL 数据库（InnoDB 引擎）。.txt 文件大小从 2GB 到 26GB 不等，每个文件代表数据库中的一个表。我得到了一个解析 .txt 文件并构建 SQL 语句的 Python 脚本。我有一台专门用于此任务的机器，具有以下规格：

操作系统 - Windows 10
32GB 内存
4TB硬盘
i7 3.40 GHz 处理器

我想优化此导入，使其尽可能快速和肮脏。我已根据堆栈 O 问题、MySQL 文档和其他来源更改了 MySQL my.ini 文件中的以下配置设置：

我错过了配置文件中的其他设置（可能是日志记录或缓存），这些设置会指导 MySQL 使用机器资源的很大一部分？我会错过另一个瓶颈吗？

（旁注：不确定这是否相关 - 当我开始导入时，该mysqld过程会加速使用大约 13-15% 的系统内存，但是当我停止 Python 脚本继续导入时，它似乎永远不会清除它。我想知道这是否是由于弄乱了日志记录和刷新设置。提前感谢您的帮助。）

（编辑）

这是填充表格的 Python 脚本的相关部分。似乎脚本正在为每 50,000 条记录连接、提交和关闭连接。我可以删除conn.commit()函数末尾的并让 MySQL 处理提交吗？下面的评论while (true)来自脚本的作者，我已经调整了这个数字，使其不会超过 max_allowed_packet 大小。

python mysql database windows data-dump

2016-05-23T20:57:45.570

0 投票

1 回答

104 浏览