问题标签 [chunking]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
2 回答
564 浏览

ruby - 在分块 Ruby 数组时获取块的开始索引作为结果的一部分

我有一种情况,我想将初始化的数组nils分成空段和包含连续数字运行的段。

我发现高阶chunk函数 为Array这个问题提供了一个优雅的解决方案:

但是,假设我希望输出还包含每个块中原始数组的起始索引,即将上面的输出增加为:

是否有一种解决方案可以保留上述块片段的表现力?

提前致谢。

0 投票
1 回答
27052 浏览

file-upload - 如何按块上传大文件?

我有一个小文件共享网页。使用它是免费的。我想上传 0mb 到 1GB 的文件。两天以来我一直在谷歌搜索,但我找不到任何我需要的东西......

我的网页:http ://boxy.tigyisolutions.hu但是我现在只能上传 20-30mb。我想一次只上传一个文件。但它可能大于 500-600mb ......有人可以帮我吗?

我尝试了 jquery fileupload,但它没有为我上传任何内容。

0 投票
2 回答
3432 浏览

python - 用 nltk 分块

如何从给定模式的句子中获取所有块。示例

标记的句子:

如果我解析我得到

我还想有另一种选择

0 投票
1 回答
272 浏览

mysql - 将 VARCHAR 字段拆分为 2 行 MySQL

我有一个充满电子邮件的数据库。它包含收件人、发件人、主题、正文等作为列。我试图输出基本相同的格式,但对于我将使用输出文件的应用程序,正文不能超过大约 300 个字符。我不想只抓取前 300 个字符,因为我需要所有文本。我想要做的是将文本分块,这样如果电子邮件正文是 900 个字符,则返回 3 个单独的行,每行包含消息的三分之一,并且所有行都包含收件人、发件人、主题等信息。

即)我有这个:

我要这个:

谢谢!

0 投票
2 回答
530 浏览

r - 如何在 R 中对数组进行分块处理?

我正在计算两个数据集之间的相关性,但由于数据量很大(10 GB),而我的 RAM 只有 6 GB,我面临内存问题。我想知道如何分块我的代码?

但是得到了这个错误:

0 投票
1 回答
99093 浏览

python - Python 读取大型文本文件(几 GB)的最快方法

我有一个大文本文件(~7 GB)。我正在寻找是否存在读取大文本文件的最快方法。我一直在阅读有关使用几种方法逐块读取以加快该过程的信息。

例如effbot建议

为了每秒处理 96,900 行文本。其他作者建议使用 islice()

list(islice(f, n))将返回文件下一n行的列表f。在循环中使用它将为您提供成块的n文件

0 投票
1 回答
115 浏览

clojure - 懒惰没有按预期工作

评估时上面的代码片段打印出以下内容 -

(你好 0 你好 1 你好 2 你好 3 你好 4 你好 5 你好 6 你好 7 你好 8 你好 9 1 2 3)

因为 map 返回一个惰性序列,我希望它只打印 -

(你好 0 你好 1 你好 2 1 2 3)

为什么要在这里评估整个列表?

0 投票
3 回答
5805 浏览

file - 在第 N 次出现分隔符时拆分文件

在每第 N 次出现分隔符后,是否有一种方法可以将文本文件拆分成片段/块?

示例:下面的分隔符是“+”

有几百万个条目,因此在每次出现分隔符“+”时进行拆分是一个坏主意。例如,我想拆分分隔符“+”的每 50,000 个实例。

Unix 命令“split”和“csplit”似乎并没有这样做......

0 投票
1 回答
1532 浏览

python - 在 Python 中读取缓冲区中块的最节省内存的方法

我有一个行的文本文件(几 GB 和 ~ 1200 万行),其中每行是一个点 x、y、z 和附件信息。我希望逐块读取文件,处理点并拆分(遵循基于点位置的空间索引,尊重 0.25 m 的方形网格)结果在临时文件夹中的几个文本文件中。

哪里";"是分隔符和first two columns the x and y任何有用的给ID position

输出结果是另一个文本文件,其中每个 ID 仅随机提取一个点

前任:

其中前两列是 ID

最终输出将是(示例)没有 ID 值

我正在使用此博客中的解决方案

我的代码如下:

我的代码的主要问题是当大约 200 万个拆分文本文件保存在临时文件夹中时速度会降低。我想知道effbot.org是否有一种优化的方法来创建缓冲区的解决方案?

0 投票
0 回答
1210 浏览

c# - 将视频流保存在相机中的块中

我目前有一个 MJPEG 相机,我需要每隔一小时捕捉和保存它的视频。

我试图通过对传入数据进行分块并将其全部保存到一个文件中来实现这一点,但是创建的文件只是大约 1 秒长的视频流的损坏版本。

这是我所拥有的

所有这些都在后台工作人员中,并且我在线程中有一个计时器,可以在指定的时间内运行它。

我使用的这种方法是连接到流,但正如我所说的只保存一秒钟的视频,并且视频已损坏。