我有一个应用程序,它必须从视频中提取颜色信息,它通过分析每一帧来做到这一点。首先,我提取帧,然后将它们的位置数组加载到内存中。正如您可能想象的那样,即使是一个小视频也可能有数千个。
我用来提取每个帧颜色信息的函数是一个承诺,所以我选择批量处理一组承诺Promise.all
对于每个文件的绝对路径,我读取文件,fs
然后将其传递以进行处理。我已经使用许多独立图像完成了此操作,并且知道该过程只需要大约一秒钟,但突然间处理一张图像需要将近 20 分钟。我终于发现使用promisify
onfs.readFile
是造成瓶颈的原因。我不明白的是为什么?
在第一个fs.readFile
中,在返回的 Promise 中进行了转换,而在第二个fs.readFile
中,它只是像往常一样使用,我等待 resolve 被调用。我不介意使用无承诺的,我只是好奇为什么这会导致这么慢?
我停止使用promisify
该应用程序的第二秒速度恢复到 1 帧/秒
慢代码:
async analyzeVideo(){
await this._saveVideo();
await this._extractFrames();
await this._removeVideo();
const colorPromises = this.frameExtractor.frames.map(file => {
return new Promise(resolve => {
//transform image into data
const readFile = promisify(fs.readFile);
readFile(file)
.then(data => {
const analyzer = new ColorAnalyzer(data);
analyzer.init()
.then(colors => {
resolve(colors)
})
})
.catch((e)=> console.log(e));
})
});
const colors = await runAllQueries(colorPromises);
await this._removeFrames();
this.colors = colors;
async function runAllQueries(promises) {
const batches = _.chunk(promises, 50);
const results = [];
while (batches.length) {
const batch = batches.shift();
const result = await Promise.all(batch)
.catch(e=>console.log(e));
results.push(result)
}
return _.flatten(results);
}
}
快速代码:
async analyzeVideo(){
await this._saveVideo();
await this._extractFrames();
await this._removeVideo();
const colorPromises = this.frameExtractor.frames.map(file => {
return new Promise(resolve => {
//transform image into data
fs.readFile(file, (err, data) => {
const analyzer = new ColorAnalyzer(data);
analyzer.init()
.then(colors => {
resolve(colors)
})
});
})
});
const colors = await runAllQueries(colorPromises);
await this._removeFrames();
this.colors = colors;
async function runAllQueries(promises) {
const batches = _.chunk(promises, 50);
const results = [];
while (batches.length) {
const batch = batches.shift();
const result = await Promise.all(batch)
.catch(e=>console.log(e));
results.push(result)
}
return _.flatten(results);
}
}