问题标签 [imagedata]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
unsupervised-learning - 创建数据集以仅输入图像
我需要一个仅包含用于 Chainer 框架中无监督学习的图像的数据集对象。我正在尝试为此目的使用 DatasetMixin。
图像是包含图像的列表。
SimpleDataset 类似乎无法读取图像,因为在运行 trainer.run() 时出现错误:
在将图像列表放入 DatasetMixin 类之前,我是否需要进一步处理它?
使用 DatasetMixin 以这种方式只提供图像有什么问题吗?
我该怎么做才能将图像(没有任何标签或其他东西)提供给我的模型?
javascript - Javascript Canvas 从图像中获取数据并显示它
我不知道为什么这不起作用。图像的 src 属性随着新数据的变化而改变,但图像实际上是不可见的。我尝试了几个不同的图像。它只是浏览器中的 javascript,需要 Jquery。
我尝试了几个不同的图像,都是 png 。目前这是该项目的全部代码,所以我没有预见到任何可能干扰它的东西。
结果是这样,但看不到图像:
编辑:似乎它可能错误地从图像中获取数据,但我不知道为什么......我的意思是为什么它会获取数据但不完整或不正确?
database - 用于大型媒体嵌套元数据查询的最快 AWS DB 服务
我正在尝试确定最适合(主要在速度方面)用于查询媒体内容元数据的数据库服务,例如位于 AWS S3 上的图像/视频/音频。目前我正在研究 DynamoDB 和 Redshift,但我可能没有考虑过更好的选择。
示例用例:
我有数以百万计的图像(和图像的裁剪部分)通过机器学习全图像分类、边界框对象检测和像素分割(RLE 像素标记)模型的网络运行,其中预测嵌套标签和属性/分数分配的。嵌套结构不断发展。例如,图像可以由全图像分类器预测并给出标签“outside”,发送到对象检测器,该对象检测器检测具有 x/y/width/height 坐标的多个“person”标签的边界框位置,然后这些作物可能会被发送到另一个完整(小)图像检测器,该检测器将这些预测的人物作物分类为“坐着”或“站着”。我希望能够快速查询嵌套元数据以获取图像 ID'
具体查询示例:
标有整幅图像分类标签“outside”的所有图像的 S3 位置是什么,对象检测标签“person”的计数 >= 两次,并且其中至少一个人对象已被进一步分类为“sitting”。
我一直在浏览这个 AWS DB 产品页面,但不确定什么最适合这项任务。当然,如果有更好的非 AWS/S3 解决方案,我当然想知道。任何建议都非常感谢!
编辑:稍微更新了示例以更清楚地描述嵌套结构。
javascript - 无法从 ImageData 对象中获取像素
我正在尝试使用canvas
元素和 ImageData 类从图像中提取像素,但几乎没有成功。
我的代码是:
画布定义如下:
根据MDN,该data
字段应该是 UInt8 的 4194304 (1024*1024*4) 大小的数组。相反,我得到了一个奇怪的嵌套结构(如图所示),所有值都是 0。图像是 1024*1024 PNG 图像。
我在哪里做错了?
canvas - 避免两个完整副本从 WebAssembly 更新画布?
在 JavaScript 中,我可以直接操作画布的像素并使用单个副本刷新它们:
但是在 wasm 中,我们必须TypedArray
使用 wasm 内存分配我们自己的内存,然后我们可以使用imageData.data.set(myTypedArray)
但是这似乎只是将新类型数组的全部内容复制到画布的类型数组中,它仍然必须跟随putImageData
,复制整个内容 a第二次。
有什么方法可以将画布的 ImageData 重新分配给我们的新 ImageData,以便我们可以只使用一个副本更新画布ctx.putImageData()
?
如果不是这样,使用 wasm 操作图像的大部分好处似乎都会被低效的双重复制和双重内存表示所浪费,尤其是在处理大图像和/或不断更新画布时。
swift - 将 ImageData 从一个视图控制器传递到另一个视图控制器
您好,我之前也遇到过这种情况。我有想要从一个视图控制器传递到另一个视图控制器并在图像视图中显示该数据的图像数据。在第二个 VC 的 viewdidload 中,数据打印正确,但是当我尝试将该数据插入到第二个 VC 图像视图中时,图像视图为空白。您可以从输出中看到打印图像数据返回 nil。
安慰:
205,397 字节
零
javascript - 从 ImageData 数组生成水平精灵图像
我正在尝试从 ImageData 数组构建一个水平透明图像,它将用作动画的精灵图像。您能否解释一下,如何将帧传递给更宽的画布(宽度 X countFrames)以及如何在迭代中移动 ImageData 宽度的偏移量?谢谢你。
python - 在python中对图像数据进行欠采样
欠采样的主要思想是随机删除具有足够观察值的类,以便两个类的比较比率在我们的数据中是显着的。那么,如何在 python 中对图像数据进行欠采样呢?请帮我:(
我从 Kaggle 获取眼底图像数据。有 5 个类别的 35127 张图像。0类:25810数据,1类:2443数据,2类:5292数据,3类:873数据,4类:708数据,
我希望每个班级在第 4 节课之后有多达 708 张图像。如何删除 Python 中的其余图像?
python - Python Keras - ImageDataGenerator 中的自定义标签
我目前正在创建一个 CNN 模型,用于对字体是否为Arial
、Verdana
和Times New Roman
进行分类Georgia
。总而言之,有类,16
因为我还考虑过检测字体是regular
,bold
还是. 所以。italics
bold italics
4 fonts * 4 styles = 16 classes
我在训练中使用的数据如下:
下面是我的初始代码:
我计划在网络中有 4 个输出节点:
但是生成的标签ImageDataGenerator
是一个16 bits
标签
我将如何为我的课程分配自定义标签?我希望我的标签是:
它的目的是使我的网络的输出节点/最后一个密集层从节点16
到4
节点,因此,架构不那么复杂。