问题标签 [labeling]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 在每个大陆上赋予散点不同的颜色 [Python]
我已经被困在一个任务上几个小时了。
我有一个包含 300000+ 居民 + 坐标的所有城市的 excel 文件。我必须在全球地图上绘制它们。为此,我有以下代码:
现在我必须给每个大陆上的点另一种颜色(例如南美洲橙色,欧洲蓝色......)。
我还必须用它的居民数量来标记每个点。
有任何想法吗?
sequence - 如何使用 LSTM 在 caffe 中执行序列标记
我查看了使用 LSTM 进行分类的 LRCN 示例( http://tutorial.caffe.berkeleyvision.org/caffe-cvpr15-sequences.pdf )。对于视频分类,进行多数投票。这是为什么?我会假设一个等到序列结束?
在我的玩具中,例如二进制计数,我以两种不同的方式输入标签。首先,我用序列标签标记了每个时间步。其次,我用 ignore_label 标记了每个时间步,但最后一个。为简单起见,我使用了 50 的序列长度和 50 的批量大小。这两种方法都会导致一个网络,当我部署它时,我在每个时间步都会收到相同的输出。
编辑:玩具示例有效,如果不是对整个序列进行分类,而是预测下一个数字。因此,对于每个数字,都存在一个标签。这不是现实世界序列分类任务的解决方案。使用 Kaparthy 的帖子(http://karpathy.github.io/2015/05/21/rnn-effectiveness/)我创建了以下网络:
求解器的重要部分:我已经玩了一点,lr_policy: INV
但最后我尝试了 fix
- 没有序列范围超过 2000。
- 我已经并排放置了 10 个序列。
- 我将我的数据嵌入到一个大小为 132 的热向量中。
- 我的数据 HDF5 文件具有以下尺寸:XX*10*132*1
- 我的数据在每个序列的末尾都有一个标签。每个其他标签都是 -1,并且在反向传播期间将被忽略。
- 为了提高效率,我将多个短序列打包在一起(它们低于 2000 个时间步长)。
对于分类,我使用了 python 接口。当我对一个序列进行分类时,会出现以下情况:
在图像中可以看到,对于每个时间步,都计算了相同的概率。
cytoscape.js - Cytoscape.js:两侧的边缘标记
在 Cytoscape.js 中是否可以对边进行双重标记,即在连接节点旁边的两端显示两个字符串?
stata - 按组生成 id
我在 Stata 中有一个无法解决的问题。我的数据集看起来像以下块的前两列,我想添加第三列,其中newvar
随时重置id
其值newvar
保持观察的顺序很重要,所以我不能按组排序生成它。
layout - 使用 graphviz 标记/标记节点边缘连接点
使用 Graphviz,我知道我可以标记边和顶点。但是如果我想标记一些连接怎么办?也就是说,标记特定边缘与特定顶点相交的一些点?那可能吗?
笔记:
- 我不在乎beatuy /视觉风格,我会采取一些简单而肮脏的东西(ish)
- 我宁愿不使用“技巧”,例如将顶点标签隔开以使某些文本出现在连接点和类似方法旁边。
tensorflow - TensorFlow 双向 GRU 返回 ValueError 因为形状不正确
我正在使用 TensorFlow 0.9 版实现双向标记 GRU 网络(前一层,后一层)。在模型初始化时,TensorFlow 会初始化所有变量,创建 GRU 单元并正确应用所有常规转换,直到运行该tf.nn.bidirectional_rnn
函数,它会抛出与形状不正确的张量合并操作相关的 ValueError。这是代码:
当我运行它时,我收到以下错误:
现在,函数的输入bidirectional_rnn
是:
self.char_gru_cell_fw
char_hidden_size
:这是一个 GRUCell 实例,在这种情况下用整数值 50 初始化
self.char_gru_cell_bw
char_hidden_size
:这是一个 GRUCell 实例,在这种情况下用整数值 50 初始化
chargruinput
:这是一个长度为 30 的列表,包含形状为 [ batch_size
, charvocab
] 的张量,在本例中为 [32,256]
sequence_length
: 一个整数,表示展开单元格的数量,char_num_steps
在本例中为 30。
initial_state_fw
: 一个与 GRU 状态相同形状的零填充张量,在本例中为 [32,50]
initial_state_bw
: 一个与 GRU 状态相同形状的零填充张量,在本例中为 [32,50]
我尝试查看导致抛出 ValueError 异常的模块,但是有很多低级的东西很可能工作正常,看看我上周工作的 CNN 是如何工作的,没有任何问题。这让我觉得在低级方法之前,rnn
orrnn_cell
库中出现了我以前没有使用过的问题。
这似乎也很奇怪,因为错误与空形状有关(与我假设的标量而不是张量相关联),但我唯一能够更改的是bidirectional_rnn
函数参数中的标量是sequence_length
参数。我尝试忽略它并仅使用初始状态,反之亦然,但会弹出相同的错误。
有没有人有类似的问题?我的整个系统都因此而瘫痪,希望得到一些反馈。提前致谢
image - 如何从彩色图像中删除/重新分配小像素区域(在边缘)?(MATLAB)
我有带有索引颜色的分割蒙版。不幸的是,物体边缘存在(彩色)噪声。在从一个颜色区域过渡到下一个颜色区域时,有不同颜色的小像素区域,将两个颜色区域分开(由转换边缘处的透明像素引起)。
我想通过分配相邻大区域之一的颜色来消除这种噪声(使用 MATLAB)。没关系,主要的事情是去除小区域。可以假设以这种方式可以移除任何颜色的小区域(重新分配给相邻的大区域)。
如果是二值图像,我可以使用bwareaopen
(在此问答中建议:删除图像中的小块标签)。将图像转换为每种颜色的二值图像可能是一种解决方法,但是这很昂贵(对于许多颜色)并且留下了重新分配的问题。我希望有更优雅的方法来做到这一点。
r - R创建范围因子水平
我想自动化以下过程:
从向量中获取最小值和最大值,并在给定特定步长的情况下定义从最小值到最大值的步长。向量内的每个值现在都被分配给一个label
(因子级别),该值属于该范围,例如"20-30"
当值为 时27.45
。
目前我正在使用这个for循环
嗯,它正在工作,但我确信有一个更好(并且可能更快)的方法来做到这一点。此示例针对minimum = 0
andmaximum = 100
和是固定的step-size = 10
。我正在寻找一种更通用的方法来做到这一点。
r - 在R中为圆形图自由放置顶点标签
我目前正在尝试在 R 中显示一个圆形图,能够将每个节点的标签放置在节点本身的旁边,但在节点本身之外。
我查看了一些答案,并尝试了一个建议我通过以下方式为每个节点本身指定以弧度给出的位置:
这主要是有效的,但是标签并没有按照需要精确放置(不是一个大问题),但是我无法使用 cex 调整字体的大小(这最终是一个足够大的问题,我决定寻找其他方法)。
在寻找更多答案后,我发现存在以下命令: text("label", locator(1)) 应该允许使用鼠标指针交互式放置文本。但是,当我运行它时,我收到以下错误:
我只是尝试对分别具有七个和八个节点的圆形图执行此操作,所以这是我正在运行以使用七个节点对其进行测试的内容:
对于任何格式化困难,我提前道歉,我可能会编辑问题以调整这些问题。
csv - 从 .pcap 文件标记互联网流量跟踪并以 .csv 格式保存
我有 .pcap 文件形式的互联网流量跟踪。我想根据它们是否属于 HTTP、FTP、DNS、P2P、SMTP 等来标记这些跟踪中的数据包,并将结果保存为 .csv 文件。我听说过称为 L7-filter 之类的 DPI 工具,但找不到如何使用它们,也不知道它们是否可以完成这项标记工作。我想在训练机器学习分类器时使用这些标记的记录。任何人都可以通过详细提供解决方案来帮助我吗?请提供任何替代方法(如果有用)。