问题标签 [softmax]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
801 浏览

caffe - 为什么 FCN 可以使用 softmax 作为其损失函数?

全卷积网络使用 softmaxloss 作为其损失层,但语义识别是一个多标签任务,不能将其视为概率问题。我理解错了吗?

0 投票
1 回答
60 浏览

machine-learning - MLP 给出不准确的结果

我尝试构建一个具有 2 个隐藏层和 3 个输出类的简单 MLP。我在模型中所做的是:

  • 输入图像是 120x120 rgb 图像。展平尺寸(3 * 120 * 120)

  • 2 个大小为 100 的隐藏层。

  • 使用relu激活

  • 输出层有 3 个神经元

代码

优化器

然而,该模型不起作用。准确度仅等于随机模型的准确度。下面的例子是这个: https ://github.com/aymericdamien/TensorFlow-Examples/blob/master/examples/3_NeuralNetworks/multilayer_perceptron.py

0 投票
1 回答
3751 浏览

python - Numpy Softmax - 具有多个元素的数组的真值是不明确的。使用 a.any() 或 a.all()

我正在使用 softmax 函数从神经网络获取输出,并在计算误差时获取最小值作为输出。

但是,如果假设 [0,0,0] 的输出相同,则 softmax 函数的输出为 [0.33,0.33,0.33]

因此,当从中选择最小值时,

它给出了以下错误,因为有多个相等的最小值,

Traceback(最近一次调用最后一次):
文件“ann.py”,第 234 行,在模块中

learn()
文件“ann.py”,第 97 行,在学习中

我的 = min(tarminout)

ValueError:具有多个元素的数组的真值不明确。使用 a.any() 或 a.all()

当有超过 1 个相等的最小值时,我怎样才能通过只选择其中一个来通过它?

谢谢

0 投票
1 回答
479 浏览

tensorflow - 本文档中的 softmax_w 和 softmax_b 是什么?

我是 TensorFlow 新手,需要训练语言模型,但在阅读文档时遇到了一些困难,如下所示。

我不明白为什么需要这条线,

因为我了解到,一旦计算出输出并且知道 target_words,我们就可以直接计算损失。伪代码似乎增加了一层。另外,没有提到的softmax_w和softmax_b是什么。我想我可能因为提出这样一个简单的问题而错过了一些重要的事情。

请指出我正确的方向,任何建议都将受到高度赞赏。非常感谢。

0 投票
2 回答
2572 浏览

tensorflow - tensorflow - softmax 忽略负面标签(就像 caffe 一样)

在 Caffe 中,它的 SoftmaxWithLoss 函数有一个选项可以在计算概率时忽略所有负标签 (-1),因此只有 0 或正标签概率加起来为 1。

Tensorflow softmax loss 有类似的功能吗?

0 投票
1 回答
6926 浏览

machine-learning - softmax 的输出不应该是零,对吧?

我正在使用 tensorflow 中的网络来生成一个向量,然后将其传递给作为我的输出的 softmax。

现在我一直在对此进行测试,奇怪的是,向量(通过 softmax 的向量)在所有坐标中都为零,但只有一个。

根据 softmax 对指数的定义,我认为这不应该发生。这是一个错误吗?

编辑:我的向量是 120x160 =192000。所有值都是 float32

0 投票
1 回答
1240 浏览

machine-learning - 如何在张量流的 Softmax 分类器中使用验证监视器

我只是编辑https://github.com/tensorflow/tensorflow/blob/r0.10/tensorflow/examples/tutorials/mnist/mnist_softmax.py 以使用验证监视器启用日志记录

但是我很困惑如何 在这个程序中设置validation_monitor 。我在 DNNClassfier中学习过,validation_monitor 以 flowwing 方式使用

那么,我如何在 softmax_classifer 中使用 validation_monitor 呢?

0 投票
1 回答
2211 浏览

tensorflow - Inception 模型有两个 softmax 输出吗?

Inception v3 模型如下图所示:

初始 v3 模型

图片来自这篇博文:

https://research.googleblog.com/2016/03/train-your-own-image-classifier-with.html

似乎有两个 Softmax 分类输出。这是为什么?

在 TensorFlow 示例中使用哪一个作为该文件中名称为“softmax:0”的输出张量?

https://github.com/tensorflow/tensorflow/blob/master/tensorflow/models/image/imagenet/classify_image.py

Inception v3 模型的学术论文似乎没有这个 Inception 模型的图像:

http://arxiv.org/pdf/1512.00567v3.pdf

我试图理解为什么网络的这两个分支具有看似两个不同的 softmax 输出。

感谢您的澄清!

0 投票
0 回答
539 浏览

numpy - TensorFlow 测试精度为 1,所有 SoftMax 值为 0.5

在 TensorFlow 示例中,我用自己的数据代替了 MNIST 数据,其中我有 2d 数组作为模型输入 (x),即:

[[379 1] [412 2] ... [205 1] [504 8]]

和一维输出(y),即:

[20, 24, ... 19, 27]

以下代码[0.5, 0.5]为所有训练步骤生成 2d 数组,为测试数据生成 1 个数组(当随机生成测试数据时)。此外,所有权重和偏差都为零。

我从根本上错过了什么吗?

0 投票
4 回答
280 浏览

tensorflow - Softmax 返回单位矩阵

我对softmax, 的输入y = tf.nn.softmax(tf.matmul(x, W) + b)是一个有值矩阵

但是当它被输入时softmax,我得到:

导致我的训练输出是一个1s 数组,这意味着每批训练数据的权重W或偏差都不会更新。b这也导致我的准确性是1在一组随机的测试数据上

下面是我的代码: