问题标签 [softmax]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
caffe - 为什么 FCN 可以使用 softmax 作为其损失函数?
全卷积网络使用 softmaxloss 作为其损失层,但语义识别是一个多标签任务,不能将其视为概率问题。我理解错了吗?
machine-learning - MLP 给出不准确的结果
我尝试构建一个具有 2 个隐藏层和 3 个输出类的简单 MLP。我在模型中所做的是:
输入图像是 120x120 rgb 图像。展平尺寸(3 * 120 * 120)
2 个大小为 100 的隐藏层。
使用relu激活
输出层有 3 个神经元
代码
优化器
然而,该模型不起作用。准确度仅等于随机模型的准确度。下面的例子是这个: https ://github.com/aymericdamien/TensorFlow-Examples/blob/master/examples/3_NeuralNetworks/multilayer_perceptron.py
python - Numpy Softmax - 具有多个元素的数组的真值是不明确的。使用 a.any() 或 a.all()
我正在使用 softmax 函数从神经网络获取输出,并在计算误差时获取最小值作为输出。
但是,如果假设 [0,0,0] 的输出相同,则 softmax 函数的输出为 [0.33,0.33,0.33]
因此,当从中选择最小值时,
它给出了以下错误,因为有多个相等的最小值,
Traceback(最近一次调用最后一次):
文件“ann.py”,第 234 行,在模块中learn()
文件“ann.py”,第 97 行,在学习中我的 = min(tarminout)
ValueError:具有多个元素的数组的真值不明确。使用 a.any() 或 a.all()
当有超过 1 个相等的最小值时,我怎样才能通过只选择其中一个来通过它?
谢谢
tensorflow - 本文档中的 softmax_w 和 softmax_b 是什么?
我是 TensorFlow 新手,需要训练语言模型,但在阅读文档时遇到了一些困难,如下所示。
我不明白为什么需要这条线,
因为我了解到,一旦计算出输出并且知道 target_words,我们就可以直接计算损失。伪代码似乎增加了一层。另外,没有提到的softmax_w和softmax_b是什么。我想我可能因为提出这样一个简单的问题而错过了一些重要的事情。
请指出我正确的方向,任何建议都将受到高度赞赏。非常感谢。
tensorflow - tensorflow - softmax 忽略负面标签(就像 caffe 一样)
在 Caffe 中,它的 SoftmaxWithLoss 函数有一个选项可以在计算概率时忽略所有负标签 (-1),因此只有 0 或正标签概率加起来为 1。
Tensorflow softmax loss 有类似的功能吗?
machine-learning - softmax 的输出不应该是零,对吧?
我正在使用 tensorflow 中的网络来生成一个向量,然后将其传递给作为我的输出的 softmax。
现在我一直在对此进行测试,奇怪的是,向量(通过 softmax 的向量)在所有坐标中都为零,但只有一个。
根据 softmax 对指数的定义,我认为这不应该发生。这是一个错误吗?
编辑:我的向量是 120x160 =192000。所有值都是 float32
machine-learning - 如何在张量流的 Softmax 分类器中使用验证监视器
我只是编辑https://github.com/tensorflow/tensorflow/blob/r0.10/tensorflow/examples/tutorials/mnist/mnist_softmax.py 以使用验证监视器启用日志记录
但是我很困惑如何 在这个程序中设置validation_monitor 。我在 DNNClassfier中学习过,validation_monitor 以 flowwing 方式使用
那么,我如何在 softmax_classifer 中使用 validation_monitor 呢?
tensorflow - Inception 模型有两个 softmax 输出吗?
Inception v3 模型如下图所示:
图片来自这篇博文:
https://research.googleblog.com/2016/03/train-your-own-image-classifier-with.html
似乎有两个 Softmax 分类输出。这是为什么?
在 TensorFlow 示例中使用哪一个作为该文件中名称为“softmax:0”的输出张量?
Inception v3 模型的学术论文似乎没有这个 Inception 模型的图像:
http://arxiv.org/pdf/1512.00567v3.pdf
我试图理解为什么网络的这两个分支具有看似两个不同的 softmax 输出。
感谢您的澄清!
numpy - TensorFlow 测试精度为 1,所有 SoftMax 值为 0.5
在 TensorFlow 示例中,我用自己的数据代替了 MNIST 数据,其中我有 2d 数组作为模型输入 (x),即:
[[379 1]
[412 2]
...
[205 1]
[504 8]]
和一维输出(y),即:
[20,
24,
...
19,
27]
以下代码[0.5, 0.5]
为所有训练步骤生成 2d 数组,为测试数据生成 1 个数组(当随机生成测试数据时)。此外,所有权重和偏差都为零。
我从根本上错过了什么吗?
tensorflow - Softmax 返回单位矩阵
我对softmax
, 的输入y = tf.nn.softmax(tf.matmul(x, W) + b)
是一个有值矩阵
但是当它被输入时softmax
,我得到:
导致我的训练输出是一个1
s 数组,这意味着每批训练数据的权重W
或偏差都不会更新。b
这也导致我的准确性是1
在一组随机的测试数据上
下面是我的代码: