问题标签 [loss]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
33 浏览

lucene - Lucene ScoreDoc:发现分数显着下降

所以我写了一个小工具(给定一个查询)列出按查询分数排序的前 1000 个结果文档。显然,并非所有这些都是相关的。作为用户,我和其他人经常做以下事情:

  1. 看成绩
  2. 向下滚动列表,直到您看到“显着”的分数损失。

例如顶级文档的分数是这样的:4.2, 3.9, 3.9, 3.85, ..., 3.7, 0.3 , 0.3, 0.25, ... 通常我们可以说直到 3.7 分数之前的所有文档都是相关的,其余的(从 0.3 开始)都不相关。鉴于这个分数列表,这甚至是显而易见的,幸运的是,在我们的用例中它运行良好。

是否有任何最先进的算法可以在数字列表(这里是分数)中找到这样的“差距”/“损失”?

以下事实:

  • 热门文档总是相关的
  • 有一点与任何(或几乎没有)文件相关
  • 这一点可以通过分数的第一个差距来识别
0 投票
1 回答
994 浏览

java - 注释信息的Java反射丢失

我有反思的问题。我决定要使用反射创建一个 SQL 查询生成器。我创建了自己的注释来确定可以使用哪些类,可以存储哪些属性等。该代码按我的意愿工作,但是问题在于将此项目用作其他项目的依赖项。

我有另一个使用 OJDBC 的项目,我试图使用我的库来生成基于类的查询。但是,当我从我的 ojdbc 项目中传递一个类时,会丢失所有类信息,该类显示为 java.lang.Class,甚至注释信息也丢失了。有谁知道为什么会这样?

cls.getAnnotation(Storable.class)以下类传递给它时正在丢失信息

动物类在 ojdbc 项目中,而 appendTableName 方法属于我的查询生成器。我尝试将 querybuilder 项目生成到 jar 中并使用 maven install 将其添加到我的存储库中,但仍然没有运气。

感谢您的快速回复,但这不是问题,因为我创建的注释已将保留设置为运行时,请参见下文。

我的注释设置为运行时,但类信息仍然丢失。

0 投票
1 回答
280 浏览

machine-learning - 如何找到非凸函数的代理项

我正在学习排名。我发现某些损失函数(例如 0/1 损失)不能直接最小化为非凸或不连续等。这在其他损失函数的情况下也是如此。

因此研究人员使用了另一种称为“凸代理”的损失函数,它“限制”了 0/1 类型的损失,他们试图最小化损失函数的代理以找到参数(如果我理解正确的话)。

我的问题是,在给定非凸损失函数的情况下,找到代理函数的过程是什么?

我可以在哪里阅读我有一个非凸损失函数的步骤,并且我想设置它的代理损失?

还有我怎么知道某些函数是 0/1 损失的上限。

以及如何提出这个界限?

0 投票
1 回答
1541 浏览

python - 使用 sklearn 的梯度提升分类器损失函数 - 操作数不能一起广播

我对 sklearn Gradient Boosting Classifier 的 estimator.loss_ 方法有疑问。我试图将测试错误与一段时间内的训练错误进行比较。这是我的一些数据准备:

此时,当我打印出我的数组形状时

我得到:

分别。

所以我的形状根据 sklearn 文档是兼容的。但接下来,我尝试填充一个测试分数向量,以便将其与我的训练错误进行比较,如下所示:

我收到以下错误:

我不确定 47 是从哪里来的。我之前在另一个数据集上使用过相同的程序并且没有问题。任何帮助将非常感激。

0 投票
2 回答
1198 浏览

c++ - 交叉熵误差计算

我不完全理解如何计算交叉熵误差。由于一些负数的对数没有定义(或虚构的),并且神经网络的输出可能是一些负数(权重和偏差是随机初始化的),我经常得到 NaN 作为结果。我该如何避免呢?

例子:

0 投票
1 回答
489 浏览

regression - 自定义损失函数 Caffe(Spearman 系数)而 FNetuning(回归)

我正在为 caffe 中的回归问题微调 imagenet。目前我正在使用 Eucliden Loss,但我认为这对我来说没有任何好处。
我希望损失值是预测标签和实际标签之间的斯皮尔曼系数。我该怎么做?

请帮忙!

0 投票
0 回答
1381 浏览

python - TensorFlow卷积巨大的损失函数值

我一直在玩 TensorFlow Cifar10 演示(https://www.tensorflow.org/versions/master/tutorials/deep_cnn/index.html#convolutional-neural-networks),我遇到了以下有趣的在 Google 的演示代码中实现批量大小为 1 的 AlexNet(227x227 图像)时的输出:

2016-01-12 13:19:28.042847: step 0, loss = 208.40 (0.0 examples/sec; 28.081 sec/batch) 2016-01-12 13:19:37.991020: step 10, loss = 106981280.00 (2.3 examples/sec; 0.440 sec/batch) 2016-01-12 13:19:42.422207: step 20, loss = 318574152697306415104.00 (2.2 examples/sec; 0.446 sec/batch) 2016-01-12 13:19:46.824720: step 30, loss = 316031624417051148288.00 (2.3 examples/sec; 0.439 sec/batch) 2016-01-12 13:19:51.238086: step 40, loss = 313512247453630332928.00 (2.2 examples/sec; 0.449 sec/batch) 2016-01-12 13:19:55.676777: step 50, loss = 311012714476067618816.00 (2.3 examples/sec; 0.436 sec/batch) 2016-01-12 13:20:00.056848: step 60, loss = 308535664312269668352.00 (2.3 examples/sec; 0.438 sec/batch) 2016-01-12 13:20:04.442751: step 70, loss = 306075115618981380096.00 (2.3 examples/sec; 0.436 sec/batch)

为什么几批后loss值这么大?该网络似乎也没有收敛到任何高于随机的东西(我正在训练它以确定照片中的色彩平衡有多好)。我只会发布我更改的代码 - 除了小的目录名称更改和图像大小参数之外,其余的都可以在 TensorFlow 网站上找到。如果您需要查看更多代码,请告诉我。

0 投票
1 回答
24 浏览

testing - SQL Server宕机后的ASP开发?

场景:ISS 8.5 在我们的工作机器上,我们的 Microsoft SQL Server 目前已关闭了一段不确定的时间,而且我们没有备份。我们可以继续开发代码localhost。由于 SQL Server 已关闭,我们无法执行任何数据事务。是否有任何可靠的在线资源至少可以测试开发的 SQL 语法是否正确?

Edit: I will go ahead and eat my words. I had presumed that we were not allowed to install SQL Server Express locally. That was a bad guess. After I had sent our boss the suggestion from marc_s, he gave us the go-ahead. Now we have a back-up plan. For the record, the SQL Server is now online.

0 投票
1 回答
14790 浏览

machine-learning - 对数损失输出大于 1

我为欺诈领域的文档二进制分类准备了几个模型。我计算了所有模型的对数损失。我认为它本质上是在测量预测的置信度,并且 log loss 应该在 [0-1] 的范围内。我相信当结果 - 确定类别不足以用于评估目的时,这是分类中的一项重要措施。因此,如果两个模型的 acc、recall 和precision 非常接近,但一个模型的对数损失函数较低,则应该选择它,因为在决策过程中没有其他参数/​​指标(例如时间、成本)。

决策树的 log loss 为 1.57,对于所有其他模型,它在 0-1 范围内。我如何解释这个分数?

0 投票
0 回答
39 浏览

windows - 源端口更改时 Windows UDP 丢失

我正在尝试在 Windows 上实现 UDP 服务器,并使用模拟器进行性能测试。而且我发现如果源端口在变化,5000pps的时候包会丢失50%左右,但是如果源端口稳定的话,包是不会丢失的。我在 Windows 7 和 Windows Server 2008 上都试过这个,它们是一样的。但是在 Linux 上它运行得非常好。谁能告诉我为什么?Windows Server 的 UDP 是否有一些限制或配置?</p>