问题标签 [balance]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
1 回答
871 浏览

python - 数据非常不平衡的广告点击预测

我有一些非常不平衡的数据(3% 肯定),我正在使用 xgboost 进行一些学习。该文件很大,我之前尝试过逻辑回归、随机森林和 svm(仅使用整个数据的一些子样本,因为数据太大)。为了解决数据不平衡,我尝试了使用 SMOTE 的类权重和平衡数据(这使得数据超级大)。但这似乎无济于事。当我使用上述任何一种方法时,准确率都会变差。

当我尝试 xgboost 并尝试像文档建议的那样调整 scale-positive-weight 参数时,它只会使准确性更差。总的来说,我所有的模型都比仅仅预测全 0 效果更差。

无论如何我可以解释这种数据不平衡吗?

这是我的 xgboost 代码

0 投票
1 回答
70 浏览

balance - 以前余额仅在访问报告中添加到第一行

我需要有关访问报告的帮助。

如附图所示,我希望仅将“先前余额”值(包含 (167,950.00) 的文本框)添加到新月份的第一行(“存款”列)。“余额”列在属性中具有运行总和。

如您所见,我得到了负值,因为以前的余额未添加到新月份的第一行。

请帮忙。查看样本报告

0 投票
2 回答
935 浏览

java - 如何构造正则表达式来平衡字符串中的字符?

我遇到过针对不同问题的正则表达式,但我找不到 regex 来平衡字符串中的字符。

我遇到了一个问题,要查找字符串是否平衡。例如:aabbccdd是平衡的,因为字符以偶数重复但aabbccddd不是平衡的,因为ddd以奇数模式重复。这适用于所有输入不特定的字符a,b,c and d。如果我将输入作为12344321or 123454321,它应该分别返回平衡和不平衡的结果。

如何使用正则表达式找到余额。我们应该使用什么类型的正则表达式来查找字符串是否平衡?

我试图仅使用正则表达式找到解决方案,因为问题需要以正则表达式模式回答。如果没有明确提及正则表达式,我将使用任何其他解决方案来实现

0 投票
1 回答
36 浏览

postgresql - 如何创建计算 2 个字段的余额并将结果放在视图中的触发器(PostgreSQL)

所以,我有 2 个包含这些字段的表:

传入[ID,产品,金额,时间戳]

传出[Id, Product, Amount, Timestamp]

我需要跟踪每种产品的当前可用数量,并且我认为一个好的方法是创建一个触发器,该触发器将在每次插入这些表后重新计算该值。

此外,通过将结果放在视图中,它可以供以后阅读。

我的问题是我不知道如何为所述触发功能编写代码。任何帮助都非常感谢,谢谢!

这是我解决问题的尝试,但到目前为止失败得很惨:

在此处输入图像描述

0 投票
4 回答
5081 浏览

python - 如何在 Python 2.7 中使用矩阵平衡化学方程式

我有一个大学作业,我必须平衡以下等式:

NaOH + H2S04 --> Na2S04 + H20

目前,我对 python 和一般编码的了解非常有限。到目前为止,我已经尝试使用矩阵来求解方程。看起来我得到了解决方案 a=b=x=y=0 我想我需要将其中一个变量设置为 1 并解决其他三个。我不知道该怎么做,我进行了搜索,看起来其他人使用了更复杂的代码,而我真的无法遵循它!

这是我到目前为止所拥有的

0 投票
1 回答
103 浏览

python - Python Codingbat balance_point:如何开始

我有一个编码挑战,我需要完成,并且已经在这里搜索解决方案或任何其他建议,但无法找到任何建议。

这是挑战:“平衡点”是可以拆分值数组列表的点,以便一侧的数字总和等于另一侧的数字总和。(平衡点包含在“第二个”子列表中。)给定一个非空整数列表,返回平衡点,如果给定列表不存在平衡点,则返回 -1。

我想将列表分成两部分并对每个单独的部分求和,然后比较总和。但是,我怎么知道在哪里拆分列表?以及如何从左侧和右侧对这些数字求和?

任何帮助将不胜感激!

0 投票
1 回答
666 浏览

api - C# PayPal API 获取余额

你好!

我有一个简单的问题。如何通过 .NET PayPal API 和我的 API 凭据获取我的 PayPal 余额?我已经将 API 添加到 Visual Studio 2017。

0 投票
2 回答
717 浏览

python - Python Pandas 数据帧采样

我正在寻找一种优雅的方式来以特定方式对数据集进行采样。我找到了一些解决方案,但我想知道你们中是否有人知道更好的方法。

这是我正在查看的任务:

我想平衡我的数据集,以便类 0 的实例数量与类 1 的实例数量相同,因此在下面的示例中,我们有 5 个类 1 的实例和 11 个类 0 的实例:

到目前为止,我刚刚随机删除了 6 个 0 类实例,但我想防止一个 id 的所有实例都被删除。我尝试使用 sklearn 进行分层“拆分”,但它不起作用,因为并非每个 id 都包含超过 1 个项目。所需的输出应类似于以下内容:

有什么好主意吗?

0 投票
1 回答
1087 浏览

javascript - 在 Javascript 中控制音频平衡 (L/R)

我想在使用此代码时控制音频平衡

以及当我播放本地 mp3 文件时。我怎样才能做到这一点?

0 投票
1 回答
8176 浏览

machine-learning - 从不平衡数据中分层平衡采样(机器学习)

我很抱歉我的粗心。如果您需要平衡二次采样的方法,请访问以下链接。有各种各样的答案。

Scikit-learn 平衡子采样


如何从不平衡数据中进行分层平衡抽样?

我需要解决 40 个类的分类问题。数据是从 13 个传感器实时收集的,包括 13 列(传感器数量)乘 368816 行(简单来说,就像一个时间段)。我打算把数据放到循环神经网络中。

因此,我将其标记为 0 到 40 级。数据属于0类表示进程的正常状态,其他表示异常状态和产生问题的地方。

数据由 13 列 x 368816 行组成。每行表示每个数据集。368816 个数据集中的每一个都属于 0 到 40 类。但是,它是不平衡的。属于 0 类的数据集数量为 103260,约占整个数据集的 22%。

属于其他类别的数据数量,1-40,类似。

我想从不平衡的数据中制作平衡的样本数据。例如,如果最小的类有 7000 个数据,我想采样 7000*41(nb of class) 数据。

我尝试在 scikit-learn 包中使用 StratifiedShuffleSplit 方法。脚本如下所示。

如果我的采样逻辑是正确的,nb_train 和 nb_test 的总和应该小于 368816。因为我从不平衡的数据中进行了平衡采样。

但 nb_train 是 258171 而 nb_test 是 110645。

如何从不平衡数据中进行分层平衡抽样?

我尝试了scikit-learn方法中的Stratified Train/Test-split 。但是,我失败了。我使用的脚本如下。