问题标签 [machine-learning-model]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - ML.NET 是否接受 null?
我是机器学习的新手。我试图预测一场比赛的获胜者。为此,我使用了跑步者的最后 5 种形式。但是有些跑步者没有 5 形式。数据集是 CSV 文件。格式类似下面。
我想使用 FP 对跑步者进行排名。在这里,所有 3 名选手都没有最后 5 名。Runner 2 有最后 3 个表格。亚军 3 有最后 4 个表格。ML.NET 允许nullable
吗?
我打算使用排名作为这个例子的任务: https ://github.com/dotnet/machinelearning-samples/tree/master/samples/csharp/getting-started/Ranking_Web
谢谢
date - 日期的循环变换
我想在机器学习模型中使用一年中的某一天。由于一年中的这一天不是连续的(2019 年的第 365 天之后是 2020 年的第 1 天),我想按照这个链接执行循环(正弦或余弦)变换。
但是,在每一年中,新的转换变量都没有唯一值;例如,同一年的两个值为 0.5,请参见下图。我需要能够在模型训练和预测中使用一年中的某一天。对于正弦变换中的 0.5 值,它可以在 31.01.2019 或 31.05.2019 上,然后使用 0.5 值可能会使模型混淆。
是否可以使模型在同一年内区分 0.5 的两个值?
我正在使用 Maxent 软件对物种的分布进行建模。物种数据在 20 年内每天都是连续的。我需要模型来捕获当天或季节的信号,而无需将它们中的任何一个明确用作分类变量。
谢谢
编辑1 基于以下furcifer的评论。但是,我发现增量建模方法对我的应用程序没有用处。解决了后续天数一致的问题;例如 30.12.2018、31.12.2018 和 01.01.2019。但这与从某个参考日(重量 = 1)开始计算天数没有什么不同。2019 年同一日期的价值远高于 2014 年,这在生态上没有意义。我希望从所使用的日常环境条件(解释变量)中捕捉到年际变化。我需要在模型中使用天的原因是为了捕捉迁徙物种分布的季节性趋势,而没有明确使用月份或季节作为分类变量。为了预测今天合适的栖息地,
python - 解释数据处理中的“多重共线性”
谁能用简单的话解释一下机器学习数据处理中的多重共线性术语。由于该术语在数据处理方面非常重要并且具有令人困惑的解释。
所以,请用简单的话解释一下,因为我是使用 python 的 ML 新手。
python - 你能解释一下 keras 模型中 tensorflow 加载和 hdf5 加载之间的区别吗
我试图加载我在训练期间保存的 keras 模型。所以我去了keras 文档,在那里我看到了这个。
从 TensorFlow 格式加载权重时,仅支持拓扑加载 (by_name=False)。请注意,对于继承自 tf.keras.Model 的用户定义类,拓扑加载在 TensorFlow 和 HDF5 格式之间略有不同:HDF5 加载基于扁平化的权重列表,而 TensorFlow 格式加载基于属性的对象本地名称图层在模型的构造函数中分配。
你能解释一下上面的吗?
r - 如何在 r 中使用 tidy-model 对数据进行反规范化
使用tidymodels作为在 R 中开发模型的新工作流程,我如何使用tidymodels 去规范化/反转幂变换数据。
dd <- data.frame(x1=1:5,x2 = 11:15,y=6:10)
.
现在使用整洁的模型框架:
问题是我在 tidymodel 工作流程中找不到任何非规范化工具
python - 如何重塑 ConvLSTM2D 的输入以不过度拟合?
我有一个以 15 分钟为时间步长的时间序列问题。完整的数据将从 2016-09-01 00:00:15 到 2016-12-31 23:45:00。
我在数据框中有 5 个变量(v1、v2、v3、v4、v5、v6),我想预测下一个时间步长的第六个变量(v6)。
我准备数据集并将信息准备为 5 个时间滞后。就像如果时间是t在行中,我创建 (t-1) 到 (t-5) 的值作为 v1 到 v6 的滞后。
所以总的来说,我有 30 个特征(6 个变量有 5 个滞后)。我还通过 PowerTransformer 对值进行了标准化。
我的 traix_X 和 train_y 的数据输入形状最初如下所示:
11253 行有 30 个变量作为输入,一个变量作为目标变量。然后我重塑它以适合我的 ConvLSTM2D,如下所示:
ConvLSTM2D 架构如下所示:
但是这个模型给出了一个非常糟糕的结果(它过度拟合了很多)。我怀疑我的输入没有正确地提供给 ConvLSTM2D。我的整形正确吗?任何帮助表示赞赏。
编辑:
我已经意识到我的输入被正确地提供给了网络,但问题是它过度拟合了很多。
我的超参数如下:
我什至尝试了 50 和 10 个 epochs 相同的问题。
machine-learning - 如何根据具有完整特征的数据学习到的模型来预测具有不完整特征的数据的真实标签?
例如,通过训练具有完整特征的数据(f1,f2,f3,f4,f5,f6)来学习模型
但是,我想知道该模型可以测试具有不完整特征(f1、f2、f3)的数据,以将真实标签附加到这些测试数据集中
我在等待 ML 专家的回答
太感谢了 !!
machine-learning - 测试数据使用 flow_from_directory 给出“在 0 个类中找到 0 个图像”
这是我的 flow_from_directory 代码
它打印:
找到属于 2 个类别的 2000 张图像。找到属于 2 个类别的 1000 张图像。找到属于 0 个类别的 0 个图像。
即使我使用的数据存在:
!ls /root/.keras/datasets/cats_and_dogs/test
这给出了输出:
我做错了什么或必须做什么?
python-3.x - Sklearn 管道中的自定义预处理器
我正在构建机器学习模型管道。我有一个自定义函数,它将更改特定列的值。我已经定义了自定义变压器,它单独工作正常。但是,如果我从管道中调用它,它会给我带来错误。
示例数据框
管道
我想让自定义处理器在管道中工作。
python - 通过 SVR 和网格搜索使用提前停止
我正在尝试对我的 SVR 模型使用网格搜索,并且由于需要太多时间来适应我想知道是否可以使用提前停止,但我不知道该怎么做。相反,我使用了 max_iter,但仍然不确定我的最佳参数。有什么建议吗?谢谢!