问题标签 [machine-learning-model]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
tensorflow - 无法安装 tfcoreml(特别是 coremltools)
我尝试了一个 virtualenv,将我的 python 类型更改为 2.7x,然后手动安装它。
但是,我不断收到错误消息
Could not find a version that satisfies the requirement coremltools>=0.8 (from tfcoreml) (from versions: )
No matching distribution found for coremltools>=0.8 (from tfcoreml)
当我搜索使用pip search coremltools
我只得到的版本时coremltools (2.1.0) - Community Tools for CoreML
,它仍然不会让我得到那个版本。
我需要帮助。有人可以告诉我我做错了什么或一步一步告诉我如何正确安装它吗?
谢谢。
r - R中的文本分析:除了标记之外,如何向我的机器学习分类器添加变量?
如何考虑附加变量
我正在使用 R 中的 quanteda 进行分类任务,我想包括一些我的模型要考虑的变量,而不是词袋。例如,我计算了基于字典的情绪指数,我想包括这些变量,以便模型考虑它们。
这些是我为每个文档创建的索引。
这是我将使用的文档特征矩阵:
DFM
最后,我运行一个分类,例如,朴素贝叶斯分类器或套索
朴素贝叶斯分类器或套索
这是我在创建 dfm 后尝试过的,但它没有用
然后我想到在创建 newsdfm 之前创建文档变量
但那时,我不知道如何告诉分类器我希望它除了词袋之外还考虑这些文档变量。
总之,我希望模型同时考虑包含每个文档的所有单词的矩阵和我为每个文档创建的索引。
任何建议都非常感谢
先感谢您,
卡罗
pojo - 哪个版本的 H2O gen-model maven 库支持 XGBoost MOJO?
我正在尝试使用 Java 在运行时使用从 H2O 创建和下载的 XGBoost MOJO,但是在编译时出现错误。我尝试了多个不同版本的依赖项,但无法通过它。
依赖项:
主.java
错误 :
opencv - 在没有来源的情况下发布图像
我有超过一百万张我想用作训练数据的图像。如何在不影响安全性的情况下免费提供这些数据?
我希望用户能够快速将其用于培训目的,而不会让黑客有机会从开源数据中重建图像。同时我不希望培训质量受到任何影响。
换句话说,我如何安全地开源图像?
例如,此代码生成 numpy 数组。在这种情况下,我只是想让从 ndarray "x" 重建原始图像变得非常困难。
一旦我知道黑客无法使用数据并创建相同的图像,我就可以共享数组 x。
python - 如何识别 ML 模型是否过度拟合数据集?
我一直在比较来自 sklearn 的不同回归模型,这样做时我对我得到的模型的得分值感到困惑。在下面的代码中,您可以看到我同时使用了线性回归和岭回归,但是训练和测试数据集的得分值差异很大。
我的问题是,训练数据集和测试数据集的得分值之间的较小差异是否意味着我的模型是通用的,并且对于测试和训练数据都同样适合(不是过度拟合),还是意味着其他什么。如果它确实意味着其他东西,请解释一下。
以及“alpha”值如何影响岭回归模型?我是初学者,所以请尽可能简单地解释任何事情。
谢谢你。
tensorflow - keras 模型训练的最大损失量是多少?
我用 Keras 训练我的模型,我正在尝试阅读评估统计数据。我知道损失函数的用途是什么,但可能的最高值是多少?越接近零越好,但我不知道 0.2 是否好。我可以看到在更多次迭代后损失正在下降,并且准确性也在增加。
我训练模型的代码:
和我的结果:
class - 如何在Weka中对不同概率截止的多类数据进行分类
Weka 设置了默认的cutoff(即50%)来区分其两个类别的数据,并且可以通过Weka 界面中的SelectThreshold 分类器轻松地在不同的cutoff 上进行分类。现在在三类数据中,Weka 选择最高的概率,比如说从 0.333、0.421、0.246 的概率中,Weka 将选择 0.421。但在此类中,无法手动选择自定义截止值。有什么方法可以让我执行这项任务,或者有人可以帮助我理解多类数据中自定义截止的概念。
两类数据的例子
三类数据示例
python - 如何为决策树的连续特征选择拆分变量
我目前正在实施决策树算法。如果我有一个连续的特征数据,我该如何决定一个分裂点。我遇到的资源很少,说要在每两个点之间选择中间点,但考虑到我有 8000 行数据,这将非常耗时。输出/特征标签具有类别数据。有什么方法可以让我更快地执行此操作
python-3.x - “k_means”对象没有属性“k”
为什么显示 AttributeError 错误:'k_means' 对象没有属性 'k'?我相信 self.k = k 行(第 15 行)初始化了属性 k。
这是我关注的一个在线示例,我在 Python 3 中使用 Google colaboratory。
拟合结束
clf = k_means() clf.fit(x)
当我调用 kmeans 时,我希望输出结果显示第 6 行中的一些坐标簇,但我无法克服这个错误。(一旦这个问题得到解决,我计划扩大数据集,这 3 个坐标只是用于练习)。请原谅帖子中代码的格式。