问题标签 [ludwig]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
39 浏览

machine-learning - 文本序列匹配的深度学习模型

我正在尝试进入深度学习。我想到了这个项目。假设我有一个包含两列的数据集。这些列是两个匹配的人的兴趣列表。它是这样的:“汽车、心理学、政治”“美容、哲学、运动”。现在,我正在尝试训练我的模型以根据第一个人的兴趣输入来预测第二个人的兴趣。

我一直在尝试 uber 的 ludwig,这是一个无需编写代码即可使用的深度学习工具箱。他们提供的示例很棒,但我无法将它们适合我想要的模型。也许您可以将我推向适合此问题的模型?

0 投票
2 回答
21255 浏览

python - tensorflow 2.1.0:没有属性“random_normal”

我正试图让优步的路德维希运行。我收到关于没有属性“random_normal”的错误。我可以使用这些命令在 Python 中重现错误。

将不胜感激有关如何克服此错误的帮助。

0 投票
2 回答
113 浏览

python - 如何以编程方式可视化路德维希库模型学习曲线?

我正在使用 Uber 的ludwig库来训练神经网络模型。我想以编程方式(通过 python 代码,使用文档的示例)可视化我的模型的学习曲线,以使用以下代码分析它们的性能:

但是,运行代码时出现以下错误:

我知道我可以通过命令行生成可视化。但是,我需要以编程方式进行。

0 投票
1 回答
164 浏览

python - 优步路德维希:问题预测

我决定再次与 Uber Ludwig 打交道。我想使用 Python API 做一个简单的演示,学习将输入数字加 1。我已经成功地制作了一个模型,但是在预测时出现了问题。我在 CPU TensorFlow 上的 PopOS 19.10 上的 github 上运行最新版本。感谢您的任何帮助。

编辑:我也在 Windows 上重现了这个问题。

错误如下

这是我的预测脚本

这是我的训练脚本的内容。

模型定义.yaml

0 投票
1 回答
431 浏览

multilabel-classification - 我应该使用什么框架来进行具有数千个标签的多标签分类

我现在正在研究多标签分类服务,目前我已经准备好了训练数据集。问题是当前的训练数据集有很多不同的标签(大约 80 000 个)。

起初,我通过 Simpletransformers 尝试了 Google 的 BERT: https ://github.com/ThilinaRajapakse/simpletransformers#minimal-start-for-multilabel-classification

但问题是每个输入二进制矩阵都需要带有标签,这意味着我需要每个关键字来训练长度为 80 000 的巨大二进制矩阵。所以它不可用。

然后我尝试了路德维希: https ://uber.github.io/ludwig/examples/#multi-label-classification

但是在第一次测试之后,Ludwig 似乎只记得前 10 000 个最常见的标签,所以它也不适用于我的情况。

现在我正在尝试使用FastText,它似乎运行良好,只需要大量的 CPU 和计算时间。

我的问题是,如果您认为 FastText 对我的情况来说是一个不错的选择,或者当我使用这么多标签进行多标签分类时,您是否可以向我推荐其他东西。

谢谢!

0 投票
2 回答
260 浏览

linux - 找不到满足要求 tensorflow==1.15.3 的版本(来自 ludwig)

所以我的目标是安装 Ludwig 进行实验,但我没有在互联网上找到任何解决此问题的方法,请在此处输入图像描述

错误消息的屏幕截图

我正在为 linux (debian) 使用 windows 子系统

0 投票
0 回答
59 浏览

python - 拆分训练和测试数据

我有一个大约 15,500 行的数据集。数据集由两列组成:文本列(自变量)和输出(因变量)。输出具有二进制值(即 0 和 1)。大约 9500 行具有输出列的值(即我可以将其用于培训目的),其余 6000 行(没有输出列值)我想将其用于测试目的。所有行 (15500) 都在一个文件中。我创建了一个模型定义文件,其中我使用parallel_CNN 编码器作为文本列。我使用以下命令运行来训练和测试数据集:

现在的问题是我没有告诉程序使用前 9500 行来训练程序并使用剩余的行来测试模型。Ludwig 有什么方法可以让我通过任何参数来判断哪些行数用于训练,哪些行应该用于测试?还是有更好的方法来完成同样的任务?

0 投票
0 回答
50 浏览

python - 路德维希训练中的 TensorFlow 类型检查错误

我在 TensorFlow 的 Ludwig 训练中遇到了这个问题。

Ludwig 模型已经过训练,但我想隐藏此警告。我努力了

我已经一一尝试了所有这些解决方案,但没有运气。仍会打印警告。如何隐藏该警告,为什么会出现此警告?

0 投票
0 回答
21 浏览

heroku - 在 http://0.0.0.0:$Port 在 Heroku 上使用 Ludwig API

经过大量工作,我能够找出正确的配置,将我的 ludwig-ai 模型托管在 Heroku 上——但我在实际使用它时仍然遇到了麻烦。

Ludwig 使用 uvicorn 创建 api 端点。它说它托管在http://0.0.0.0:{$Port}但是当我尝试将它与正确的heroku url一起使用时,它没有响应。我觉得我一定错过了一些基本的东西,但我不知道那可能是什么。

0 投票
1 回答
100 浏览

html - 如何在不重新加载页面的情况下在烧瓶网络中显示我的实时语音预测?

因为我想使用带有 ludwig 工具箱的烧瓶网络应用程序创建实时面部和语音识别来锁门。如果我单击录制按钮,网页将录制我的声音 1 秒,然后我的声音将被预测并将数据显示为表格或字典。

所以我的问题是如何在不重新加载页面的情况下将我的预测语音显示为表格或 dict 到网页(HTML),因为如果我重新加载页面,我的面部识别程序也会重新加载并使我的程序从头开始。

Python 文件

HTML 文件