问题标签 [talos]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - OoM:在张量流模型上使用 Talos 进行超参数优化期间出现内存不足错误
在 Talos 的帮助下为我的 AlexNet 搜索最佳超参数时,我得到了内存不足错误。它总是发生在同一个时代(32/240),即使我稍微改变了参数(排除原因是不利的星座)。
错误信息:
这是我的代码:
会话配置:
AlexNet 的配置和拟合:
超参数列表:
运行 Talos:
内存使用率总是很高,但它并没有随着时间的推移而上升,但变化不大。
英伟达 SMI 输出:
有人可以在这里帮助我吗?
==================================================== ======================== 我已经尝试过的:
1) 拆分 Talos 运行:
这导致了同样的错误。
==================================================== =========================
2)在自己的线程中运行模型
搜索原因,我发现有人抱怨同样的问题,并指责 TensorFlow 没有执行K.clear_session()
。
也许这个想法很愚蠢,但我试图在一个额外的线程中训练模型。
这导致了类型错误:
我知道,我最后的机会是手动完成,但我想我会在以后训练我的模型时遇到同样的问题。
非常感谢您处理我的问题,阅读我的问题并更正我文本中的拼写错误^^。
我期待着从这个了不起的社区收到建设性的解决方案!(:
==================================================== =========================
GPU:NVIDIA RTX 2080Ti 和 Titan Xp 收藏版(我都试过了)
TensorFlow:2.1.0
喀拉斯:2.3.1
塔洛斯:1.0
python - ImportError:无法导入名称“float_factorial”
我正在尝试将 talos ( https://github.com/autonomio/talos ) 安装并导入到我的 jupyter 笔记本中。我在 anaconda3 上使用了“pip install talos”来安装它。一切顺利,但现在当我尝试导入 talos 时,出现以下错误:
奇怪的是,当我访问这个特定的文件夹时,有一个 float_factorial 函数,所以我不清楚为什么这不起作用。什么可能导致这个问题,我应该如何解决它?
提前致谢!
PS 我正在使用 anaconda3、scipy 1.6.1 和 talos 1.0。
python - Keras EarlyStopping 回调工作不一致
为了训练我的神经网络模型,我使用 Keras 的EarlyStopping
回调来最小化训练时间(通过talos.utils.early_stopper
包装器):
但是,我注意到它的工作方式相当不一致:
展品 A
展品 B
为什么它在图表 B 上并没有更早停止,即使它清楚地看到val_loss
上面没有改善min_delta
?我查看了talos
源代码,在我看来这early_stopper
只是回调的包装器,一切看起来都很好。我还注意到,这种情况只会在每次val_loss
浮动时发生0.5559 - 0.5560
。
FWIW 我在 Colab 上运行它,使用 TPU。
谢谢!
python - 导入 talos 时无法从“keras.optimizers”导入名称“SGD”
我正在尝试使用以下方法导入 talos python 模块,import talos
这是我得到的错误:
ImportError:无法从“keras.optimizers”导入名称“SGD”
在我使用from keras.optimizers import Adam,Nadam, SGD
将代码更改为from tensorflow.keras.optimizers import Adam,Nadam, SGD
. 但是,我现在收到的错误消息在内部 talos import 命令中。talos 0.4.8、keras 2.2.4、tensorflow 2.6.0 谢谢
python - 无法获取 python 安装 Talos 包
我已经在我的 ubuntu 20.04 机器上安装了最新的 python 版本 3.9.7。我正在尝试运行一些需要 Talos 包的代码,但是我已经尝试过多次使用 pip3 安装 Talos。它完成了下载和安装东西的大部分工作,直到它达到称为“scipy 的构建轮”的东西,然后经过大量工作,我得到的只是错误消息。我的第一个问题是,会不会是 3.9.7 没有 Talos 的版本,或者说 3.9.7 太高级了?如果它应该集成 Talos,我如何诊断问题以便安装它?谢谢。Ĵ
python - 使用 Talos 并获取:ValueError:Fetch 参数不能解释为张量
我正在实施 talos ( https://github.com/autonomio/talos ) 并收到上述错误。完整的错误输出如下:
而相关代码在这里给出:
我曾认为带有tf.ConfigProto()
等的位以及带有的位tf.Graph(), tf.Session()
应该修复它,但可惜他们没有。任何帮助和建议都将受到热烈欢迎。
python - Talos,选择 best_model 的语法
我在包含 python 3.74、keras 2.4.3 和 talos 1.0 以及许多其他包的 conda 环境中运行一个用于学习的玩具模型,在 Ubuntu 21.10 上。我使用以下代码运行了 talos 扫描:
但是,我已经尝试了所有可以找到的方法,但找不到正确的语法来使用 talos.best_model 选择最佳模型。
只是得到这个错误。
这不是实现此目的的正确功能吗?
python - TensorFlow / Keras 拆分训练和验证数据
我正在学习如何使用 TensorFlow,并获得了一个基于 Keras 结构的工作模型。它运行但结果对我来说有点神秘。我试图复制它并将其简化为最基本的本质,然后重新构建它。我根本无法理解的部分是它如何/在哪里将训练数据输入拆分为训练和验证集?我检查了模型代码、初始参数等。TensorFlow 卷积神经网络中是否有内置函数可以自动执行此操作?
对 Talos 的调用如下所示,前两个值是 x-training 和 y-training 值,没有x_val
或y_val
传递给 Talos 函数。Talos 是否可以自动生成x_val
和y_val
?
tensorflow - 我可以在 talos.scan 中为每一轮绘制损失与 epoch 的关系吗?
是否有可能在运行 talos.scan 为扫描的每个“轮次”绘制变量(例如损失或 mse vs epoch)?我希望在执行扫描和随后查看时必须保存它们?我想要这样的东西我们如何分析损失与时期图?但对于每一轮。谢谢。J。