问题标签 [pre-trained-model]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 多输入预训练模型
我目前正在开发一个模型,使用Keras
+Tensorflow
来计算基于 STS 基准(http://ixa2.si.ehu.es/stswiki/index.php/STSbenchmark)的句子相似度。我是如何做到的,我首先创建了一个预训练模型,该模型将单词嵌入向量列表转换为单个句子嵌入向量。现在,我想做的是将这个预训练模型合并到一个新模型中,该模型使用这个模型来转换输入。以下是该新模型的代码。
当我运行它时,会生成一个模型并正确完成。然而,我想知道的是,是否sentence_encoder
与这个新模型一起训练或者它的权重是否保持不变?如果可能的话,我希望sentence_encoder
's 的权重受到这个新模型的训练的影响。如果这没有实现,我该怎么做呢?
先感谢您!
tensorflow - 我可以将 deeplab 微调到 tensorflow 中的自定义数据集吗?
我想使用我自己的数据集自定义 deeplab 进行图像分割?这可以通过再培训来实现吗?
tensorflow - 如何在没有权重和偏差的情况下将预训练模型加载到 Keras 中?
Keras
我需要在没有权重和偏差的情况下加载预训练模型。我也只想单独使用模型的架构来进行训练。
示例:我想加载coco_mobilenet
没有权重和偏差的预训练模型。
任何建议,将不胜感激。
torch - 是否可以查看torch预训练网络的代码
如果您在阅读标题时正在考虑这样的菜鸟-是的,我是。
我用谷歌搜索,但没有找到一个指南让我查看预训练的火炬神经网络是如何设计/编码的。我已经下载了预训练的网络(文件格式 .t7)并安装了 torch。谁能帮我查看它是如何编码的(使用什么尺寸的过滤器,使用的参数等)?
可能它不在谷歌上,因为它不可能?很乐意回答您的任何其他问题或任何不清楚的地方。
谢谢你。
lua - 尝试使用 OpenFace 进行人脸检测
我已经搜索了一段时间的文档,但我不知道如何使用 openface 中包含的预训练模型。基本上我有一个包含图像列表的文件。我想运行人脸检测,并将输出保存到文件中。
我看到“模型”目录中有 nn4.small2.def.lua 之类的文件,它们对应于预训练网络的各种大小和形状。我以前没有使用过 Lua,我需要弄清楚 Lua 才能将图像提供给网络吗?
python-3.x - 如何为 textsum 准备测试数据?
我已经能够成功运行 TextSum 的预训练模型( Tensorflow 1.2.1)。输出包含 CNN 和 Dailymail 文章的摘要(在测试之前被分块成 bin 格式)。
我还能够为 CNN/Dailymail 文章和词汇文件创建上述 bin 格式的测试数据(按照此处的说明)。但是,我无法创建自己的测试数据来检查摘要的好坏。我尝试修改make_datafiles.py
代码以删除已编码的值。我能够创建标记化文件,但下一步似乎失败了。如果有人可以帮助我了解url_lists
其用途,那就太好了。根据 github 自述文件 -
"对于每个 url 列表 all_train.txt、all_val.txt 和 all_test.txt,从文件中读取相应的标记化故事、小写并写入序列化二进制文件 train.bin、val.bin 和 test.bin。这些将是放在新创建的finished_files目录下。 ”
如何映射诸如http://web.archive.org/web/20150401100102id_/http://www.cnn.com/2015/04/01/europe/france-germanwings-plane-crash-main/之类的 URL到我的数据文件夹中的相应故事?如果有人在这方面取得了成功,请让我知道如何去做。提前致谢!
python - 下载 ResNet、VGG 等的预训练 ImageNet 模型(.PB 文件)
我已经从http://download.tensorflow.org/models/image/imagenet/inception-2015-12-05.tgz在 Inception v3 的 ImageNet 上下载了一个预训练模型(在遵循其中一个教程时找到了这个链接代码实验室)。
这个 zip 文件包含 .pb 文件,我可以直接将其作为 TensorFlow 中的 GraphDef 导入。
我想知道其他架构是否也有类似的 .pb 文件,例如 ResNet、VGG16、MobileNet 等。如果有,你能提供这些的链接吗?
提前致谢。
亲切的问候,
阿杰
opencv - 使用 optimize_for_inference 和 graph_transform 工具后,Inception V3 重新训练模型错误预测
我已经使用 tensorflow 为诗人教程生成了模型。我有表现出相同行为的二元模型和三类模型。
forzen 图按预期执行,但一旦我将其转换为与 opencv dnn 模块一起使用,预测就偏离了,通常偏向于一个类而不是其他类。
我使用了这里描述的转换:http: //answers.opencv.org/question/175699/readnetfromtensorflow-fails-on-retrained-nn/
在这里 https://www.tensorflow.org/mobile/prepare_models
以下是每次转换后汇总图的输出。以防万一你看到一些不寻常的东西:
我想知道原因可能是什么,以及在部署图表时如何保持推理性能。
pytorch - pytorch:RuntimeError: dimension out of range (expected in range of [-1, 0], but got 1)
我想使用 pretrain inceptionV3 训练一个 100 类的模型,但是在我的训练代码中,我遇到了一个奇怪的错误,显示如下错误:
我的培训代码是:
运行此代码后,得到以下结果:
您可以看到相同的模型获得相同的输入大小,但我的第二个输出错过了批处理维度。原谅我蹩脚的英文
python - 如何在自定义路径中保存/加载 tensorflow 集线器模块?
库tensorflow_hub
维护者使用户可以轻松下载和使用预训练的 tensorflow 模块,例如:
但是从sys.stderr
它看起来好像是在本地将模块保存到一个临时目录,即
INFO:tensorflow:使用 /var/folders/j6/xczfl75n3sbfwpg4190gpb104vnlxt/T/tfhub_modules 缓存模块。INFO:tensorflow:Initialize variable module/Embeddings_en/sharded_0:0 from checkpoint b'/var/folders/j6/xczfl75n3sbfwpg4190gpb104vnlxt/T/tfhub_modules/c6f5954ffa065cdb2f2e604e740e8838bf21a2d3/variables/variables' with Embeddings_en/sharded_0 INFO:tensorflow:Initialize variable module/Embeddings_en/ sharded_1:0 from checkpoint b'/var/folders/j6/xczfl75n3sbfwpg4190gpb104vnlxt/T/tfhub_modules/c6f5954ffa065cdb2f2e604e740e8838bf21a2d3/variables/variables' with Embeddings_en/sharded_1 INFO:tensorflow:Initialize variable module/Embeddings_en/sharded_10:0 from checkpoint b'/var/文件夹/j6/xczfl75n3sbfwpg4190gpb104vnlxt/T/tfhub_modules/c6f5954ffa065cdb2f2e604e740e8838bf21a2d3/变量/变量'
机器重启后,模块被删除,hub.Module('...')
再次运行代码将重新下载模块。
是否可以将模块保存到自定义目录,然后从自定义目录加载?
如果可能,如何将 tensorflow 集线器模块保存到自定义路径/从自定义路径加载/加载?