问题标签 [bilstm]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票
0 回答
22 浏览

named-entity-recognition - 当我在 NER 上使用 BilstmCRF 时,尺寸必须相等

当我尝试使用 NER 训练 BilstmCRF 时出现错误

我知道问题是数据形状不相等,但实际上我不知道如何解决它。因为我调查了很多代码,这些代码看起来像我的,但我不明白为什么它们运行顺利。

我的数据形状

X_train.shape 是 (44950, 100)

np.array(y_train).shape 是 (44950, 100,24)

我如何处理文件:(Cr.https://github.com/SuphanutN/Thai-NER-BiLSTMCRF-WordCharEmbedding/blob/master/Thai_NER_WordCharacterEmbedding_Train.ipynb)

X_train,X_test 看起来像

np.array(y_train),np.array(y_test) 看起来像

我的模型

0 投票
0 回答
13 浏览

tokenize - BiLSTM 模型的 BERT 标记化?

美好的一天,我是一个初学者,我正在回答问题。我可以为 BiLSTM 模型使用 Berth 标记器吗?因为我在没有关于可能性和方式的精确方向的情况下搜索了谷歌。

0 投票
0 回答
66 浏览

python - 我可以使用 Keras Tuner 通过 LSTM 超参数优化进行单变量时间序列预测吗?

我正在尝试在我的数据上使用多个 LSTM 模型,例如 Vanilla、Stacked、Bi-directional,但找到最佳超参数的成本非常高。在 Colab Pro 上使用 TPU 时,我的程序在运行了 10 多个小时后崩溃了,我尝试了多次。

这是我的代码:

这不是整个代码。

我想知道是否可以使用 Keras Tuner 为这种情况找到最佳超参数?我做了我的研究,但没有找到任何东西,不过 Keras Tuner 可以用来优化分类模型。

任何建议,将不胜感激。

0 投票
0 回答
168 浏览

python-3.x - TypeError:update() 得到了一个意外的关键字参数“force”

我使用 word2vec 和 biLstm 来实现电影评论的情感分析。当我在 Jupyter 笔记本上训练我的模型时,我总是收到TypeError: update() got an unexpected keyword argument 'force' at the last batch of the first epoch。

这是我的代码:

和错误:

起初,我在epochs=5下有一行代码verbose = 1。将出现相同的错误,并且箭头指向verbose = 1。然后我将其更改为verbose=2或删除verbose。但我仍然有问题。

我试图改变批量大小和训练集的数量。但它仍然没有成功。

它总是显示在最后一批。

python版本= 3.6.2
keras版本= 2.1.1

0 投票
0 回答
44 浏览

python - Bi-LSTM 的序列标记问题 - 获得非常低的宏平均 F1 分数

我正在尝试建立一个模型,用于将标签序列标记到文档中的句子序列。为此,我将 Bi-LSTM 与 CRF 结合使用。我在我的模型中使用 TensorFlow-addons CRF 层,在训练和预测方法之后,我使用 viterbi_decode 函数来获取表示句子标签的整数序列。我不知道下面的代码是否代表了带有 CRF 的 Bi-LSTM 的准确实现,或者我做错了什么。因为性能非常低,我期待使用 CRF 进行序列标记有助于提高宏观平均分数。我怎样才能改善这一点?

代码在这里:

这是使用 viterbi_decode 获取序列的代码:

0 投票
0 回答
22 浏览

python - 如何从两个 3D 矩阵中获得单个相似度值?

我正在尝试通过双向 LSTM 传递 SBERT 嵌入。

这给出了一个错误:

() 中的 TypeError Traceback (最近一次调用最后一次) ----> 1 sim = util.pytorch_cos_sim(t1, t2) 2 帧 /usr/local/lib/python3.7/dist-packages/tensorflow/python/framework/ ops.py in len (self) 1094 """返回张量中第一个维度的长度。""" 1095 如果不是 self.shape.ndims: -> 1096 raise TypeError("Scalar tensor has no len()") 1097 # pylint: disable=protected-access 1098 try: TypeError: Scalar tensor has nolen()

0 投票
0 回答
22 浏览

python - Bi-LSTM 分类指标无法处理二进制和未知目标的混合

我使用 Bi-LSTM 制作掩码检测程序。我想获得程序的准确性,但出现了这个错误:分类指标无法处理二进制和未知目标的混合。有人能帮我吗?这是我的代码:

0 投票
0 回答
21 浏览

python - ValueError:检查输入时出错:预期 embedding_input 有 2 个维度,但得到的数组形状为 (298, 200, 1)

我在训练 BiLSTM 模型时遇到以下错误并且找不到任何解决方案。

ValueError: Error when checking input: expected embedding_input to have 2 dimensions, but got array with shape (298, 200, 1)

以下是我的项目中构建的架构。请帮我。

0 投票
1 回答
25 浏览

python - BiLSTM forward() - RuntimeError: shape '[-1, 38]' 对于大小为 1 的输入无效

目标:在 LSTM 中实现双向性。

我是深度学习的新手,并选择pytorch-lightening了最少的编码。由于之前帖子的回复,已经取得了进展。


forward()现在需要方便nn.LSTM(... bidirectional=True)

我的最新修订基于此disscuss.pytorch.org 响应

错误

错误是基于形状的不匹配。

哪些数据需要针对哪些层进行整形?

我离我的深度还很远。

代码

追溯:

0 投票
0 回答
31 浏览

python-3.x - 双向 LSTM 获得 val_score: 0.0

目标:优化和更好地理解 BiLSTM

我有一个正在工作的 BiLSTM。然而,第一个时代的val_score: 0.0.

我认为这个直截了当的问题是由于我对这个附加层的训练处理不当造成的。

问题:

  • 什么可能会导致 BiLSTM 出现这样的问题?
  • 我没有/错误地实施了什么?

代码:

追溯:

print语句重复。