1

快速免责声明:这不是关于 , 或 的tf.data.Dataset.concat()菜鸟tf.data.Dataset.zip()问题tf.data.Dataset.interleave()。这是关于组合单个数据集的行,而不是合并两个单独的数据集。

我想在 TensorFlow 中构建一个命名实体识别 (NER) 模型。我为这个任务找到了这个数据集。但是每个单词都在数据集的单独一行上,我想将一个句子中的所有单词组合到他们自己的行中(更像是[Sentence 1, Sentence 2, ...]而不是[Sentence 1, Sentence 1, Sentence 1, ...])我不知道我是否应该做 NER那样,但我不知道如何合并数据集的行。我确实尝试过,但正如您在这个 gist中看到的那样,它给了我一个奇怪的错误。我将如何合并行?

4

1 回答 1

0

是的,对于dataset 看起来与This DatasetNamed Entity Recognition (NER)中的完全相同。在数据集中,每个单词都用人、位置、组织、时间等进行了注释。 对于 NER,可以按原样使用上述数据集,而无需对行或列进行任何修改。如果您仍想合并/连接这些行,请告诉我们我们将帮助您解决。谢谢

于 2020-11-05T06:28:39.487 回答