我有一个数据集,其中一些特征是数字的,一些是分类的,还有一些是字符串的(例如描述)。举个例子,假设我有三个特征:
| Number | Type | Comment |
---------------------------------------------------------
| 1.23 | 1 | Some comment, up to 10000 characters |
| 2.34 | 2 | Different comment many words |
...
我可以将它们全部作为 dl4j 中多层网络的输入,其中数值和分类将是常规输入特征,但字符串注释特征将首先由简单的 RNN 处理为单词系列(例如嵌入 - > LSTM) ? 换句话说,架构应该是这样的:
"Number" "Type" "Comment"
| | |
| | Embedding
| | |
| | LSTM
| | |
Main Multi-Layer Network
|
Dense
|
...
|
Output
我认为在 Keras 中,这可以通过 Concatenate 层来实现。DL4J 中有这样的东西吗?