我正在尝试使用没有标题且具有::
字段分隔符的数据集:
! wget --quiet http://files.grouplens.org/datasets/movielens/ml-1m.zip
! unzip ml-1m.zip
! mv ml-1m/ratings.dat .
! head ratings.dat
输出:
1::1193::5::978300760
1::661::3::978302109
1::914::3::978301968
我已将文件加载到我的 dsx 管道中,但我不清楚如何让 dsx 使用::
分隔符拆分此文件。
我该怎么做呢?
如果无法让 dsx 使用 dsx ml 管道功能重塑此文件,那么 dsx 在输入文件格式方面是否有任何先决条件?
更新:
我正在尝试使用的 ml 管道功能可以从下面的屏幕截图中看到:
我添加了一个数据集,但无法弄清楚如何让 dsx 识别字段分隔符: