0

复制:https ://social.msdn.microsoft.com/Forums/azure/en-US/6560c2d6-9836-41a1-8076-caf0d514222a/azure-machine-learning-reader-table-storage?forum=MachineLearning

我目前有一个不断执行插入的表存储设置。表存储中大约有 2.6 亿行。

我设置了两个机器学习实验来使用“阅读器”从“Azure 表”中读取数据。

实验 1 设置为读取所有行来训练模型。

实验 2 设置为只读取前 1000 行来训练模型。

实验 1 已经运行了 5 个多小时,但没有任何结果。

实验 2 已经运行了 1 个多小时,但没有任何结果。

它卡在“阅读器”进程上。

我不明白为什么实验 2 需要这么长时间。我知道我已经正确设置了这个,因为我用另一个表存储测试了“阅读器”。提前感谢您的任何帮助/建议。

4

1 回答 1

2

其中很多可能取决于您的表格的设计。表存储是键/值存储(将其视为字典)。它具有在分区内和跨分区扫描的一些功能 - 但延迟会有很大差异。理想情况下,如果您想查询 1000 行,它们应该在一个分区内进行本地化。有关完整详细信息 ,请参阅表设计指南性能和可扩展性检查表。

于 2016-02-10T20:51:04.833 回答