azure - Azure 机器学习阅读器 + 表存储

Question

我目前有一个不断执行插入的表存储设置。表存储中大约有 2.6 亿行。

我设置了两个机器学习实验来使用“阅读器”从“Azure 表”中读取数据。

实验 1 设置为读取所有行来训练模型。

实验 2 设置为只读取前 1000 行来训练模型。

实验 1 已经运行了 5 个多小时，但没有任何结果。

实验 2 已经运行了 1 个多小时，但没有任何结果。

它卡在“阅读器”进程上。

我不明白为什么实验 2 需要这么长时间。我知道我已经正确设置了这个，因为我用另一个表存储测试了“阅读器”。提前感谢您的任何帮助/建议。

score 2 · Accepted Answer

其中很多可能取决于您的表格的设计。表存储是键/值存储（将其视为字典）。它具有在分区内和跨分区扫描的一些功能 - 但延迟会有很大差异。理想情况下，如果您想查询 1000 行，它们应该在一个分区内进行本地化。有关完整详细信息，请参阅表设计指南和性能和可扩展性检查表。

1 回答 1