我已经使用 Microsoft 的 customvision.ai 服务训练了一个对象检测CoreML 模型。我将其导出以在我的应用程序中使用,以使用相机实时识别某些对象。然而,CoreML 模型输出一个 double 类型的 MultiArray。我不知道如何破译或使用这些数据,因为这是我第一次使用多维数组。我一直在尝试找出自定义视觉对象检测模型应该输出什么(例如 CGRect 或 UIImage),所以我知道我想将 MultiArray 转换为什么,但在 Microsoft 网站上的任何地方都找不到此信息。微软似乎有一个用于图像分类模型的演示应用程序,但没有用于对象检测模型的演示应用程序。
为了了解多维数组中可能包含的内容,我尝试将其打印出来并得到这个结果......
Double 1 x 1 x 40 x 13 x 13 array
我也试过打印.strides
多维数组的元素并得到了这个......
[6760, 6760, 169, 13, 1]
我不知道这些信息是否真的有用,只是想给你们我到目前为止所做的一切。
所以,我的问题是这个 MultiArray 包含什么信息(它是 UIImage 还是 CGRect 之类的东西?还是不同的东西?)以及如何将这个多维数组转换为我可以实际使用的有用数据集?