问题标签 [average-precision]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
dataframe - 将 Spark DataFrame 转换为 spark.rdd.RDD[(Array[Integer], Array[Integer]) 以计算平均精度
我有一个 Spark DataFrame:
我必须使用 Spark 和 Scala 来计算RankingMetrics的平均精度。我猜根据文档我们必须使用 RDD 而不是 DataFrame。我尝试了以下方法:
错误:
错误:类型不匹配;
找到:org.apache.spark.rdd.RDD[(Any, Any)]
需要:org.apache.spark.rdd.RDD[(Array[?], Array[?])]
注意:(Any, Any) > : (Array[?], Array[?]),但是类 RDD 在类型 T 中是不变的。
您可能希望将 T 定义为 -T。(SLS 4.5)
我正在使用 Spark 2.4.3 版
如何将此 DataFrame 转换为该格式,以便计算平均精度?谢谢。
powerbi - 嗨,有没有办法使用多个层次结构构建 Power BI 条形图并避免在向上钻取时计算平均值?
我有一个包含 Country、State、City、Sales 列的数据集。我想建立一个向下钻取的条形图,从国家钻到州,然后钻到城市,显示平均销售额。我的问题是我找不到解决方法来避免 power bi 将平均值计算为中间较低层次结构的平均值。由于我的州的城市比其他州多得多,因此当我进入国家类别时,平均值是错误的,因为在汇总到上层时,具有不同城市数量的两个州的加权方式相同。有没有办法定义应该计算平均值的粒度级别或任何其他解决方法。
例子
对于 A 国,我想将平均值显示为 16。目前正在做 X 和 Y 州之间的平均值,其平均值为 17.2 和 13,结果为 15.1。
任何有关如何解决此问题的帮助将不胜感激。谢谢。
scikit-learn - sk.learn average_precision_score
sklearn.metrics.average_precision_score 公式
sklearn 函数中计算的平均精度分数遵循下面和附图中显示的公式。
我正在努力完全理解这个函数背后的数学。我特别好奇公式中的第n个阈值是怎么计算的。阈值的数量是否等于样本数量?
scikit-learn - 使用带和不带管道的逻辑回归的不同 AUC-PR 分数
我试图理解为什么我在有和没有管道的情况下使用逻辑回归得到不同的 AUC-PR 分数。
这是我使用管道的代码:
这是我没有管道的代码:
最后:
那么,这是为什么呢?
image-processing - 为什么即使基准测试结果为 30-50%,我的 mAP 仍为 84%
我是对象检测的新手,并使用带有 FPN 的 Faster-RCNN 在 Detectron2 上创建了一个训练模型。我在 COCO 数据集上训练,只有 1 个类,我的 AP 是 84%,是不是因为我只有一个类而高?我在其他地方看到的 AP 通常在 30-50% 范围内。例如在第 7 页的 Mask-RCNN 论文 https://arxiv.org/abs/1703.06870
我使用从训练中获得的模型进行了推理测试,并且能够成功获得准确的掩码和边界框。我的问题是:AP 超过 50% 是否有意义?
sql - 显示平均年龄超过 38.2 岁的西班牙客户的姓名
RDBMS 在此处输入图像描述
我正在尝试收集此问题所需的信息,我已经计算了客户年龄,这是此表的数据
我需要计算此表上所有 10 个用户之间的平均年龄,即 38.2。我需要所有超过这个年龄的西班牙用户,你能告诉我如何获取这些信息吗?
我已经尝试了以下条目,我刚刚了解了所有客户的年龄
我想知道如何根据当天和出生日期计算所有 10 个客户的平均值。
但这只显示一个客户,我怎样才能得到另外两个?
object-detection - FP和FN用于mAP在具有多个对象外观的对象检测中
当一个类在图片中出现两次(或更多)时,如何计算误报和误报。我对此很陌生,到目前为止,对于某些类出现多次的情况,我还没有找到任何规则。 猫
规则是:
FN:IoU < 0.5 或重复 BB
FP:完全没有检测到的时候。
例如在图片中我们有 1 个 TP,但第二个预测(绿色)可能是 FP 或 FN:根据规则,左猫可能是 FN(我们没有检测到右猫):那么我们有 1TP , 1FN 和 1FP。或者第二个框是正确猫的 FN:然后我们有 1TP 和 1FN。这是如何解决的?