
评价指标
文章平均质量分 63
frostjsy
越努力,越幸运
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
sql分段统计
例如统计分钟维度下的占比。FLOOR #向下取整。ROUND #四舍五入。CEIL #向上取整。原创 2022-10-28 22:17:08 · 618 阅读 · 0 评论 -
Wilson威尔逊平滑
在曝光很少的情况下,计算出的CTR并不真实可靠,而样本数越大,CTR的比例才越准确,更能反应真实情况。为了衡量样本数对于CTR信区间的影响,我们引入"威尔逊(Wilson)区间"的概念。Wilson区间的含义就是,就是指在一定置信度下,真实的CTR范围是多少。原创 2024-03-11 21:08:45 · 3726 阅读 · 0 评论 -
排序中常见的一些指标
DCG 的出发点可以理解为:在搜索引擎的结果中,相关结果比弱相关和不相关的结果更为重要,因而要更注重对相关结果的排序结果。目前在我所在的搜索场景在离线评测时还是会考虑 NDCG 的情况,而具体的 K 值选择则要根据业务场景自行调整。错误率与精度是分类任务中最常用的两种性能度量,错误率是指分类错误的样本占样本总数的比例,精度则是分类正确的样本数占样本总数的比例。Mean reciprocal rank(MRR) 是另一种对排序列表进行评价的指标,MRR 定义为。表示第i个查询第一个相关结果在列表中的位置。原创 2023-03-04 22:58:54 · 2071 阅读 · 0 评论 -
excel ttest检测
用于定义 t-检验的类型: 1 代表成对检验;2 代表双样本等方差假设;双样本等方差单尾检测 :=TTEST(A2:A8,B2:B8,1,2)双样本异方差单尾检测 :=TTEST(A2:A8,B2:B8,1,2)双样本等方差双尾检测:=TTEST(A2:A8,B2:B8,2,2)双样本异方差双尾检测:=TTEST(A2:A8,B2:B8,2,2)成对单尾检测 :=TTEST(A2:A8,B2:B8,1,1)成对双尾检测:=TTEST(A2:A8,B2:B8,2,1)excel计算pvalue参考网址。原创 2023-02-14 22:39:45 · 3143 阅读 · 0 评论 -
sql实现auc计算
model_v0_predict的数据形式为 id(唯一标识一条记录)|label(标签)|prediction(预测分数)|ds(时间),3条数据如下。其中sample_id为CONCAT_WS('_', req_id, utdid, item_id, price, ts, weight)以某一次请求为一个group,计算每个group的auc;以group的均值作为gauc;原创 2022-10-28 22:18:37 · 1015 阅读 · 0 评论 -
auc计算逻辑
aucyuanhttps://zhuanlan.zhihu.com/p/84035782原创 2021-06-14 13:17:19 · 2429 阅读 · 1 评论