【记第一次kaggle比赛】PetFinder.my - Pawpularity Contest 宠物预测_热门推荐_行情

【记第一次kaggle比赛】PetFinder.my - Pawpularity Contest 宠物预测

2024-12-30 06:37 浏览:59

记半年前打的一次”划水“Kaggle比赛，第一次打Kaggle比赛所以选了个比较简单的分类比赛，但是打到一半发现这个比赛也不容易，表明上是个分类比赛，其实又可以看作回归问题来做，而且还有很多的Meta数据，又可以当作多模态问题来做，再加上3500+的参赛人数，比赛难度直线上升。

最终是拿到了A榜800多名，B榜700多名的成绩。虽然名次有点划水，但是还是从中学到很多东西的。半年前打的比赛，当时名次比较差气的不想看，就没有心思记录，最近找工作整理一下这个比赛，发现好多细节已经忘了，所以又翻开代码重头过了一遍，这里再记录一下防止以后又忘了。

最后，想说下，大家千万不要像我这样，打比赛还是以学东西为重，特别是刚开始参加比赛，不要把排名看的太重要！

数据给了很多的宠物数据（全是猫狗），让我们给这些猫狗打分，对宠物的可爱度打分，总共有1-100分，评分标准是均方根误差，所以这其实是一个回归问题。同时，比赛除了给了每张图片的分数，还给了每张图片的12个视觉信息和构图信息，比如图片当中面部是否是面向正面，宠物是否佩戴配饰等等，所以我们又可以利用这些Meta信息和图像信息来进行一个多模态融合。

所以说整个任务：多模态融合的分类任务

图片的分辨率大部分在400-800之间，是否可以使用400-800之间的多尺度训练？

12个Meta数据介绍：

焦点 - 宠物在整洁的背景中脱颖而出，而不是太近/太远。
眼睛 - 双眼朝前或近前，至少有1只眼睛/瞳孔清晰。
面部 - 体面清晰的脸，面向正面或近前方。
近 - 单只宠物占据了照片的很大一部分（大约超过照片宽度或高度的50%）。
动作 - 在动作（例如，跳跃）中途的宠物。
配件 - 随附的物理或数字配件/道具（即玩具、数码贴纸），不包括衣领和皮带。
团体 - 照片中有超过1只宠物。
拼贴 - 数字修饰的照片（即使用数码相框，多张照片的组合）。
人类 - 照片中的人类。
遮挡 - 特定的不良物体阻挡宠物的一部分（即人，笼子或围栏）。请注意，并非所有遮挡对象都被视为遮挡。
信息 - 自定义添加的文本或标签（即宠物名称、描述）。
模糊 - 明显失焦或嘈杂，特别是对于宠物的眼睛和脸部。对于模糊条目，“眼睛”列始终设置为 0。

每个Meta数据都是0-1分布的二元值（稀疏特征）

训练集实例：

原本的问题是一个回归任务：对猫狗图片打分0-100分，评分标准均方根损失函数。

这里把它转为2分类任务，把gt标签1-100归一化到0-1，0表示不受欢迎，1表示收欢迎。预测输出一个数，再取sigmoid归一化到0-1，再*100就是最终预测的分数。

baseline方案：训练时输入一张图像，然后经过一个backbone输出特征，然后接一个全连接层输出一个预测值，再和归一化后的gt计算交叉熵损失（BCEWithLogitsLoss）。测试时就将预测值先进行sigmoid处理再*100，得到一个0-100的值，提交submission.csv，然后后台计算平方根损失函数，得到分数。

配置：

lb = 18.37 排1800多名好家伙，这比赛真卷啊

2.1.1、删除重复数据（打分差别很大）

【记第一次kaggle比赛】PetFinder.my - Pawpularity Co<i></i>ntest 宠物预测

这个比赛会有一些重复的数据，而且这些重复的数据他的label都相差的比较大的，会对模型造成很大的伤害，而且官方是建议删除label小的那些图片。

来自这几个Discussion：
Correcting errors in data!

Identify duplicates and share findings (+ dataset w/o duplicates)

there are no usages of duplicate images

代码：

lb = 18.35

2.1.2、数据增强

常规的数据增强：

因为这个任务很像一个细粒度分类的任务，所以我用了mixup数据增强，代码：

删掉随机垂直翻转，lb = 18.34
mixup（alpha=0.2，p=0.5）：lb = 18.31

2.1.3、损失函数

一开始为了和评价指标均方根误差对齐用的是均方根损失，但是后来发现效果不好，就改成了交叉熵损失函数：SmoothBCEwLogits（把sigmoid层加入了BCE上）系数=0.1，训练更稳定，防止上溢和下溢问题。work可能原因：

改进：CrossEntropyLabelSmooth 标签平滑：这个比赛的标签可能本身就是有问题的，因为对宠物的可爱度打分，这根本就没有一个标准的定义可爱度是什么？每个人定义的宠物可爱也不一样，就像我在数据集里找过，两只长的差不多的狗，但是他的可爱度就相差了很多。所以我对于这个比赛的标签是存在疑虑的。

而如果本身的标签就有问题的话，对于模型的伤害是很大的，因为模型会强行学习这些错误样本，可能让模型在一定程度上过拟合，下次在测试集里看到差不多的样本，可能预测出来就完全错了。所以为了降低标签错误带来的影响，我使用了标签平滑的策略，相当于降低对错误样本的损失（关注），算是一种损失正则。具体原理看这篇博客：【trick 1】Label Smoothing（标签平滑）—— 分类问题中错误标注的一种解决方法

这个trick挺适合这个比赛的，lb = 18.25

2.1.4、优化器和学习率

Adamw = Adam + weight decate 效果和 Adam + L2正则化相同,但是计算效率更高。
lr = optim.lr_scheduler.CosineAnnealingWarmRestarts 余弦退火学习率

这里直接用的baseline的优化器和学习率。

方案有点类似后处理，特别简单，在Inference的时候，冻结backbone，用之前训练好的Swim transformer backbone输出的特征图【bs, 128】输入到SVR Head中，训练SVR Head模型，再将分类模型和SVR模型分别做推理，再取均值，得到最终的推理结果。

SVR原理： Python:机器学习：SVM（SVR）

简单说下：

SVM：二类分类模型，优化方向是间隔最大化（使离超平面最近的样本点的间隔最大）；SVR：回归模型，使离超平面最远的样本点之间的间隔最小。
C是调节间隔与准确率的因子，C值越大，越不愿放弃那些离群点；c值越小，越不重视那些离群点；

代码：

最佳的trick lb = 17.95

这里我想了两种融合Meta数据的方法：

将Meta数据融入分类模型中，在Backbone输出特征图【bs，128】后，Concat我们的Meta特征数据【bs，12】，再送入2个全连接层+sigmoid完成分类任务；
将Meta数据融入回归模型中，在Backbone输出特征图【bs，128】后，Concat我们的Meta特征数据【bs，12】-> 【bs，140】，再送入SVR进行；

事实证明meta数据不work，不管怎么融合都掉点。
推测：可能是因为Meta数据太脏了？或者Meta数据本身和label关联度不高？

Backbone：swin_large_patch4_window12_384、vit_base_patch32_384
5折交叉验证
TTA：hflip
Classification Head + SVR Head
average策略

lb = 17.88 800多名 b榜：17.13 700多名

CNN(ResNet、EfficientNet) < Transformer
More TTA
RMSE loss
Metadata（花了超多时间）

我看了我的方案其实和大家的方案差不多，都是从Discussion中找来的，大家真的在Discussion中讨论了很多东西，然后第一名是16.82，差0.3作用，我分析了下好像就是他用了很多模型，10几个模型融合，然后分会好很多，唉，可惜我只有一个3090，前面试了这么多实验后面就没多试试一些transformer模型了。然后再有一个就是我用的是5折交叉验证，普遍看前面几名都是10折交叉验证，这也是我分差排名不好的原因。

第一次打Kaggle比赛，不过已经从这个比赛学到了很多东西了：

Swin Transformer、ViT原理
SVM、SVR 原理
多模态，多数据如何融合？
Smooth Loss对于数据集label可能标错的数据集非常非常有效
打比赛的流程：从Discussion找EDA数据分析，了解数据 - > 从Code中找到高分且容易看懂复现的代码作为baseline（K折交叉验证必有效） -> 分析数据特征进行数据增强探索 -> 模型探索 -> 损失函数探索 -> 模型融合（多backbone、TTA）-> 【后处理】-> 【超参探索，lr、优化器等这部分比较玄学】

记得打比赛要多融合模型，融合不同类型的模型，没准可以起到一个补充信息的作用。

Petfinder Pawpularity EDA & fastai starter

PyTorch 学习笔记:transforms的二十二个方法（transforms用法非常详细）

Loss function

PyTorch trick: Lazy layers

summarize PetFinder.my discussions for new comers

RAPIDS SVR Boost - 17.8 | Kaggle

以上就是本篇文章【【记第一次kaggle比赛】PetFinder.my - Pawpularity Contest 宠物预测】的全部内容了，欢迎阅览！文章地址：http://w.yusign.com/quote/8721.html
行业资讯企业新闻行情企业黄页同类资讯网站地图返回首页述古往 http://w.yusign.com/mobile/ , 查看更多