Kaggle是一个举办机器学习学术活动的社区,一个可以很好的发展和实践你的技能以及展示你的能力的机器学习与数据分析平台。今天主要对Kaggle学术活动经典案例深度剖析-‘’水下海星检测‘’。
比赛名称:Tensorflow - Help Protect the Great Barrier Reef
https://www.kaggle.com/c/tensorflow-great-barrier-reef
比赛类型:计算机视觉、目标检测
本文整理了比赛论坛中高分的思路解析,希望对大家有帮助。
使用什么模型?
本次比赛可以算一个小目标检测任务,且检测模型需要有较高的精度。在本次比赛中比较适合的模型是:
- YOLOV5
- YOLOX
具体模型的预测细节可以参考:
https://www.kaggle.com/remekkinas/yolox-inference-on-kaggle-for-cots-lb-0-507/
具体模型的训练过程可以参考:
kaggle.com/ammarnassanalhajali/barrier-reef-yolov5-training
这里模型本身是否存在精度上限的差异?从论坛讨论我们得出模型并不是本次本次比赛的关键。
现在排行榜第七名分享,他只是用了10折的YOLOV5模型,训练了12个Epoch。
https://www.kaggle.com/c/tensorflow-great-barrier-reef/discussion/290757
具体模型配置?
如果使用YOLOV5,那么如何选择具体的版本呢?这里建议选择YOLOV5-L或者YOLOV5-X,模型太小最终的精度不会特别好。
这一点已经被网友验证:https://www.kaggle.com/c/tensorflow-great-barrier-reef/discussion/294205
图像具体分辨率?
输入图像的尺寸建议越大越好,但越大带来的显存消耗也越大。这里建议长边为1280的像素即可。
当然模型也可以在较小的尺寸上训练,然后在大尺寸上继续微调。
具体的数据扩增方法
一方面可以使用YOLO内置的数据扩增方法,另一方面也可以使用数据增强的方法来增加水下数据的可见性。
具体可以将其视为一种数据增强的方法,使用GAN模型来完成预处理。
https://www.kaggle.com/c/tensorflow-great-barrier-reef/discussion/290584
更多赛事信息及参赛经验分享,请扫码添加翰林顾问老师详细咨询
还有不定期的高能讲座等你来参加!