
5: 卷积神经网络实战
"纸上得来终觉浅,绝知此事要躬行"
这不再是理论课堂,而是一个真实的算法工程挑战!你将化身AI工程师,从零开始构建一个能够诊断眼部疾病的智能系统。准备好感受从 "HelloWorld" 到 "产品级AI" 的蜕变之旅了吗? 🚀
📊 数据集介绍
数据集链接: Glimmer-2025-ml-5
任务概述:
输入: 双目图像(左右眼图像合并为6通道张量)
输出: 8个类别(7种疾病 + 1种正常状态)
目标: 构建高精度的医学影像分类模型
💡 医学AI的意义: 你的模型可能会帮助医生更早发现疾病,拯救患者的视力!
🥇 第一部分:基线模型挑战
1. 🔍 数据洞察与预处理
探索性数据分析 (EDA)
类别分布如何?是否存在数据不平衡?
图像质量怎么样?有没有"照片杀手"?
左右眼图像之间有什么秘密联系?
策略论证环节
⚠️ 重要: 必须在报告中清晰说明你的每个决策!
例如:"发现类别不平衡问题,因此采用SMOTE过采样..." 或者:"图像对比度差异巨大,所以使用直方图均衡化..."
硬核要求: 手动实现你的预处理流程(不要偷懒用现成的库哦~)
2. 🏗️ ResNet-18 基线复现
核心挑战
禁止使用:
torchvision.models.resnet18()允许使用:
nn.Conv2d,nn.BatchNorm2d,nn.ReLU等基础组件目标: 手动搭建属于你自己的ResNet-18!
🤔 为什么要"重复造轮子"?因为只有亲手造过轮子,你才真正理解轮子!
3. 📈 鲁棒训练与评估
训练流程设计
验证集监控
早停机制
模型保存(基于宏平均F1分数最优)
手动实现指标 必须手动实现以下评估指标:
AccuracyPrecisionRecallMacro F1-ScoreMicro F1-Score
基线分析报告
最终性能指标(各类别详情)
总参数量统计
失败case分析:哪些类别"翻车"了?为什么?
🚀 第二部分:超越基线的定制模型
1. 💡 创新架构设计挑战
🎯 终极目标: 设计一个全新的CNN架构,既要性能爆表,又要效率惊人!本部分允许你随意使用各种现代技术,同时可以调用一切能调用的库函数。
架构创新清单
融合现代设计思想(可选):
残差连接与高级的激活函数
多尺度融合 (看得更全面)
深度可分离卷积 (效率杠杆)
注意力机制 (重点关注)
效率约束挑战
参数量: < 500万 (每一个参数都要物尽其用!)
计算量: 计算并报告GFLOPs(推荐使用
thop库)
2. 🧪 严谨的对比实验
强制对比实验 制作一张对比表格,展示你的模型 vs ResNet-18:
| 指标 | ResNet-18 | 你的模型 | 提升幅度 |
|---|---|---|---|
| Macro F1 | ? | ? | 📈 |
| Accuracy | ? | ? | 📈 |
| 参数量 | ? | ? | 📉 |
| GFLOPs | ? | ? | 📉 |
消融实验 对比两种模式:
模式A: 简单6通道输入
模式B: 你的创新策略
用数据说话: 你的创新到底带来了多少提升?
3. 🤔 深度分析与反思
挑战回顾
最大的坑: 你遇到的最头疼的技术问题是什么?
解决方案: 你是如何爬出这个坑的?
最终效果: 解决后带来了什么改变?
权衡分析 在"性能-参数量-计算量"这个三维空间中,你的模型找到了哪个最佳平衡点?
总结与展望
你的核心创新点是什么?
如果继续优化,下一步计划是什么?
提交要求
提交内容
Kaggle Notebook链接 (邮件正文)
分析报告:
ml-5-姓名-学号.md
提交方式
邮箱:
gimmerml401@163.com主题:
5-姓名-学号
出题人:百事可乐
QQ:2465800571