9olqLl7-x6XtWyNUssHvLGkRzM5cj2_KAPAYU4vaHIw

5: 卷积神经网络实战

"纸上得来终觉浅，绝知此事要躬行"

这不再是理论课堂，而是一个真实的算法工程挑战！你将化身AI工程师，从零开始构建一个能够诊断眼部疾病的智能系统。准备好感受从 "HelloWorld" 到 "产品级AI" 的蜕变之旅了吗？ 🚀

📊 数据集介绍

数据集链接: Glimmer-2025-ml-5

任务概述:

输入: 双目图像（左右眼图像合并为6通道张量）
输出: 8个类别（7种疾病 + 1种正常状态）
目标: 构建高精度的医学影像分类模型

💡 医学AI的意义: 你的模型可能会帮助医生更早发现疾病，拯救患者的视力！

🥇 第一部分：基线模型挑战

1. 🔍 数据洞察与预处理

探索性数据分析 (EDA)

类别分布如何？是否存在数据不平衡？
图像质量怎么样？有没有"照片杀手"？
左右眼图像之间有什么秘密联系？

策略论证环节

⚠️ 重要: 必须在报告中清晰说明你的每个决策！
例如："发现类别不平衡问题，因此采用SMOTE过采样..." 或者："图像对比度差异巨大，所以使用直方图均衡化..."

硬核要求: 手动实现你的预处理流程（不要偷懒用现成的库哦～）

2. 🏗️ ResNet-18 基线复现

核心挑战

禁止使用: torchvision.models.resnet18()
允许使用: nn.Conv2d, nn.BatchNorm2d, nn.ReLU等基础组件
目标: 手动搭建属于你自己的ResNet-18！

🤔 为什么要"重复造轮子"？因为只有亲手造过轮子，你才真正理解轮子！

3. 📈 鲁棒训练与评估

训练流程设计

验证集监控
早停机制
模型保存（基于宏平均F1分数最优）

手动实现指标 必须手动实现以下评估指标：

Accuracy
Precision
Recall
Macro F1-Score
Micro F1-Score

基线分析报告

最终性能指标（各类别详情）
总参数量统计
失败case分析：哪些类别"翻车"了？为什么？

🚀 第二部分：超越基线的定制模型

1. 💡 创新架构设计挑战

🎯 终极目标: 设计一个全新的CNN架构，既要性能爆表，又要效率惊人！本部分允许你随意使用各种现代技术，同时可以调用一切能调用的库函数。

架构创新清单

融合现代设计思想（可选）:
- 残差连接与高级的激活函数
- 多尺度融合 (看得更全面)
- 深度可分离卷积 (效率杠杆)
- 注意力机制 (重点关注)

效率约束挑战

参数量: < 500万 (每一个参数都要物尽其用！)
计算量: 计算并报告GFLOPs（推荐使用thop库）

2. 🧪 严谨的对比实验

强制对比实验 制作一张对比表格，展示你的模型 vs ResNet-18：

指标	ResNet-18	你的模型	提升幅度
Macro F1	?	?	📈
Accuracy	?	?	📈
参数量	?	?	📉
GFLOPs	?	?	📉

消融实验 对比两种模式：

模式A: 简单6通道输入
模式B: 你的创新策略

用数据说话: 你的创新到底带来了多少提升？

3. 🤔 深度分析与反思

挑战回顾

最大的坑: 你遇到的最头疼的技术问题是什么？
解决方案: 你是如何爬出这个坑的？
最终效果: 解决后带来了什么改变？

权衡分析 在"性能-参数量-计算量"这个三维空间中，你的模型找到了哪个最佳平衡点？

总结与展望

你的核心创新点是什么？
如果继续优化，下一步计划是什么？

提交要求

提交内容

Kaggle Notebook链接 (邮件正文)
分析报告: ml-5-姓名-学号.md

提交方式

邮箱: gimmerml401@163.com
主题: 5-姓名-学号

出题人：百事可乐
QQ：2465800571

5: 卷积神经网络实战 ​

📊 数据集介绍 ​

🥇 第一部分：基线模型挑战 ​

1. 🔍 数据洞察与预处理 ​

2. 🏗️ ResNet-18 基线复现 ​

3. 📈 鲁棒训练与评估 ​

🚀 第二部分：超越基线的定制模型 ​

1. 💡 创新架构设计挑战 ​

2. 🧪 严谨的对比实验 ​

3. 🤔 深度分析与反思 ​

提交要求 ​

提交内容 ​

提交方式 ​