Skip to content

9olqLl7-x6XtWyNUssHvLGkRzM5cj2_KAPAYU4vaHIw

5: 卷积神经网络实战

"纸上得来终觉浅,绝知此事要躬行"

这不再是理论课堂,而是一个真实的算法工程挑战!你将化身AI工程师,从零开始构建一个能够诊断眼部疾病的智能系统。准备好感受从 "HelloWorld""产品级AI" 的蜕变之旅了吗? 🚀

📊 数据集介绍

数据集链接: Glimmer-2025-ml-5

任务概述:

  • 输入: 双目图像(左右眼图像合并为6通道张量)

  • 输出: 8个类别(7种疾病 + 1种正常状态)

  • 目标: 构建高精度的医学影像分类模型

💡 医学AI的意义: 你的模型可能会帮助医生更早发现疾病,拯救患者的视力!

🥇 第一部分:基线模型挑战

1. 🔍 数据洞察与预处理

探索性数据分析 (EDA)

  • 类别分布如何?是否存在数据不平衡?

  • 图像质量怎么样?有没有"照片杀手"?

  • 左右眼图像之间有什么秘密联系?

策略论证环节

⚠️ 重要: 必须在报告中清晰说明你的每个决策!

例如:"发现类别不平衡问题,因此采用SMOTE过采样..." 或者:"图像对比度差异巨大,所以使用直方图均衡化..."

硬核要求: 手动实现你的预处理流程(不要偷懒用现成的库哦~)

2. 🏗️ ResNet-18 基线复现

核心挑战

  • 禁止使用: torchvision.models.resnet18()

  • 允许使用: nn.Conv2d, nn.BatchNorm2d, nn.ReLU等基础组件

  • 目标: 手动搭建属于你自己的ResNet-18!

🤔 为什么要"重复造轮子"?因为只有亲手造过轮子,你才真正理解轮子!

3. 📈 鲁棒训练与评估

训练流程设计

  • 验证集监控

  • 早停机制

  • 模型保存(基于宏平均F1分数最优)

手动实现指标 必须手动实现以下评估指标:

  • Accuracy
  • Precision
  • Recall
  • Macro F1-Score
  • Micro F1-Score

基线分析报告

  • 最终性能指标(各类别详情)

  • 总参数量统计

  • 失败case分析:哪些类别"翻车"了?为什么?

🚀 第二部分:超越基线的定制模型

1. 💡 创新架构设计挑战

🎯 终极目标: 设计一个全新的CNN架构,既要性能爆表,又要效率惊人!本部分允许你随意使用各种现代技术,同时可以调用一切能调用的库函数。

架构创新清单

  • 融合现代设计思想(可选):

    • 残差连接与高级的激活函数

    • 多尺度融合 (看得更全面)

    • 深度可分离卷积 (效率杠杆)

    • 注意力机制 (重点关注)

效率约束挑战

  • 参数量: < 500万 (每一个参数都要物尽其用!)

  • 计算量: 计算并报告GFLOPs(推荐使用thop库)

2. 🧪 严谨的对比实验

强制对比实验 制作一张对比表格,展示你的模型 vs ResNet-18:

指标ResNet-18你的模型提升幅度
Macro F1??📈
Accuracy??📈
参数量??📉
GFLOPs??📉

消融实验 对比两种模式:

  • 模式A: 简单6通道输入

  • 模式B: 你的创新策略

用数据说话: 你的创新到底带来了多少提升?

3. 🤔 深度分析与反思

挑战回顾

  • 最大的坑: 你遇到的最头疼的技术问题是什么?

  • 解决方案: 你是如何爬出这个坑的?

  • 最终效果: 解决后带来了什么改变?

权衡分析 在"性能-参数量-计算量"这个三维空间中,你的模型找到了哪个最佳平衡点?

总结与展望

  • 你的核心创新点是什么?

  • 如果继续优化,下一步计划是什么?

提交要求

提交内容

  • Kaggle Notebook链接 (邮件正文)

  • 分析报告: ml-5-姓名-学号.md

提交方式

  • 邮箱: gimmerml401@163.com

  • 主题: 5-姓名-学号

出题人:百事可乐

QQ:2465800571