Этот проект посвящен задаче классификации изображений с использованием методов компьютерного зрения. В работе исследуются различные подходы к аугментации данных, transfer learning и генерации дополнительных данных для улучшения качества модели.
-
Анализ данных
- Исследование баланса классов
- Визуализация представителей классов
- Подготовка выводов о данных
-
Аугментация данных с помощью Albumentations
- Разработка эффективного пайплайна аугментаций
- Интеграция пайплайна в загрузчик данных
-
Обучение моделей
- Разделение данных на train/validation
- Обучение базовой модели (с transfer learning и без)
- Сравнение моделей с разными аугментациями (базовые vs. продвинутые)
- Применение методов апскейлинга для transfer learning
- Валидация и тестирование моделей
-
Генерация дополнительных данных
- Обучение простого генератора для аугментации
- Настройка условной генерации по классам
- Исследование влияния сгенерированных данных на качество модели
-
Оптимизация обучения
- Визуализация лосса и метрик
- Использование шедулеров, свитч-лоссов и ранней остановки
- Сохранение лучших моделей
- Python
- PyTorch | TensorFlow
- Albumentations
- Pillow, tqdm, matplotlib, seaborn