- Архитектуру сети
- Преобразование набора данных
- Процесс обучения
- Результаты эксперимента
Модель обновлена до .onnx
формата: https://disk.yandex.ru/d/07vdaKjyYRBXhQ
Найти репозиторий данной архитектуры можно здесь.
Модель | Размер (пикселей) | Средняя точность | Скорость (мс) | Число параметров (млн) |
---|---|---|---|---|
YOLOv8n | 640 | 37.3 | 80.4 | 3.2 |
YOLOv8s | 640 | 44.9 | 128.4 | 11.2 |
YOLOv8m | 640 | 50.2 | 234.7 | 25.9 |
YOLOv8l | 640 | 52.9 | 375.2 | 43.7 |
YOLOv8x | 640 | 53.9 | 479.1 | 68.2 |
В данной научной работе была выбрана модель на основе YOLOv8s.
1 0.617 0.3594420600858369 0.114 0.17381974248927037
1 0.094 0.38626609442060084 0.156 0.23605150214592274
1 0.295 0.3959227467811159 0.13 0.19527896995708155
Тут первое число — это порядковый номер класса в словаре names
в файле конфигурации data.yaml
. Второе и третье числа — координаты центра ограничивающей рамки по x
и y
соответственно. Четвертое и пятое числа — ширина и высота ограничивающей рамки соответственно.
train: ../train/images
val: ../valid/images
nc: 10
names: ['small-vehicle', 'large-vehicle', 'plane', 'storage-tank', 'ship', 'harbor', 'roundabout', 'bridge', 'helicopter', 'container-crane']
git clone https://github.com/ComradeMashkov/UAV_objects_detection.git
cd UAV_objects_detection
Набор данных DOTA можно скачать здесь. Затем его надо распаковать следующим образом:
DOTA-yolov8
|
├─dataset
│ ├─train
│ │ ├─images
│ │ └─labelTxt
│ └─val
│ ├─images
│ └─labelTxt
- python3
- opencv-python
- shapely (включая geos)
python data_transform/split.py
Подробнее об этом можно посмотреть здесь.
mkdir dataset/trainsplit/labels
mkdir dataset/valsplit/labels
python data_transform/YOLO_Transform.py
Готовый набор данных можно скачать здесь.
Процесс обучения описан в ноутбуке train.ipynb
.
- Значение функции потерь для класса:
- Значение функции потерь для ограничивающей рамки:
- Значения mAP (50, 50-95):
- Значения точности и полноты:
Со всеми значениями можно ознакомиться в файле results.csv
.
Графики зависимостей были построены с использованием MATLAB_R2022a.