Your AI powered learning assistant

YOLOv8: Как обучиться обнаружению объектов в пользовательском наборе данных

Introduction

00:00:00

Последняя версия весьма влиятельного алгоритма You Only Look Once (YOLO), получившего название Yellow V8, претендует на звание самого современного (SOTA) в области обнаружения объектов в режиме реального времени. Внутренние измерения показывают, что он настраивается намного быстрее, чем его предшественники, при тестировании на наборе данных Roboflow 100.

Overview

00:00:51

В этом видео представлен процесс обучения модели yellow V8 на пользовательских данных для обнаружения объектов. Основное внимание уделяется обучению, проверке, прогнозированию и развертыванию модели с использованием набора данных обнаружения футболистов, доступного в roboflow Universe. В нем также обсуждаются изменения в базе кода и вводится новое использование API.

Setting up the Python environment

00:03:09

В будущем библиотека YOLO V8 может претерпеть небольшие изменения API. Видеоматериалы являются частью репозитория Roboflow Notebooks и будут обновляться после внесения серьезных изменений командой YOLO V8. Для начала подтвердите ускорение графического процессора с помощью команды Nvidia.

New API: CLI vs. Python SDK

00:05:36

Введение в новый API Новый API для взаимодействия с базой желтого кода предлагает два варианта: CLI и SDK. CLI позволяет запускать такие задачи, как обнаружение, сегментация или классификация, из командной строки с помощью одной команды. С другой стороны, SDK предоставляет питонический способ использования yellow, импортируя его из ultralytics и создавая экземпляр модели.

Сравнение: CLI против Python SDK Сравнение CLI и Python SDK для выполнения прогнозов показывает, что оба метода достигают схожих результатов. Используя прогнозирование в качестве примера, в обоих случаях мы можем загружать модели в память и отображать обнаруженные объекты, такие как люди, автомобили или собаки, на изображениях.

Prepare the YOLOv8 object detection dataset

00:08:51

Набор данных для обнаружения объектов YOLOv8 может быть подготовлен с использованием того же формата данных, что и YOLOv5. Roboflow предоставляет платформу для создания и аннотирования набора данных, что позволяет легко загружать изображения и назначать задачи маркировки.

Train YOLOv8 model on custom dataset

00:12:29

Загрузка пользовательского набора данных Чтобы загрузить пользовательский набор данных для обучения YOLOv8, мы можем использовать функцию, добавленную специально для запуска YOLOv8. При нажатии на предоставленную кнопку генерируется фрагмент кода для загрузки набора данных в формате YOLOv8. После вставки и выполнения его в нашем блокноте немедленно начнется процесс загрузки.

Выполнение обучения с настроенным гиперпараметром После завершения загрузки набора данных нам нужно настроить только один гиперпараметр перед началом обучения. Мы ограничиваем количество эпох со 100 примерно до 25 из-за большого размера данных. После выполнения начнется обучение, которое займет примерно час.

YOLOv8 model evaluation

00:13:54

Обучение завершено, и пришло время просмотреть результаты. Мы рассмотрим показатели путаницы, показывающие, как наша модель обрабатывает различные классы. На диаграммах отображены ключевые показатели, отслеживаемые YOLOv8 object detection, что указывает на то, что более длительное обучение могло бы дать лучшие результаты.

YOLOv8 model inference on images and videos

00:16:47

Вывод модели YOLOv8 Модель YOLOv8 используется для вывода на основе изображений и видео с акцентом на истинные показатели карты. Выделена эффективность модели в обнаружении судей и вратарей, хотя окклюзия может повлиять на обнаружение мяча.

Скорость вывода и возможности Подчеркивается скорость логического вывода на основе графического процессора с использованием YOLOv8, в примере показаны быстрые результаты при выполнении логического вывода как на изображениях, так и на видео. Короткий фрагмент, демонстрирующий возможности YOLOv8 из результата видео, который был загружен из-за проблем с отображением в пользовательском интерфейсе Google Colab.

YOLOv8 model deployment and inference via hosted API

00:18:44

Развертывание модели YOLOv8 и использование ее для логического вывода через API можно выполнить всего с помощью одной строки кода: project version deploy, передав тип модели и путь к каталогу train. После загрузки весов на сервер мы можем подтвердить успешную загрузку в нашей учетной записи roboflow, установив зеленую галочку рядом с версией набора данных. Это позволяет нам использовать развернутую модель для вывода через размещенный API либо путем перетаскивания изображения в браузер, либо посредством интеграции с базой кода.

Conclusion

00:19:58

Видео завершается приглашением следить за обновлениями для будущих видеороликов серии, в которых будут затронуты такие темы, как мгновенная сегментация, классификация и сравнение Yellow V8 с предыдущими моделями обнаружения объектов. Зрителям рекомендуется ставить лайки и подписываться на уведомления о предстоящих выпусках.