AI-Robotics

О чем репозиторий

В данном репозитории хотелось бы рассказать о своем первом и увлекательном опыте внедрения искусственного интеллекта для автоматизации движения и выполнений действий робота.

В чем состояла задача

В данном файле представлен регламент хакатона.

регламент

Если вкратце: нужно переносить объекты в корзинку и нажать на кнопку единожды. Также робот должен передвигаться неврезаясь в стенки и другие объекты.

Моя роль в команде

Так как в моей команде не было ни одного человека, работавшего с компьютерным зрением, данную ношу взял на себя я, оставив для других задачу механики и управления робота. Таким образом, моей задачей было:

fine-tuning YOLO
Выделение статического поля игры со стенами
Определение открытых стенок в ящике, в котором лежит шарик
Детекция объектов с верхней камеры
Детекция объектов с нижней камеры

Про особенность каждой из задачь я расскажу далее.

fine-tuning YOLO

Т.к. нужно было работать с видео в реальном времени, а также на выданных нам ноутбуках не было gpu, пришлось брать yolo v5 nano от ultralitics. Она удобна тем, что имеет маленькое количество параметров, и потому она отрабатывала на cpu всего за 0.08 секунды (8 милисекунд), что почти не ощущается при использовании в реальном времени.

Для тонкой настройки модели я долго искал оптимальную аугментацию для учета всех возможных случаев (и для тени и для света), тк было всего 1 обработанное видео заезда и не хотелось делать большой датасет. Затем я заморозил все слои, кроме 9 последних и начал обучать.

При таком количестве данных, модель находила объекты везде: в тени, в свету, видя только часть и т.п.

Код fine-тюнинга: fine-tune

Метрики:

Выделение статического поля игры со стенами

Тк поле было достаточно простое и имело одни и теже объекты, мое решение опиралось на нескольких гипотезах

Изначально нам дано, что камера искривленно снимает, потому ее надо выравнять
Все объекты, имеющие высокий цветовой градиент - не пол. Таким образом можно было без проблем с высокой скоростью выделять стены и зону движения.
Самый большой объект на поле - ящик.
Открытые стенки ящика имеют больший процент содержания "светлых" пикселей. Таких стенок всего две из четырех и они всегда на противоположных сторонах
Все объекты, которые нас интересуют - не статичны, потому их можно исключать из поля зрения

Таким образом, приняты были следующие меры:

Применение дисторсии для исправления закруглений во время съемки
Применение чб-фильтра для нахождения наиболее черных и выделяющихся среди основного поля объектов
После применения фильтра проходиться небольшим ядром и на основе его зачищать от белых пикселей места, где была темень и тому подобное
Пуск в начале программы большого ядра, которое единожды проходится по полю и ищет пиксель, принадлежащий ящику
От пикселя, принадлежащего ящику пускалось небольшое ядро, которое, на основе процента белых пикселей, искало края ящика. Если процент меньше 1/4, значит это край (на углу мы получаем что заполнен только определенный край вадрата из четырех)
От крайних точек ящика пускаем по прямой линие небольшое ядро, считающее среднее кол-во белых пикселей на стороне. Если на определенных двух противоположных сторонах среднее больше, значит там есть стенки, и потому туда робот не проедет. Иначе - там нет стенок
После детекции была произведена зачистка поля от нестатичных объектов

Итоги:

Определение открытых стенок в ящике, в котором лежит шарик

Для нахождения открытых стенок в коробке:

Находим коробку
Ищем ее границы, те последние белые пиксели, с помощью небольших ядер, которые ищут момент, когда кол-во белых пикселей в ядре меньше 30 процентов, тк на границе белые пиксели должны быть в правой нижней части ядра
пускаем небольшие ядра от границ со всех сторон
если белых пикселей суммарно в левой и правой больше, чем в нижней и верхней, то левая и правая стенки закрыты, иначе наоборот
левая и правая стенка обозначаются как 16 и 17 соответственно (в дальнейшем это будет использоваться), а нижняя и верхняя как 14, 19

Итоги: find_boxes

Детекция объектов с верхней камеры

Для данной части:

Рисуем статическое поле
Детектируем интересующие нас объекты
Покрываем маску статического поля пикселями интересующих нас объектов

Итоги:

Детекция объектов с нижней камеры

Полностью аналогично детекции с верхней камеры, вот как это выглядит:

Подытожим

Для чего все это пишется? Пишется для того, чтобы показать насколько мощны алгоритмы компьютерного зрения в руках думающего человека. Вы только посмотрите, любую информацию о границах объекта, его классе можно узнать, даже не используя сложные нейронные сети. Мне очень понравился данный опыт, тк я не просто смотрел на метрики, я видел реальные результаты при движении робота и понимал, что стоит подправить. Учитывая, что я не занимался почти год компьютерным зрением, могу сказать, что время провел с пользой и очень классно!

Name	Name	Last commit message	Last commit date
Latest commit CHISH08 Build readme Nov 3, 2024 8c9e84f · Nov 3, 2024 History 2 Commits
data_for_present	data_for_present	Build readme	Nov 3, 2024
mask	mask	Build readme	Nov 3, 2024
top_view	top_view	Build readme	Nov 3, 2024
.gitignore	.gitignore	Build readme	Nov 3, 2024
README.md	README.md	Build readme	Nov 3, 2024
find_open_boxes.ipynb	find_open_boxes.ipynb	Build readme	Nov 3, 2024
finetune_yolo.ipynb	finetune_yolo.ipynb	Build readme	Nov 3, 2024
make_cadr.ipynb	make_cadr.ipynb	Build readme	Nov 3, 2024
record_and_make_dataset.py	record_and_make_dataset.py	Build readme	Nov 3, 2024
video2cadr.py	video2cadr.py	Build readme	Nov 3, 2024
yolo_trac.ipynb	yolo_trac.ipynb	Build readme	Nov 3, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AI-Robotics

О чем репозиторий

В чем состояла задача

Моя роль в команде

fine-tuning YOLO

Выделение статического поля игры со стенами

Определение открытых стенок в ящике, в котором лежит шарик

Детекция объектов с верхней камеры

Детекция объектов с нижней камеры

Подытожим

About

Releases

Packages

Languages

CHISH08/AI-Robotics

Folders and files

Latest commit

History

Repository files navigation

AI-Robotics

О чем репозиторий

В чем состояла задача

Моя роль в команде

fine-tuning YOLO

Выделение статического поля игры со стенами

Определение открытых стенок в ящике, в котором лежит шарик

Детекция объектов с верхней камеры

Детекция объектов с нижней камеры

Подытожим

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages