По всем вопросам звоните:

+7 495 274-22-22

УДК: 004.8 DOI:10.33920/pro-02-2512-03

Применение компьютерного зрения для диагностики оборудования, предобработки изображений, сегментации объектов

Юдачев С.С. канд. техн. наук, доцент, МГТУ им. Н.Э. Баумана, 105005, Москва ул. 2-я Бауманская, д. 5
Варламова А.П. Е-mail: anastasiavarlamow4@yandex.ru, МГТУ им. Н.Э. Баумана, 105005, Москва ул. 2-я Бауманская, д. 5
Гордиенко Д.А. Е-mail: gordienkodmitrij722@gmail.com, МГТУ им. Н.Э. Баумана, 105005, Москва ул. 2-я Бауманская, д. 5
Полханова В.И. Е-mail: valeriapolkhanova@gmail.com, МГТУ им. Н.Э. Баумана, 105005, Москва ул. 2-я Бауманская, д. 5

Статья посвящена основным методам предобработки изображений, использующихся в задачах технического зрения, а также формированию алгоритма распознавания объектов на изображении в затрудненных условиях работы камеры. Обсуждаются этапы и способы предобработки изображений, включая коррекцию условий видимости и фильтрацию шума. Рассматриваются методы бинаризации и математической морфологии, позволяющие выделять объекты на изображении и улучшать результаты распознавания. Выбор среды MATLAB для реализации алгоритмов обоснован ее широкими возможностями и наличием библиотек для обработки изображений.

Литература:

1. Бобков, А.В., Палкин, М.В. Распознавание изображений с использованием методов технического зрения: учебно-методическое пособие. Москва: Издательство МГТУ им. Н. Э. Баумана, 2022. — 300 с.

2. Степанов, Д.Н. Методы и алгоритмы определения положения и ориентации беспилотного летательного аппарата с применением бортовых видеокамер // Программные продукты и системы. — 2014. — №6. — С. 150–157.

3. Техническое зрение в системах управления мобильными объектами 2010: Труды научно-технической конференции-семинара / под ред. Р.Р. Назирова. Москва: КДУ. — 2011. — 250 с.

4. Иванов, И.И. Основы машинного обучения для компьютерного зрения. Москва: Издательство МГТУ. — 2023. — 120 с.

5. Петрова, Е.В. Современные подходы к обработке изображений в системах видеонаблюдения // Информационные технологии. — 2022. — №3. — С. 45–50.

6. Смирнов, А.А. Алгоритмы глубокого обучения для распознавания объектов. Санкт-Петербург: Издательство СПбГУ, 2023.

7. Гончаров, Д.А., Недзьведь, А.М., Абламейко, С.В. Алгоритм скелетизации объектов на трехмерных растровых изображениях// Доклады БГУИР URL: https://doklady.bsuir.by/jour/article/viewFile/589/589 (дата обращения: 18.04.2024).

8. Мустаев, А.Ф. Использование технологии «машинного зрения» для управления БПЛА. КиберЛенинка: Российская научная электронная библиотека. Эл ресурс. URL: https://cyberleninka.ru/article/n/ispolzovanie-tehnologii-mashinnogo-zreniya-dlya-upravleniya-bpla/viewer (дата обращения: 20.04.2024).

9. Шапиро, Л., Стокман, Дж. Компьютерное зрение; пер. с англ. — М.: БИНОМ. Лаборатория знаний, 2006. — 752 с.: ил.

10. Машинное зрение. Что это и как им пользоваться? Обработка изображений оптического источника. Эл ресурс. URL: https://habr.com/ru/articles/350918/ (дата обращения: 20.04.2024).

Задачи технического зрения, возникающие при его использовании в области распознавания, заключаются в определении положения и захвате объекта, подсчете количества объектов в поле зрения и т. д. Общая характеристика всех таких задач состоит в том, что изображение получают при стабильных и заранее известных условиях освещенности, положении камеры и ракурсе съемки. Эти дополнительные условия позволяют строить относительно простые, надежные и вместе с тем эффективные алгоритмы на основе методов бинаризации, математической морфологии, выделения и сравнения всех признаков.

Существует достаточно много сред и библиотек, ориентированных на распознавание изображений. Выбрана среда MATLAB, т.к. она является стандартом инженерной среды моделирования и включает в себя набор библиотек, содержащих как классические и современные алгоритмы и методы, в том числе в области распознавания. Для задач распознавания используются средства Image Processing Toolbox, содержащего реализацию большинства известных классических и многих современных алгоритмов распознавания.

Решение задач технического зрения включает в себя, как правило, следующие этапы:

1. предобработку изображения;

2. бинаризацию;

3. разметку;

4. выделение признаков;

5. классификацию и идентификацию на основе выявленных признаков.

Цель этапа предобработки — трансформировать исходное изображение, зная условия получения изображения, максимально приблизив его к желаемому. Предобработка включает в себя фильтрацию шума и помех, коррекцию условий освещенности и коррекцию ракурса съемки [1–6].

Разметка объектов еще более упрощает анализ изображения, поскольку с ее помощью можно отделить одни объекты от других и проанализировать их независимо друг от друга [6].

Предобработка изображения включает в себя следующие процедуры:

— коррекцию условий видимости;

— нелинейную коррекцию;

— коррекцию ракурса;

— подавление помех и шума [6].

В статье изучены процедуры коррекции и подавления помех и шума, а также операции математической морфологии для распознавания объектов на изображении. На основе изученных методов сформирован алгоритм обработки изображения и обнаружения объекта на нём в затруднённых условиях работы камеры.

Для Цитирования:
Юдачев С.С., Варламова А.П., Гордиенко Д.А., Полханова В.И., Применение компьютерного зрения для диагностики оборудования, предобработки изображений, сегментации объектов. Главный механик. 2025;12.
Полная версия статьи доступна подписчикам журнала
Язык статьи:
Действия с выбранными: