{"title":"Система виявлення обличчя на зображенні з використанням глибинної згорткової нейронної мережі","authors":"О. В. Яловега, Р. А. Мельник","doi":"10.36930/40320209","DOIUrl":null,"url":null,"abstract":"Здійснено огляд попередніх досліджень та актуальність систем з пошуку обличчя. Виявлено недоліки і труднощі, що впливають на їх ефективність. Запропоновано для реалізації систему для пошуку обличчя на зображенні на підставі алгоритмів розпізнавання обличчя. Пошук обличчя є першим кроком у різних інших застосуваннях: відстеження, аналіз, розпізнавання осіб. Окрім використання у поєднанні з технологіями, описаними вище, можна використовувати пошук обличчя, щоб: підрахувати кількість людей, які є на екрані або дивляться на цифровий дисплей; визначити, які ділянки зображення потрібно розмивати, щоб забезпечити конфіденційність. Використано глибинні згорткові нейронні мережі для реалізації, оскільки вони ефективніші для цієї задачі. Науковим результатом під час розроблення поданої системи є удосконалення алгоритмів розпізнавання обличчя на зображенні: пришвидшення, підвищення точності розпізнавання. Реалізовано першу версію запропонованої системи. Розроблена система може бути використана у різних сферах людської діяльності та в багатьох задачах аналітики. Для цього використано Tensoflow – спеціальний фреймоворк для розробки, навчання власних глибинних нейронних мереж. Вирішено використати набір даних LFW – People (Face Recognition) для навчання моделі. Використано Python бібліотеку LabelImg, щоб попередньо промаркувати навчальні дані, які нейронна мережа повинна знаходити на зображенні. Зроблено карту міток для навчання моделі. Запущено 25000 ітерацій для навчання моделі. Отримано рівень втрат 0,069 (похибка у 6,9 %) на останній ітерації. Модель показує однозначний результат для більшості тестових даних (≥99 %), але рівень точності у випадках, коли на зображенні містилися головні убори, є дещо нижчим (97 %). Модель поки що не тестувалася на даних із великим кутом повороту обличчя, тому важливо перевірити її стійкість для цього фактору і за змогою знизити його вплив на точність моделі.","PeriodicalId":33529,"journal":{"name":"Naukovii visnik NLTU Ukrayini","volume":null,"pages":null},"PeriodicalIF":0.0000,"publicationDate":"2022-04-28","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Naukovii visnik NLTU Ukrayini","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.36930/40320209","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Здійснено огляд попередніх досліджень та актуальність систем з пошуку обличчя. Виявлено недоліки і труднощі, що впливають на їх ефективність. Запропоновано для реалізації систему для пошуку обличчя на зображенні на підставі алгоритмів розпізнавання обличчя. Пошук обличчя є першим кроком у різних інших застосуваннях: відстеження, аналіз, розпізнавання осіб. Окрім використання у поєднанні з технологіями, описаними вище, можна використовувати пошук обличчя, щоб: підрахувати кількість людей, які є на екрані або дивляться на цифровий дисплей; визначити, які ділянки зображення потрібно розмивати, щоб забезпечити конфіденційність. Використано глибинні згорткові нейронні мережі для реалізації, оскільки вони ефективніші для цієї задачі. Науковим результатом під час розроблення поданої системи є удосконалення алгоритмів розпізнавання обличчя на зображенні: пришвидшення, підвищення точності розпізнавання. Реалізовано першу версію запропонованої системи. Розроблена система може бути використана у різних сферах людської діяльності та в багатьох задачах аналітики. Для цього використано Tensoflow – спеціальний фреймоворк для розробки, навчання власних глибинних нейронних мереж. Вирішено використати набір даних LFW – People (Face Recognition) для навчання моделі. Використано Python бібліотеку LabelImg, щоб попередньо промаркувати навчальні дані, які нейронна мережа повинна знаходити на зображенні. Зроблено карту міток для навчання моделі. Запущено 25000 ітерацій для навчання моделі. Отримано рівень втрат 0,069 (похибка у 6,9 %) на останній ітерації. Модель показує однозначний результат для більшості тестових даних (≥99 %), але рівень точності у випадках, коли на зображенні містилися головні убори, є дещо нижчим (97 %). Модель поки що не тестувалася на даних із великим кутом повороту обличчя, тому важливо перевірити її стійкість для цього фактору і за змогою знизити його вплив на точність моделі.