图像分割中的对抗学习

Южно-Сибирский научный вестник Pub Date : 2023-10-31 DOI:10.25699/sssb.2023.51.5.005

А.Ф. Гайнетдинов

{"title":"图像分割中的对抗学习","authors":"А.Ф. Гайнетдинов","doi":"10.25699/sssb.2023.51.5.005","DOIUrl":null,"url":null,"abstract":"В статье рассматриваются методы нейронных сетей для сегментации изображений транспортных средств. Метод. Использовалось 3 нейронных сети: сверточная нейронная сеть (CNN), специализированные глубокие сверточные сети (TDCNN), сеть CowOut/CowMix, а также генеративно-состязательная сеть (GAN). В качестве объектов исследования были выбраны изображения автомобилей, автобусов, мотоциклов и велосипедов. Для обучения использовали разное количество изображений из выборки: от 30 до 300. Результаты работы.Все испытуемые модели показывают высокий процент эффективности. Значения показателей значительно увеличиваются с ростом количества данных для обучения во всех случаях. Минимальные результаты наблюдались при использовании типичной модели CNN и других нейронных сетей, тогда как генеративно-состязательная была наиболее результативной. В конечном итоге, показатели для классов «автомобиль», «автобус», «велосипед» и «мотоцикл» соответственно: IoU = 70,9%, 71,2%, 65,7%, 70,4%; dice = 96,0%, 97,3%, 94,7%, 96,7%; precision = 85,2%, 85,4%, 78,9%, 82,4%; specificity = 79,5%, 79,2%, 68,9%, 75,2%; accuracy = 80,3%, 80,3%, 75,3%, 79,7%. Выводы. Таким образом, применение состязательной сети является эффективным методом сегментации изображений транспортных средств, особенно автомобилей и автобосув, что может быть использовано в машинном зрении. This article discusses different methods of vehicle image segmentation based on neural network. A total of four neural networks were employed: the Convolutional Neural Network (CNN), the Tailored Deep Convolutional Neural Network (TDCNN), the CowOut/CowMix Network, and the Generative Adversarial Network (GAN). The dataset contained images of cars, buses, motorcycles and bicycles. The training datasets comprised 30 to 300 images. All models under testing show high efficiency. As the training data size increased, the values of the indicators also increased significantly; this is true for all cases. The typical CNN model and other neural networks performed poorer than the GAN model, which proved to be the most effective. For the datasets “car”, “bus”, “bicycle” and “motorcycle”, the following indicators were obtained: IoU = 70.9%, 71.2%, 65.7%, and 70.4%; dice = 96.0%, 97.3%, 94.7%, and 96.7%; precision = 85.2%, 85.4%, 78.9%, and 82.4%; specificity = 79.5%, 79.2%, 68.9%, and 75.2%; accuracy = 80.3%, 80.3%, 75.3%, and 79.7%, respectively. Based on the research, adversarial training is an effective method to segment out vehicles, especially cars and trucks, which can be used in machine vision.","PeriodicalId":133432,"journal":{"name":"Южно-Сибирский научный вестник","volume":"43 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-10-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"ADVERSARIAL LEARNING IN IMAGE SEGMENTATION\",\"authors\":\"А.Ф. Гайнетдинов\",\"doi\":\"10.25699/sssb.2023.51.5.005\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"В статье рассматриваются методы нейронных сетей для сегментации изображений транспортных средств. Метод. Использовалось 3 нейронных сети: сверточная нейронная сеть (CNN), специализированные глубокие сверточные сети (TDCNN), сеть CowOut/CowMix, а также генеративно-состязательная сеть (GAN). В качестве объектов исследования были выбраны изображения автомобилей, автобусов, мотоциклов и велосипедов. Для обучения использовали разное количество изображений из выборки: от 30 до 300. Результаты работы.Все испытуемые модели показывают высокий процент эффективности. Значения показателей значительно увеличиваются с ростом количества данных для обучения во всех случаях. Минимальные результаты наблюдались при использовании типичной модели CNN и других нейронных сетей, тогда как генеративно-состязательная была наиболее результативной. В конечном итоге, показатели для классов «автомобиль», «автобус», «велосипед» и «мотоцикл» соответственно: IoU = 70,9%, 71,2%, 65,7%, 70,4%; dice = 96,0%, 97,3%, 94,7%, 96,7%; precision = 85,2%, 85,4%, 78,9%, 82,4%; specificity = 79,5%, 79,2%, 68,9%, 75,2%; accuracy = 80,3%, 80,3%, 75,3%, 79,7%. Выводы. Таким образом, применение состязательной сети является эффективным методом сегментации изображений транспортных средств, особенно автомобилей и автобосув, что может быть использовано в машинном зрении. This article discusses different methods of vehicle image segmentation based on neural network. A total of four neural networks were employed: the Convolutional Neural Network (CNN), the Tailored Deep Convolutional Neural Network (TDCNN), the CowOut/CowMix Network, and the Generative Adversarial Network (GAN). The dataset contained images of cars, buses, motorcycles and bicycles. The training datasets comprised 30 to 300 images. All models under testing show high efficiency. As the training data size increased, the values of the indicators also increased significantly; this is true for all cases. The typical CNN model and other neural networks performed poorer than the GAN model, which proved to be the most effective. For the datasets “car”, “bus”, “bicycle” and “motorcycle”, the following indicators were obtained: IoU = 70.9%, 71.2%, 65.7%, and 70.4%; dice = 96.0%, 97.3%, 94.7%, and 96.7%; precision = 85.2%, 85.4%, 78.9%, and 82.4%; specificity = 79.5%, 79.2%, 68.9%, and 75.2%; accuracy = 80.3%, 80.3%, 75.3%, and 79.7%, respectively. Based on the research, adversarial training is an effective method to segment out vehicles, especially cars and trucks, which can be used in machine vision.\",\"PeriodicalId\":133432,\"journal\":{\"name\":\"Южно-Сибирский научный вестник\",\"volume\":\"43 1\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-10-31\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Южно-Сибирский научный вестник\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.25699/sssb.2023.51.5.005\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Южно-Сибирский научный вестник","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.25699/sssb.2023.51.5.005","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

摘要

本文讨论了用于车辆图像分割的神经网络方法。方法。使用了 3 种神经网络：卷积神经网络（CNN）、专用深度卷积网络（TDCNN）、CowOut/CowMix 网络和生成对抗网络（GAN）。研究对象包括汽车、公共汽车、摩托车和自行车。样本中不同数量的图像被用于训练：从 30 到 300 幅图像不等。性能结果：所有测试模型都显示出很高的性能百分比。在所有情况下，随着训练数据数量的增加，性能值都有明显提高。典型的 CNN 模型和其他神经网络的性能最低，而生成-对抗模型的性能最高。最终，"汽车"、"公共汽车"、"自行车 "和 "摩托车 "类别的性能分别为IoU=70.9%、71.2%、65.7%、70.4%；骰子=96.0%、97.3%、94.7%、96.7%；精确度=85.2%、85.4%、78.9%、82.4%；特异度=79.5%、79.2%、68.9%、75.2%；准确度=80.3%、80.3%、75.3%、79.7%。结论因此，应用对抗网络是分割车辆图像（尤其是汽车和车身）的有效方法，可用于机器视觉。本文讨论了基于神经网络的不同车辆图像分割方法。本文共使用了四种神经网络：卷积神经网络（CNN）、定制深度卷积神经网络（TDCNN）、CowOut/CowMix 网络和生成对抗网络（GAN）。数据集包含汽车、公共汽车、摩托车和自行车的图像。训练数据集包括 30 至 300 张图像。测试中的所有模型都表现出很高的效率。随着训练数据量的增加，指标值也显著增加；所有情况都是如此。典型的 CNN 模型和其他神经网络的表现不如 GAN 模型，而 GAN 模型被证明是最有效的。对于 "汽车"、"公共汽车"、"自行车 "和 "摩托车 "数据集，得到了以下指标：IoU = 70.9%、71.2%、65.7% 和 70.4%；骰子 = 96.0%、97.3%、94.7% 和 96.7%；精确度 = 85.2%、85.4%、78.9% 和 82.4%；特异度 = 79.5%、79.2%、68.9% 和 75.2%；准确度 = 80.3%、80.3%、75.3% 和 79.7%。根据研究结果，对抗训练是一种有效的车辆分割方法，尤其是汽车和卡车，可用于机器视觉。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文本刊更多论文

ADVERSARIAL LEARNING IN IMAGE SEGMENTATION

В статье рассматриваются методы нейронных сетей для сегментации изображений транспортных средств. Метод. Использовалось 3 нейронных сети: сверточная нейронная сеть (CNN), специализированные глубокие сверточные сети (TDCNN), сеть CowOut/CowMix, а также генеративно-состязательная сеть (GAN). В качестве объектов исследования были выбраны изображения автомобилей, автобусов, мотоциклов и велосипедов. Для обучения использовали разное количество изображений из выборки: от 30 до 300. Результаты работы.Все испытуемые модели показывают высокий процент эффективности. Значения показателей значительно увеличиваются с ростом количества данных для обучения во всех случаях. Минимальные результаты наблюдались при использовании типичной модели CNN и других нейронных сетей, тогда как генеративно-состязательная была наиболее результативной. В конечном итоге, показатели для классов «автомобиль», «автобус», «велосипед» и «мотоцикл» соответственно: IoU = 70,9%, 71,2%, 65,7%, 70,4%; dice = 96,0%, 97,3%, 94,7%, 96,7%; precision = 85,2%, 85,4%, 78,9%, 82,4%; specificity = 79,5%, 79,2%, 68,9%, 75,2%; accuracy = 80,3%, 80,3%, 75,3%, 79,7%. Выводы. Таким образом, применение состязательной сети является эффективным методом сегментации изображений транспортных средств, особенно автомобилей и автобосув, что может быть использовано в машинном зрении. This article discusses different methods of vehicle image segmentation based on neural network. A total of four neural networks were employed: the Convolutional Neural Network (CNN), the Tailored Deep Convolutional Neural Network (TDCNN), the CowOut/CowMix Network, and the Generative Adversarial Network (GAN). The dataset contained images of cars, buses, motorcycles and bicycles. The training datasets comprised 30 to 300 images. All models under testing show high efficiency. As the training data size increased, the values of the indicators also increased significantly; this is true for all cases. The typical CNN model and other neural networks performed poorer than the GAN model, which proved to be the most effective. For the datasets “car”, “bus”, “bicycle” and “motorcycle”, the following indicators were obtained: IoU = 70.9%, 71.2%, 65.7%, and 70.4%; dice = 96.0%, 97.3%, 94.7%, and 96.7%; precision = 85.2%, 85.4%, 78.9%, and 82.4%; specificity = 79.5%, 79.2%, 68.9%, and 75.2%; accuracy = 80.3%, 80.3%, 75.3%, and 79.7%, respectively. Based on the research, adversarial training is an effective method to segment out vehicles, especially cars and trucks, which can be used in machine vision.

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

Южно-Сибирский научный вестник

自引率

0.00%

发文量