NeRF IN REINFORCEMENT LEARNING FOR IMAGE RECOGNITION

Южно-Сибирский научный вестник Pub Date : 2023-04-30 DOI:10.25699/sssb.2023.48.2.011

А.Ф. Гайнетдинов

{"title":"NeRF IN REINFORCEMENT LEARNING FOR IMAGE RECOGNITION","authors":"А.Ф. Гайнетдинов","doi":"10.25699/sssb.2023.48.2.011","DOIUrl":null,"url":null,"abstract":"Актуальность. В статье рассматриваются методы распознавания изображений с использованием нейронных сетей разной архитектуры, в том числе обучения с подкреплением Q-Learning. Метод. Для обучения алгоритмов и их тестирования использовались наборы изображений 6 классов лесных животных. Изучалось 6 вариаций наборов данных, отличие в которых обусловлено разной долей обучающей выборки: от 40 до 80%. Проанализировано семь методик распознавания: CNN-AE и два подхода визуального управления (NeRF-RL, DRQ-V2) обучались на основе двух- и трехмерной сверточной нейросети и Q-Learning. Результаты работы. Все испытуемые модели показывают высокий процент точности независимо от соотношения обучающей и тренирующей выборки. Минимальные результаты были зафиксированы при использовании CNN-AE, тогда как NeRF-RL и DRQ-V2 на основе двухмерных и трехмерных CNN были более точными. Обучение методов NeRF-RL и DRQ-V2 используя метод Q-Learning привел к получению наиболее точных результатов. Использование Q-Learning для обучения алгоритма NeRF-RL позволяет достичь максимальных результатов. Эта архитектура была применена для распознавания животных и распределения изображений по классам. Выводы. Таким образом, объединение алгоритмов NeRF и обучения с подкреплением является эффективным и перспективным методом распознавания изображений для использования в обработке информации со скрытых камер с целью обнаружении лесных животных.\n This study discusses image recognition methods that exploit different neural networks, including Q-Learning. The algorithms were trained and tested on images depicting 6 different classes of forest animals. A total of 6 image datasets with different amount of training data (40 to 80%) were taken. Here, seven image recognition techniques were analyzed: CNN-AE and two algorithms for visual continuous control (NeRF-RL and DRQ-V2), all trained on a two- and three-dimensional convolution neural network (CNN), as well as Q-Learning. All models had high accuracy; CNN-AE exhibited the lowest recognition accuracy, whilst NeRF-RL and DRQ-V2 based on 2D and 3D CNNs were more accurate. NeRF-RL and DRQ-V2 trained on data using the Q-Learning method yielded the highest accuracy. The use of Q-Learning to train the NeRF-RL algorithm provided the best result. This architecture has been applied for animal recognition and image classification into classes. Based on the research, the combination of NeRF algorithms and reinforcement learning is an effective and promising image recognition method for detecting forest animals in camera-trap images.","PeriodicalId":133432,"journal":{"name":"Южно-Сибирский научный вестник","volume":"86 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-04-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Южно-Сибирский научный вестник","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.25699/sssb.2023.48.2.011","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

Abstract

Актуальность. В статье рассматриваются методы распознавания изображений с использованием нейронных сетей разной архитектуры, в том числе обучения с подкреплением Q-Learning. Метод. Для обучения алгоритмов и их тестирования использовались наборы изображений 6 классов лесных животных. Изучалось 6 вариаций наборов данных, отличие в которых обусловлено разной долей обучающей выборки: от 40 до 80%. Проанализировано семь методик распознавания: CNN-AE и два подхода визуального управления (NeRF-RL, DRQ-V2) обучались на основе двух- и трехмерной сверточной нейросети и Q-Learning. Результаты работы. Все испытуемые модели показывают высокий процент точности независимо от соотношения обучающей и тренирующей выборки. Минимальные результаты были зафиксированы при использовании CNN-AE, тогда как NeRF-RL и DRQ-V2 на основе двухмерных и трехмерных CNN были более точными. Обучение методов NeRF-RL и DRQ-V2 используя метод Q-Learning привел к получению наиболее точных результатов. Использование Q-Learning для обучения алгоритма NeRF-RL позволяет достичь максимальных результатов. Эта архитектура была применена для распознавания животных и распределения изображений по классам. Выводы. Таким образом, объединение алгоритмов NeRF и обучения с подкреплением является эффективным и перспективным методом распознавания изображений для использования в обработке информации со скрытых камер с целью обнаружении лесных животных. This study discusses image recognition methods that exploit different neural networks, including Q-Learning. The algorithms were trained and tested on images depicting 6 different classes of forest animals. A total of 6 image datasets with different amount of training data (40 to 80%) were taken. Here, seven image recognition techniques were analyzed: CNN-AE and two algorithms for visual continuous control (NeRF-RL and DRQ-V2), all trained on a two- and three-dimensional convolution neural network (CNN), as well as Q-Learning. All models had high accuracy; CNN-AE exhibited the lowest recognition accuracy, whilst NeRF-RL and DRQ-V2 based on 2D and 3D CNNs were more accurate. NeRF-RL and DRQ-V2 trained on data using the Q-Learning method yielded the highest accuracy. The use of Q-Learning to train the NeRF-RL algorithm provided the best result. This architecture has been applied for animal recognition and image classification into classes. Based on the research, the combination of NeRF algorithms and reinforcement learning is an effective and promising image recognition method for detecting forest animals in camera-trap images.

查看原文本刊更多论文

图像识别中的强化学习

相关。这篇文章讨论了使用不同建筑的神经网络来识别图像的方法，包括强化Q-Learning的培训。方法。研究算法和测试使用了6类森林动物的图像集。研究了6个不同的数据集集，不同的是学习样本的不同部分:40到80%。CNN-AE分析了七种识别方法:CNN-AE和两种视觉控制方法(NeRF-RL, DRQ-V2)。工作成果。所有测试模型都显示了高精度，不管教学样本和训练样本的比例如何。CNN-AE的最低结果是记录在案的，而NeRF-RL和DRQ-V2基于二维和三维CNN更准确。NeRF-RL和DRQ-V2的培训使用Q-Learning方法产生了最精确的结果。使用Q-Learning来学习NeRF-RL算法可以达到最大的结果。这是一种用于动物识别和分组图像的建筑。结论。因此，将NeRF算法和培训与备份结合起来，是一种有效而有前途的识别图像的方法，用于利用隐藏摄像头的信息来识别森林动物。这个工作室的形象重建是由不同的新网络，including Q-Learning。《森林动物》中的六部不同的经典之作。在taken的40到80%的地方有6个不同的图像数据。在这里，七个想象中的技术问题:CNN-AE和两个algorithms (NeRF-RL和DRQ-V2)。所有的模特都有高水平的accuracy;CNN-AE揭露了最失败的功利主义，whilst NeRF-RL和DRQ-V2基础2D和3D CNNs更多。NeRF-RL和DRQ-V2在最高的accuracy上运行。《Q-执着》是《NeRF-RL algorithm provided最佳反应》。这是一种建筑，为动物重建和形象经典。在研究的基础上，NeRF algorithms和reinforcent是研究对象和研究森林动物的视觉治疗。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Южно-Сибирский научный вестник

自引率

0.00%

发文量