用于深度对焦生成司机行为的数据

Michael Stephen Lui, Fitra Abdurrachman Bachtiar, Novanto Yudistira
{"title":"用于深度对焦生成司机行为的数据","authors":"Michael Stephen Lui, Fitra Abdurrachman Bachtiar, Novanto Yudistira","doi":"10.25126/jtiik.20231056978","DOIUrl":null,"url":null,"abstract":"Kecelakaan kendaraan adalah salah satu penyebab kematian tertinggi di Indonesia. Salah satu solusi untuk mencegah kecelakaan adalah dengan menggunakan sensor eksternal untuk mendeteksi kondisi jalan. Namun, penyebab utama kecelakaan adalah kelalaian pengemudi ketika mengemudi yang tidak dapat terdeteksi oleh sensor eksternal. Sensor visual dapat mendeteksi perilaku pengemudi di dalam kendaraan. Penggunaan sensor visual memiliki performa yang lebih baik ketika menggunakan metode deep learning. Salah satu metode untuk meningkatkan performa metode deep learning adalah dengan menggunakan data sintesis hasil model generatif sebagai tambahan data. Deep Convolutional Generative Adversarial Network (DCGAN) adalah salah satu model generatif yang menggunakan lapisan konvolusi. DCGAN terdiri dari dua neural network bernama generator dan discriminator yang membentuk hubungan ­zero-sum game. Generator menerima masukan berupa gambar asli dengan tambahan noise sebagai input proses latih secara unsupervised, menghasilkan gambar sintesis, sedangkan discriminator menerima gambar asli dan gambar sintesis sebagai input dan menghitung keaslian gambar yang selanjutnya digunakan sebagai nilai loss dengan fungsi loss Binary Cross Entropy. Arsitektur DCGAN terdiri dari beberapa transposed convolutional layer dengan batch normalization dan fungsi aktivasi ReLU dan fungsi aktivasi Tanh sebagai output layer pada generator dan beberapa convolutional layer dengan batch normalization dan fungsi aktivasi Leaky ReLU dan fungsi aktivasi Sigmoid sebagai output layer pada discriminator. Dataset yang digunakan pada penelitian ini adalah dataset ISDDS perilaku umum pengemudi yang dikumpulan pada skenario simulasi dengan jumlah dua ribu gambar. Hasil pengujian menemukan bahwa nilai hyperparameter dapat menghasilkan gambar sintesis perilaku pengemudi di dalam kendaraan yang baik dengan nilai FID sebesar 274,16 pada learning rate discriminator pada 0,0001, β1 discriminator pada 0,8005, learning rate generator pada 0,0017, β1 generator pada 0,1138 selama 43 epoch dengan menggunakan optimizer Adam pada generator dan discriminator. Abstract Vehicle crash is one of the leading causes of death in Indonesia. One of the solutions to prevent vehicle crash is by using external sensor to detect road condition. Yet, most crash happened because of driver distraction, which is hard to detect using external sensor. Visual sensor can be used to detect driver activity inside vehicle. Visual sensor that uses deep learning method performs well. One way to increase deep learning method performance is by using additional synthesis data made by generative model. Deep Convolutional Generative Adversarial Network (DCGAN) is a generative model that uses convolution layer. DCGAN consists of two neural networks titled generator and discriminator which create zero-sum game relationship. Generator will receive real image with added noise as input of unsupervised training process, creating synthetic image, while discriminator will receive real image and synthetic image as input and calculate the realness of those image which will be used as loss value with Binary Cross Entropy loss function. The Architecture of DCGAN is composed of multiple transposed convolutional layers with batch normalization and activation function ReLU and activation function Tanh as output layer in generator and multiple convolutional layers with batch normalization and activation function Leaky ReLU and activation function Sigmoid as output layer in discriminator. Dataset used in this research is primary dataset of common driver activity collected in simulation scenario with the size of two thousand images. Experiment result shows that DCGAN is able to create good image synthesis of driver activity inside vehicle with FID of 274,16 using hyperparameter consisting of learning rate discriminator at 0,0001, β1 discriminator at 0,8005, learning rate generator at 0,0017, β1 generator at 0,1138 for 43 epochs by using Adam optimizer on generator dan discriminator.","PeriodicalId":32501,"journal":{"name":"Jurnal Teknologi Informasi dan Ilmu Komputer","volume":"6 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-10-17","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Penerapan Deep Convolutional Generative Adversarial Network Untuk Menciptakan Data Sintesis Perilaku Pengemudi Dalam Berkendara\",\"authors\":\"Michael Stephen Lui, Fitra Abdurrachman Bachtiar, Novanto Yudistira\",\"doi\":\"10.25126/jtiik.20231056978\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Kecelakaan kendaraan adalah salah satu penyebab kematian tertinggi di Indonesia. Salah satu solusi untuk mencegah kecelakaan adalah dengan menggunakan sensor eksternal untuk mendeteksi kondisi jalan. Namun, penyebab utama kecelakaan adalah kelalaian pengemudi ketika mengemudi yang tidak dapat terdeteksi oleh sensor eksternal. Sensor visual dapat mendeteksi perilaku pengemudi di dalam kendaraan. Penggunaan sensor visual memiliki performa yang lebih baik ketika menggunakan metode deep learning. Salah satu metode untuk meningkatkan performa metode deep learning adalah dengan menggunakan data sintesis hasil model generatif sebagai tambahan data. Deep Convolutional Generative Adversarial Network (DCGAN) adalah salah satu model generatif yang menggunakan lapisan konvolusi. DCGAN terdiri dari dua neural network bernama generator dan discriminator yang membentuk hubungan ­zero-sum game. Generator menerima masukan berupa gambar asli dengan tambahan noise sebagai input proses latih secara unsupervised, menghasilkan gambar sintesis, sedangkan discriminator menerima gambar asli dan gambar sintesis sebagai input dan menghitung keaslian gambar yang selanjutnya digunakan sebagai nilai loss dengan fungsi loss Binary Cross Entropy. Arsitektur DCGAN terdiri dari beberapa transposed convolutional layer dengan batch normalization dan fungsi aktivasi ReLU dan fungsi aktivasi Tanh sebagai output layer pada generator dan beberapa convolutional layer dengan batch normalization dan fungsi aktivasi Leaky ReLU dan fungsi aktivasi Sigmoid sebagai output layer pada discriminator. Dataset yang digunakan pada penelitian ini adalah dataset ISDDS perilaku umum pengemudi yang dikumpulan pada skenario simulasi dengan jumlah dua ribu gambar. Hasil pengujian menemukan bahwa nilai hyperparameter dapat menghasilkan gambar sintesis perilaku pengemudi di dalam kendaraan yang baik dengan nilai FID sebesar 274,16 pada learning rate discriminator pada 0,0001, β1 discriminator pada 0,8005, learning rate generator pada 0,0017, β1 generator pada 0,1138 selama 43 epoch dengan menggunakan optimizer Adam pada generator dan discriminator. Abstract Vehicle crash is one of the leading causes of death in Indonesia. One of the solutions to prevent vehicle crash is by using external sensor to detect road condition. Yet, most crash happened because of driver distraction, which is hard to detect using external sensor. Visual sensor can be used to detect driver activity inside vehicle. Visual sensor that uses deep learning method performs well. One way to increase deep learning method performance is by using additional synthesis data made by generative model. Deep Convolutional Generative Adversarial Network (DCGAN) is a generative model that uses convolution layer. DCGAN consists of two neural networks titled generator and discriminator which create zero-sum game relationship. Generator will receive real image with added noise as input of unsupervised training process, creating synthetic image, while discriminator will receive real image and synthetic image as input and calculate the realness of those image which will be used as loss value with Binary Cross Entropy loss function. The Architecture of DCGAN is composed of multiple transposed convolutional layers with batch normalization and activation function ReLU and activation function Tanh as output layer in generator and multiple convolutional layers with batch normalization and activation function Leaky ReLU and activation function Sigmoid as output layer in discriminator. Dataset used in this research is primary dataset of common driver activity collected in simulation scenario with the size of two thousand images. Experiment result shows that DCGAN is able to create good image synthesis of driver activity inside vehicle with FID of 274,16 using hyperparameter consisting of learning rate discriminator at 0,0001, β1 discriminator at 0,8005, learning rate generator at 0,0017, β1 generator at 0,1138 for 43 epochs by using Adam optimizer on generator dan discriminator.\",\"PeriodicalId\":32501,\"journal\":{\"name\":\"Jurnal Teknologi Informasi dan Ilmu Komputer\",\"volume\":\"6 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-10-17\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Jurnal Teknologi Informasi dan Ilmu Komputer\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.25126/jtiik.20231056978\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jurnal Teknologi Informasi dan Ilmu Komputer","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.25126/jtiik.20231056978","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

车祸是印尼最大的死因之一。防止事故的一个解决方案是使用外部传感器来检测道路状况。然而,事故的主要原因是司机在驾驶时疏忽,而驾驶是外部传感器无法检测到的。视觉传感器可以探测车辆内的司机行为。使用视觉审查在深度学习方法时表现更好。提高深度学习方法性能的一种方法是将生成模型合成数据作为数据的补充。深层对联生成副词网络(DCGAN)是使用彻底变革的一代模型之一。DCGAN由两个神经网络组成,叫做发电机和解析器,它们构成了一种关系零和游戏。生成器以未经授权的排练过程中添加的声音输入来接收合成图像,而生成器接收真实图像和合成图像作为输入,并计算图像的真实性,然后将其作为丢失的值与二进制的叉叉函数一起使用。DCGAN的架构由几个面溶化层组成,其中包括正化批次和发电机上的ReLU激活功能和Tanh激活功能,以及一些未联机表单表单表单表单,以及正化表单表单表单表单,以及正化表单表单表单表单,以及正化表单表单表单表单。本研究中使用的数据是司机在模拟场景中收集的一个典型行为id数据,其中包含了2000张照片。测试结果发现hyperparameter价值可以产生图像合成司机在车内的行为对学习速率FID的价值高达274.16 discriminator的0,0001,β1 discriminator 0.8005学习速率在0.0017发电机,发电机β1期间向0.1138 43用亚当的发电机和discriminator优化,形成化石。摘要状车祸是印尼导致死亡的原因之一。其中一种预防车祸的方法是使用外部传感器探测道路。然而,最具崩溃发生的原因是司机被剥夺了对外部传感器的严格检测。可视传感器可以用来探测司机的车内活动。深度学习方法方法的视觉审查。一种方法是通过使用生成生成的数据合成技术增加深度学习方法。深层对联生成adversaral网络(DCGAN)是uses收敛层的一般性模型。DCGAN的公司包括两个神经网络提振发生器和分配器,该发生器创造了一种零和游戏关系。生成器将收集真实意象与添加的声音,即未经授权的培训程序、合成意象,而检阅器将收集真实意象作为输入和合成意象,并将其作为输入和合成意象的现实形象,这些意象将被用作丢失的图形与二进制的交叉功能。计算机的架构是用发电机中的非化和激活功能来协调的。这项研究使用的数据是基于2000幅图像的模型模型中常见司机参与的集合。论点实验节目,以至于DCGAN able to创建美好形象的一个综合体。活动内部车辆和司机用hyperparameter FID的274.16 consisting of学习速率discriminator at 0,0001,β1 discriminator at 0.8005学习速率at 0.0017发电机,发电机β1 at 0.1138 for 43 epochs):用亚当在发电机和discriminator优化。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Penerapan Deep Convolutional Generative Adversarial Network Untuk Menciptakan Data Sintesis Perilaku Pengemudi Dalam Berkendara
Kecelakaan kendaraan adalah salah satu penyebab kematian tertinggi di Indonesia. Salah satu solusi untuk mencegah kecelakaan adalah dengan menggunakan sensor eksternal untuk mendeteksi kondisi jalan. Namun, penyebab utama kecelakaan adalah kelalaian pengemudi ketika mengemudi yang tidak dapat terdeteksi oleh sensor eksternal. Sensor visual dapat mendeteksi perilaku pengemudi di dalam kendaraan. Penggunaan sensor visual memiliki performa yang lebih baik ketika menggunakan metode deep learning. Salah satu metode untuk meningkatkan performa metode deep learning adalah dengan menggunakan data sintesis hasil model generatif sebagai tambahan data. Deep Convolutional Generative Adversarial Network (DCGAN) adalah salah satu model generatif yang menggunakan lapisan konvolusi. DCGAN terdiri dari dua neural network bernama generator dan discriminator yang membentuk hubungan ­zero-sum game. Generator menerima masukan berupa gambar asli dengan tambahan noise sebagai input proses latih secara unsupervised, menghasilkan gambar sintesis, sedangkan discriminator menerima gambar asli dan gambar sintesis sebagai input dan menghitung keaslian gambar yang selanjutnya digunakan sebagai nilai loss dengan fungsi loss Binary Cross Entropy. Arsitektur DCGAN terdiri dari beberapa transposed convolutional layer dengan batch normalization dan fungsi aktivasi ReLU dan fungsi aktivasi Tanh sebagai output layer pada generator dan beberapa convolutional layer dengan batch normalization dan fungsi aktivasi Leaky ReLU dan fungsi aktivasi Sigmoid sebagai output layer pada discriminator. Dataset yang digunakan pada penelitian ini adalah dataset ISDDS perilaku umum pengemudi yang dikumpulan pada skenario simulasi dengan jumlah dua ribu gambar. Hasil pengujian menemukan bahwa nilai hyperparameter dapat menghasilkan gambar sintesis perilaku pengemudi di dalam kendaraan yang baik dengan nilai FID sebesar 274,16 pada learning rate discriminator pada 0,0001, β1 discriminator pada 0,8005, learning rate generator pada 0,0017, β1 generator pada 0,1138 selama 43 epoch dengan menggunakan optimizer Adam pada generator dan discriminator. Abstract Vehicle crash is one of the leading causes of death in Indonesia. One of the solutions to prevent vehicle crash is by using external sensor to detect road condition. Yet, most crash happened because of driver distraction, which is hard to detect using external sensor. Visual sensor can be used to detect driver activity inside vehicle. Visual sensor that uses deep learning method performs well. One way to increase deep learning method performance is by using additional synthesis data made by generative model. Deep Convolutional Generative Adversarial Network (DCGAN) is a generative model that uses convolution layer. DCGAN consists of two neural networks titled generator and discriminator which create zero-sum game relationship. Generator will receive real image with added noise as input of unsupervised training process, creating synthetic image, while discriminator will receive real image and synthetic image as input and calculate the realness of those image which will be used as loss value with Binary Cross Entropy loss function. The Architecture of DCGAN is composed of multiple transposed convolutional layers with batch normalization and activation function ReLU and activation function Tanh as output layer in generator and multiple convolutional layers with batch normalization and activation function Leaky ReLU and activation function Sigmoid as output layer in discriminator. Dataset used in this research is primary dataset of common driver activity collected in simulation scenario with the size of two thousand images. Experiment result shows that DCGAN is able to create good image synthesis of driver activity inside vehicle with FID of 274,16 using hyperparameter consisting of learning rate discriminator at 0,0001, β1 discriminator at 0,8005, learning rate generator at 0,0017, β1 generator at 0,1138 for 43 epochs by using Adam optimizer on generator dan discriminator.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
审稿时长
16 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信