基于深度学习的视障人士产品分类系统

Fatma Betül Keskin, Nursena Bayğın, Işıl Karabey Aksakallı, Özlem Çomaklı Sökmen
{"title":"基于深度学习的视障人士产品分类系统","authors":"Fatma Betül Keskin, Nursena Bayğın, Işıl Karabey Aksakallı, Özlem Çomaklı Sökmen","doi":"10.28948/ngumuh.1375785","DOIUrl":null,"url":null,"abstract":"Görme yetersizliğine sahip bireylerin hayatını kolaylaştırmak ve diğer bireylere bağımlılıklarını en aza indirmek amacıyla market raflarının ve ürünlerin sınıflandırılması önem arz etmektedir. Ürünlerin sınıflandırılması ve ürün raflarının tanıtılması için çeşitli görüntü işleme yöntemleri halihazırda kullanılmaktadır. Yapılan araştırmalar doğrultusunda market raflarının ve ürünlerin sınıflandırılması için çoğunlukla geleneksel yöntemlerin kullanıldığı görülmektedir. Bu çalışmada market raflarındaki ürünler geleneksel görüntü işleme yöntemlerinden farklı olarak yüksek doğruluk ve hızda sonuç verebilen derin yapay sinir ağları kullanılarak sınıflandırılmıştır. Ayrıca bu çalışmada, görme bozukluğuna sahip bireylere kolaylık sağlaması açısından gündelik hayatta kullanılan akıllı cihazlara yüklenebilen ve tüm mobil işletim sistemlerini destekleyen flutter altyapısı kullanılmıştır. Bu sayede tüm mobil platformlarda ürün detaylarını sesli ve görsel olarak kullanıcılara aktarmak hedeflenmektedir. Uygulama Türkiye'nin Erzurum ilinde bulunan bir markette yapılmıştır. Veri kümesi söz konusu marketten alınan 14 farklı kategoriye ait toplam 2222 adet görüntüden oluşmaktadır. Bu görüntüler kullanılarak veri artırma işlemi yapılmış ve sonuç olarak toplam 4585 adet görüntü YOLOv8, EfficientDet D7TF2 ve YOLOv5 modellerinin eğitilmesi ile sınıflandırılmıştır. Yapılan deneyler sonucunda en yüksek performansı YOLOv8 modelinin gösterdiği saptanmıştır. YOLOv8 modeline ait doğruluk, hassasiyet, duyarlılık ve F1 skor oranları sırasıyla %92,8, %98,6, %95 ve %96,8 olarak bulunmuştur.","PeriodicalId":508079,"journal":{"name":"Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi","volume":" 37","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2024-07-17","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Görme yetersizliği olan bireyler için derin öğrenme tabanlı ürün sınıflandırma sistemi\",\"authors\":\"Fatma Betül Keskin, Nursena Bayğın, Işıl Karabey Aksakallı, Özlem Çomaklı Sökmen\",\"doi\":\"10.28948/ngumuh.1375785\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Görme yetersizliğine sahip bireylerin hayatını kolaylaştırmak ve diğer bireylere bağımlılıklarını en aza indirmek amacıyla market raflarının ve ürünlerin sınıflandırılması önem arz etmektedir. Ürünlerin sınıflandırılması ve ürün raflarının tanıtılması için çeşitli görüntü işleme yöntemleri halihazırda kullanılmaktadır. Yapılan araştırmalar doğrultusunda market raflarının ve ürünlerin sınıflandırılması için çoğunlukla geleneksel yöntemlerin kullanıldığı görülmektedir. Bu çalışmada market raflarındaki ürünler geleneksel görüntü işleme yöntemlerinden farklı olarak yüksek doğruluk ve hızda sonuç verebilen derin yapay sinir ağları kullanılarak sınıflandırılmıştır. Ayrıca bu çalışmada, görme bozukluğuna sahip bireylere kolaylık sağlaması açısından gündelik hayatta kullanılan akıllı cihazlara yüklenebilen ve tüm mobil işletim sistemlerini destekleyen flutter altyapısı kullanılmıştır. Bu sayede tüm mobil platformlarda ürün detaylarını sesli ve görsel olarak kullanıcılara aktarmak hedeflenmektedir. Uygulama Türkiye'nin Erzurum ilinde bulunan bir markette yapılmıştır. Veri kümesi söz konusu marketten alınan 14 farklı kategoriye ait toplam 2222 adet görüntüden oluşmaktadır. Bu görüntüler kullanılarak veri artırma işlemi yapılmış ve sonuç olarak toplam 4585 adet görüntü YOLOv8, EfficientDet D7TF2 ve YOLOv5 modellerinin eğitilmesi ile sınıflandırılmıştır. Yapılan deneyler sonucunda en yüksek performansı YOLOv8 modelinin gösterdiği saptanmıştır. YOLOv8 modeline ait doğruluk, hassasiyet, duyarlılık ve F1 skor oranları sırasıyla %92,8, %98,6, %95 ve %96,8 olarak bulunmuştur.\",\"PeriodicalId\":508079,\"journal\":{\"name\":\"Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi\",\"volume\":\" 37\",\"pages\":\"\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2024-07-17\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.28948/ngumuh.1375785\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Ömer Halisdemir Üniversitesi Mühendislik Bilimleri Dergisi","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.28948/ngumuh.1375785","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

为了方便视障人士的生活,减少他们对其他人的依赖,对货架和产品进行分类非常重要。目前有多种图像处理方法可用于产品分类和产品货架介绍。研究表明,市场货架和产品分类大多采用传统方法。在本研究中,与传统的图像处理方法不同的是,超市货架上的产品是通过深度人工神经网络进行分类的,这种方法可以提供高精度和快速的结果。此外,为了方便视障人士,本研究还使用了可安装在日常生活中使用的智能设备上、支持所有移动操作系统的 flutter 基础设施。这样,就可以在所有移动平台上通过声音和视觉向用户传达产品的详细信息。该应用是在土耳其埃尔祖鲁姆省的一家超市进行的。数据集由市场中 14 个不同类别共 2222 张图片组成。利用这些图像进行了数据扩增,通过训练 YOLOv8、EfficientDet D7TF2 和 YOLOv5 模型,共对 4585 张图像进行了分类。实验结果表明,YOLOv8 模型的性能最高。YOLOv8 模型的准确率、精确度、灵敏度和 F1 分数分别为 92.8%、98.6%、95% 和 96.8%。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Görme yetersizliği olan bireyler için derin öğrenme tabanlı ürün sınıflandırma sistemi
Görme yetersizliğine sahip bireylerin hayatını kolaylaştırmak ve diğer bireylere bağımlılıklarını en aza indirmek amacıyla market raflarının ve ürünlerin sınıflandırılması önem arz etmektedir. Ürünlerin sınıflandırılması ve ürün raflarının tanıtılması için çeşitli görüntü işleme yöntemleri halihazırda kullanılmaktadır. Yapılan araştırmalar doğrultusunda market raflarının ve ürünlerin sınıflandırılması için çoğunlukla geleneksel yöntemlerin kullanıldığı görülmektedir. Bu çalışmada market raflarındaki ürünler geleneksel görüntü işleme yöntemlerinden farklı olarak yüksek doğruluk ve hızda sonuç verebilen derin yapay sinir ağları kullanılarak sınıflandırılmıştır. Ayrıca bu çalışmada, görme bozukluğuna sahip bireylere kolaylık sağlaması açısından gündelik hayatta kullanılan akıllı cihazlara yüklenebilen ve tüm mobil işletim sistemlerini destekleyen flutter altyapısı kullanılmıştır. Bu sayede tüm mobil platformlarda ürün detaylarını sesli ve görsel olarak kullanıcılara aktarmak hedeflenmektedir. Uygulama Türkiye'nin Erzurum ilinde bulunan bir markette yapılmıştır. Veri kümesi söz konusu marketten alınan 14 farklı kategoriye ait toplam 2222 adet görüntüden oluşmaktadır. Bu görüntüler kullanılarak veri artırma işlemi yapılmış ve sonuç olarak toplam 4585 adet görüntü YOLOv8, EfficientDet D7TF2 ve YOLOv5 modellerinin eğitilmesi ile sınıflandırılmıştır. Yapılan deneyler sonucunda en yüksek performansı YOLOv8 modelinin gösterdiği saptanmıştır. YOLOv8 modeline ait doğruluk, hassasiyet, duyarlılık ve F1 skor oranları sırasıyla %92,8, %98,6, %95 ve %96,8 olarak bulunmuştur.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信