ScaleSense: удосконалений метод автоматичного визначення масштабу лінійки на зображеннях для вирішення завдання оцінювання геометричних розмірів певних об'єктів

B. S. Lukashchuk
{"title":"ScaleSense: удосконалений метод автоматичного визначення масштабу лінійки на зображеннях для вирішення завдання оцінювання геометричних розмірів певних об'єктів","authors":"B. S. Lukashchuk","doi":"10.36930/40330313","DOIUrl":null,"url":null,"abstract":"Виявлення відповідності пікселів реальним одиницям на зображенні є важливим кроком для подальшого аналізу геометричних характеристик об'єктів. Запропоновано удосконалений ітераційний метод для автоматичного визначення масштабу лінійки на зображенні, який базується на розпізнаванні цифр. Розроблено та протестовано отримані результати на зображеннях із біомедичної сфери. Встановлено можливість застосування методу і до інших галузей, зокрема тих, які згадані у проаналізованих схожих дослідженнях – криміналістиці, ветеринарії, музейній справі тощо. Проаналізовано першу версію методу та встановлено і виправлено деякі важливі недоліки в його алгоритмах, що зокрема дало змогу ефективніше опрацьовувати зображення із лінійками, що містять двоцифрові числа. Навчено та інтегровано у метод нову версію моделі для розпізнавання цифр – YOLOv7, що дало змогу виправити проблеми із оберненими зображеннями. Збільшено кількість опрацьованих методом зображень до 90 %. Досліджено альтернативні методи групування тестових сегментів, що є фінальним кроком методу. Опрацьовано експериментальні дані при застосуванні різних методів групування (кластеризація DBSCAN (англ. Density-Based Spatial Clustering of Applications With Noise), медіана, модифікований z-критерій та міжквартильний розмах) та похибки, порівняно із вручну виміряними значеннями. Отримано медіану похибки 4,2-4,4 %, у разі використання медіани та кластеризації методом DBSCAN, а при окремих конфігураціях методу DBSCAN – 3,1-3,7 %. Розроблено вебсторінку з демонстраційною версією методу для залучення більшої кількості даних та практичного використання методу у вирішенні реальних завдань. Надано можливість вибору одного з чотирьох методів групування та їх параметрів (для DBSCAN) та зображення для тестування методу. Реалізовано візуалізацію випадкового тестового сегменту на завантаженому зображенні для зручнішого суб'єктивного оцінювання отриманого результату користувачем. Запропоновано: провести додаткове навчання моделей виявлення цифр; реалізувати підтримку опрацювання чисел, з будь-якою кількістю цифрових символів; врахувати деякі з підходів, використаних в аналогічних методах; реалізувати REST API для виклику методу.","PeriodicalId":33529,"journal":{"name":"Naukovii visnik NLTU Ukrayini","volume":" ","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-05-25","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Naukovii visnik NLTU Ukrayini","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.36930/40330313","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Виявлення відповідності пікселів реальним одиницям на зображенні є важливим кроком для подальшого аналізу геометричних характеристик об'єктів. Запропоновано удосконалений ітераційний метод для автоматичного визначення масштабу лінійки на зображенні, який базується на розпізнаванні цифр. Розроблено та протестовано отримані результати на зображеннях із біомедичної сфери. Встановлено можливість застосування методу і до інших галузей, зокрема тих, які згадані у проаналізованих схожих дослідженнях – криміналістиці, ветеринарії, музейній справі тощо. Проаналізовано першу версію методу та встановлено і виправлено деякі важливі недоліки в його алгоритмах, що зокрема дало змогу ефективніше опрацьовувати зображення із лінійками, що містять двоцифрові числа. Навчено та інтегровано у метод нову версію моделі для розпізнавання цифр – YOLOv7, що дало змогу виправити проблеми із оберненими зображеннями. Збільшено кількість опрацьованих методом зображень до 90 %. Досліджено альтернативні методи групування тестових сегментів, що є фінальним кроком методу. Опрацьовано експериментальні дані при застосуванні різних методів групування (кластеризація DBSCAN (англ. Density-Based Spatial Clustering of Applications With Noise), медіана, модифікований z-критерій та міжквартильний розмах) та похибки, порівняно із вручну виміряними значеннями. Отримано медіану похибки 4,2-4,4 %, у разі використання медіани та кластеризації методом DBSCAN, а при окремих конфігураціях методу DBSCAN – 3,1-3,7 %. Розроблено вебсторінку з демонстраційною версією методу для залучення більшої кількості даних та практичного використання методу у вирішенні реальних завдань. Надано можливість вибору одного з чотирьох методів групування та їх параметрів (для DBSCAN) та зображення для тестування методу. Реалізовано візуалізацію випадкового тестового сегменту на завантаженому зображенні для зручнішого суб'єктивного оцінювання отриманого результату користувачем. Запропоновано: провести додаткове навчання моделей виявлення цифр; реалізувати підтримку опрацювання чисел, з будь-якою кількістю цифрових символів; врахувати деякі з підходів, використаних в аналогічних методах; реалізувати REST API для виклику методу.
ScaleSense:一种改进的自动确定图像线条大小的方法,用于解决某些对象的几何测量任务
在图像上找到真实单位的像素是进一步分析物体几何特征的重要步骤。提出了一种改进的迭代方法,用于基于数字识别自动确定图像上线条的大小。已经开发并测试了从生物医学图像中获得的结果。可以将该方法应用于其他部门,包括所分析的类似研究中提到的部门:罪犯、兽医、博物馆等。分析了该方法的第一个版本,发现并纠正了其算法中的一些重要缺陷,使图像能够用二进制线进行更有效的处理。一个新版本的识别数字的模型被学习并集成到该方法中,即YOLOv7,它使您能够纠正图像的问题。将处理的图像数量增加到90%。对测试段分组的替代方法进行了研究,这是该方法的最后一步。实验数据已经使用不同的分组方法和误差进行了处理,与手动测量值相比。中位误差为4.2-4.4%。已经开发了一个网页,其中包含该方法的演示版本,用于涉及更多数据并实际使用该方法来解决实际任务。从四种分组方法中选择一种及其选项(对于DBSCAN)和一张图像来测试该方法。在加载的图像上可视化随机测试片段,以便对所获得的结果进行更用户友好的主观评估。建议:进一步了解数字检测模型;以及实现任意数字的数字支持;考虑到类似方法中使用的一些方法;实现REST API来挑战该方法。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
41
审稿时长
4 weeks
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信