{"title":"Instance Segmentation based on YOLO model for Multiple Classes of Ground Objects using UAV Images and Digital Topographic Map","authors":"June Seok Kim, Il Young Hong","doi":"10.7848/ksgpc.2023.41.4.205","DOIUrl":null,"url":null,"abstract":"지금까지 항공영상을 활용한 공간 객체에 대한 탐지는 대부분 물류, 운송 수단에 대한 객체 탐지 및 도로, 건물의 시맨틱 분할이 주를 이루었다. 본 연구에서는 지상 객체의 다중 클래스에 대한 객체 탐지 및 인스턴스 분할을 목적으로 한다. 이를 위해 YOLO (You Only Look Once) v8 모델을 이용하였고, UAV (Unmanned Aerial Vehicle)로 촬영한 고해상도 이미지를 사용하였다. 학습데이터는 과속방지턱, 횡단보도, 태양광 패널과 같은 일정한 패턴을 갖고 있는 객체 유형1과 건물같이 일정한 패턴을 갖고 있지 않은 객체 유형2로 나누었으며 국토지리정보원에서 제작하는 수치지형도 V2.0 데이터를 활용하여 학습데이터를 구축하였다. 학습 후 유형별 전체 클래스에 대한 mAP (mean Average Precision)는 객체 유형1은 0.993, 유형2는 0.881로 좋은 성능을 보였다. 예측에는 총 5가지 데이터를 사용하여 학습된 모델의 예측 정확도가 데이터의 축척의 변화, 공간해상도의 변화에 따라서 어떻게 변화하는지 분석하였다. 분석 결과 축척이 100%일 때는 객체를 탐지 못하거나 예측 확률이 50%로 낮았던것이 축척이 125%로 확대될 때 예측확률은 90% 이상으로 올라갔으며 또한 공간해상도가 25cm로 낮아지는 경우에는 일부 객체를 탐지 못하거나 실제값과 맞지 않는 잘못된 예측 및 분활이 되었다.","PeriodicalId":39099,"journal":{"name":"Journal of the Korean Society of Surveying Geodesy Photogrammetry and Cartography","volume":"83 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-08-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of the Korean Society of Surveying Geodesy Photogrammetry and Cartography","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.7848/ksgpc.2023.41.4.205","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"Q3","JCRName":"Earth and Planetary Sciences","Score":null,"Total":0}
引用次数: 0
Abstract
지금까지 항공영상을 활용한 공간 객체에 대한 탐지는 대부분 물류, 운송 수단에 대한 객체 탐지 및 도로, 건물의 시맨틱 분할이 주를 이루었다. 본 연구에서는 지상 객체의 다중 클래스에 대한 객체 탐지 및 인스턴스 분할을 목적으로 한다. 이를 위해 YOLO (You Only Look Once) v8 모델을 이용하였고, UAV (Unmanned Aerial Vehicle)로 촬영한 고해상도 이미지를 사용하였다. 학습데이터는 과속방지턱, 횡단보도, 태양광 패널과 같은 일정한 패턴을 갖고 있는 객체 유형1과 건물같이 일정한 패턴을 갖고 있지 않은 객체 유형2로 나누었으며 국토지리정보원에서 제작하는 수치지형도 V2.0 데이터를 활용하여 학습데이터를 구축하였다. 학습 후 유형별 전체 클래스에 대한 mAP (mean Average Precision)는 객체 유형1은 0.993, 유형2는 0.881로 좋은 성능을 보였다. 예측에는 총 5가지 데이터를 사용하여 학습된 모델의 예측 정확도가 데이터의 축척의 변화, 공간해상도의 변화에 따라서 어떻게 변화하는지 분석하였다. 분석 결과 축척이 100%일 때는 객체를 탐지 못하거나 예측 확률이 50%로 낮았던것이 축척이 125%로 확대될 때 예측확률은 90% 이상으로 올라갔으며 또한 공간해상도가 25cm로 낮아지는 경우에는 일부 객체를 탐지 못하거나 실제값과 맞지 않는 잘못된 예측 및 분활이 되었다.