Segmentacija telesa z uporabo večciljnega učenja

ROSUS 2022 - Računalniška obdelava slik in njena uporaba v Sloveniji 2022: Zbornik 16. strokovne konference Pub Date : 2022-03-09 DOI:10.18690/um.feri.7.2022.4

Julijan Jug, Ajda Lampe, Peter Peer, Vitomir Štruc

{"title":"Segmentacija telesa z uporabo večciljnega učenja","authors":"Julijan Jug, Ajda Lampe, Peter Peer, Vitomir Štruc","doi":"10.18690/um.feri.7.2022.4","DOIUrl":null,"url":null,"abstract":"Segmentacija je pomemben del številnih problemov računalniškega vida, ki vključujejo človeške podobe, in je ena ključnih komponent, ki vpliva na uspešnost vseh nadaljnjih nalog. Več predhodnih del je ta problem obravnavalo z uporabo večciljnega modela, ki izkorišča korelacije med različnimi nalogami za izboljšanje uspešnosti segmentacije. Na podlagi uspešnosti takšnih rešitev v tem prispevku predstavljamo nov večciljni model za segmentacijo/razčlenjevanje ljudi, ki vključuje tri naloge, tj. (i) napoved skeletnih točk, (ii) napoved globinske predstavitve poze in (iii ) segmentacijo človeškega telesa. Glavna ideja predlaganega modela Segmentacija-Skelet-Globinska predstavitev (ali na kratko iz angleščine SPD) je naučiti se boljšega modela segmentacije z izmenjavo znanja med različnimi, a med seboj povezanimi nalogami. SPD temelji na skupni hrbtenici globoke nevronske mreže, ki se razcepi na tri glave modela, specifične za nalogo, in se uči z uporabo cilja optimizacije za več nalog. Učinkovitost modela je analizirana s strogimi eksperimenti na nizih podatkov LIP in ATR ter v primerjavi z nedavnim (najsodobnejšim) večciljnim modelom segmentacije telesa. Predstavljene so tudi študije ablacije. Naši eksperimentalni rezultati kažejo, da je predlagani večciljni (segmentacijski) model zelo konkurenčen in da uvedba dodatnih nalog prispeva k večji skupni uspešnosti segmentacije.","PeriodicalId":164879,"journal":{"name":"ROSUS 2022 - Računalniška obdelava slik in njena uporaba v Sloveniji 2022: Zbornik 16. strokovne konference","volume":"33 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-03-09","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"ROSUS 2022 - Računalniška obdelava slik in njena uporaba v Sloveniji 2022: Zbornik 16. strokovne konference","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.18690/um.feri.7.2022.4","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

Abstract

Segmentacija je pomemben del številnih problemov računalniškega vida, ki vključujejo človeške podobe, in je ena ključnih komponent, ki vpliva na uspešnost vseh nadaljnjih nalog. Več predhodnih del je ta problem obravnavalo z uporabo večciljnega modela, ki izkorišča korelacije med različnimi nalogami za izboljšanje uspešnosti segmentacije. Na podlagi uspešnosti takšnih rešitev v tem prispevku predstavljamo nov večciljni model za segmentacijo/razčlenjevanje ljudi, ki vključuje tri naloge, tj. (i) napoved skeletnih točk, (ii) napoved globinske predstavitve poze in (iii ) segmentacijo človeškega telesa. Glavna ideja predlaganega modela Segmentacija-Skelet-Globinska predstavitev (ali na kratko iz angleščine SPD) je naučiti se boljšega modela segmentacije z izmenjavo znanja med različnimi, a med seboj povezanimi nalogami. SPD temelji na skupni hrbtenici globoke nevronske mreže, ki se razcepi na tri glave modela, specifične za nalogo, in se uči z uporabo cilja optimizacije za več nalog. Učinkovitost modela je analizirana s strogimi eksperimenti na nizih podatkov LIP in ATR ter v primerjavi z nedavnim (najsodobnejšim) večciljnim modelom segmentacije telesa. Predstavljene so tudi študije ablacije. Naši eksperimentalni rezultati kažejo, da je predlagani večciljni (segmentacijski) model zelo konkurenčen in da uvedba dodatnih nalog prispeva k večji skupni uspešnosti segmentacije.

查看原文本刊更多论文

分割是许多涉及人类图像的计算机视觉问题的重要组成部分，也是影响所有后续任务性能的关键要素之一。之前有几项研究利用多目标模型解决了这一问题，该模型利用不同任务之间的相关性来提高分割性能。基于此类解决方案的性能，我们在本文中提出了一种用于人体分割/分解的新型多目标模型，其中包括三个任务，即 (i) 骨架点预测、(ii) 姿势深度表示预测和 (iii) 人体分割。所提出的分割-骨架-深度表示（英文简称 SPD）模型的主要思想是通过在不同但相互关联的任务之间交换知识来学习更好的分割模型。SPD 基于一个通用的深度神经网络骨架，该骨架分为三个特定任务模型头，并使用多任务优化目标进行学习。通过对 LIP 和 ATR 数据集的严格实验，分析了该模型的性能，并将其与最新的（最先进的）多目标身体分割模型进行了比较。此外，还介绍了消融研究。我们的实验结果表明，所提出的多目标（分割）模型非常具有竞争力，而且额外任务的引入有助于提高整体分割性能。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

ROSUS 2022 - Računalniška obdelava slik in njena uporaba v Sloveniji 2022: Zbornik 16. strokovne konference

自引率

0.00%

发文量