{"title":"Sumarização de Denúncias: Proposta e Avaliação de Métodos de Geração de Resumos","authors":"E. Paiva, Fernando Sola Pereira, N. Ebecken","doi":"10.5753/wcge.2022.223020","DOIUrl":null,"url":null,"abstract":"O ordenamento jurídico brasileiro permite que qualquer cidadão faça denúncias sobre irregularidades que estejam acontecendo na Administração Pública. No entanto, o volume de informações presentes nos textos das denúncias torna o seu tratamento muito custoso. Dessa forma, surge a necessidade de métodos de sumarização capazes de resumir os textos das denúncias. O objetivo desse artigo é propor e avaliar duas estratégias de sumarização de denúncias: uma baseada no modelo de linguagem BERT e outra em frequência de palavras. O estudo concluiu que, para o propósito em questão, os resumos gerados pelo modelo BERT eram melhores que os gerados pela frequência de palavras.","PeriodicalId":442049,"journal":{"name":"Anais do X Workshop de Computação Aplicada em Governo Eletrônico (WCGE 2022)","volume":"43 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-07-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais do X Workshop de Computação Aplicada em Governo Eletrônico (WCGE 2022)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/wcge.2022.223020","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
O ordenamento jurídico brasileiro permite que qualquer cidadão faça denúncias sobre irregularidades que estejam acontecendo na Administração Pública. No entanto, o volume de informações presentes nos textos das denúncias torna o seu tratamento muito custoso. Dessa forma, surge a necessidade de métodos de sumarização capazes de resumir os textos das denúncias. O objetivo desse artigo é propor e avaliar duas estratégias de sumarização de denúncias: uma baseada no modelo de linguagem BERT e outra em frequência de palavras. O estudo concluiu que, para o propósito em questão, os resumos gerados pelo modelo BERT eram melhores que os gerados pela frequência de palavras.