F. C. Rocha, Ellen Souza, Douglas Vitório, N. F. D. Silva, A. C. P. L. F. D. Carvalho, Adriano L. I. Oliveira
{"title":"Avaliação de frameworks para Recuperação de Documentos Legislativos: um Estudo de Caso na Câmara dos Deputados Brasileira","authors":"F. C. Rocha, Ellen Souza, Douglas Vitório, N. F. D. Silva, A. C. P. L. F. D. Carvalho, Adriano L. I. Oliveira","doi":"10.5753/wcge.2023.229925","DOIUrl":null,"url":null,"abstract":"Este trabalho investiga frameworks de recuperação de informações para lidar com as dificuldades existentes no processo de elaboração de leis da Câmara dos Deputados do Brasil. Dois frameworks de código aberto foram escolhidos. Além disso, foram avaliadas diferentes técnicas de pré-processamento, incluindo stemmers e modelos de linguagem n-gram. Dois corpora legislativos da Câmara foram usados para construir e validar os experimentos. Os resultados foram comparados com um baseline utilizado pela Câmara dos Deputados. O baseline apresentou o melhor resultado, alcançando um Recall para 20 documentos de 0,7376.","PeriodicalId":108828,"journal":{"name":"Anais do XI Workshop de Computação Aplicada em Governo Eletrônico (WCGE 2023)","volume":"1 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-08-06","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais do XI Workshop de Computação Aplicada em Governo Eletrônico (WCGE 2023)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/wcge.2023.229925","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
Este trabalho investiga frameworks de recuperação de informações para lidar com as dificuldades existentes no processo de elaboração de leis da Câmara dos Deputados do Brasil. Dois frameworks de código aberto foram escolhidos. Além disso, foram avaliadas diferentes técnicas de pré-processamento, incluindo stemmers e modelos de linguagem n-gram. Dois corpora legislativos da Câmara foram usados para construir e validar os experimentos. Os resultados foram comparados com um baseline utilizado pela Câmara dos Deputados. O baseline apresentou o melhor resultado, alcançando um Recall para 20 documentos de 0,7376.