Classification of Irregularity Communications in Public Ombudsmen Using Supervised Learning Algorithms

Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2022) Pub Date : 2022-11-28 DOI:10.5753/eniac.2022.227178

Fábio Cordeiro, R. A. L. Rabelo, R. Moura

引用次数: 1

Abstract

O objetivo deste trabalho é avaliar modelos de Aprendizado de Máquina (AM) na tarefa de classificação de comunicados de irregularidades em Ouvidorias Públicas de Tribunais de Contas. De maneira geral, pretendese contribuir de forma efetiva para melhorar a triagem desses comunicados, possibilitando maior celeridade na resposta ao cidadão. Devido ao desbalanceamento do dataset original, foram aplicadas técnicas de redimensionamento de dados antes da etapa de treinamento dos modelos. Algoritmos clássicos de Machine Learning (Naive Bayes, Decision Tree, Random Forest, K Nearest Neighbor e Support Vector Machine) foram comparados com o modelo de Deep Learning Bidirectional Encoder Representations from Transformers (BERT) e variações de representação dos textos com Word Embeddings. Os melhores resultados foram obtidos pelo modelo BERT com o dataset redimensionado, atingindo 96% na métrica F1-Score.

查看原文本刊更多论文

基于监督学习算法的公共监察员不规范通信分类

这项工作的目的是评估机器学习模型(AM)在分类任务中的违规报告在审计法院的公共监察员。总的来说，我们的目标是有效地改善这些通信的分类，使公民能够更快地作出反应。由于原始数据集的不平衡，在模型训练步骤之前应用了数据调整技术。将经典的机器学习算法(朴素贝叶斯、决策树、随机森林、K近邻和支持向量机)与深度学习模型变换双向编码器表示(BERT)和文字嵌入文本表示的变化进行了比较。在调整数据集的BERT模型中获得了最好的结果，在F1评分指标中达到了96%。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

求助全文

约1分钟内获得全文求助全文

来源期刊

Anais do XIX Encontro Nacional de Inteligência Artificial e Computacional (ENIAC 2022)

自引率

0.00%

发文量