Anais do XIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2021)最新文献_第2页

Sentiment Analysis in Portuguese Texts from Online Health Community Forums: Data, Model and Evaluation 在线健康社区论坛葡萄牙语文本的情感分析:数据、模型和评估

Anais do XIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2021) Pub Date : 2021-11-29 DOI: 10.5753/stil.2021.17785

Yohan Bonescki Gumiel, Isabela Lee, Tayane A. Soares, Thiago Castro Ferreira, A. Pagano

引用次数: 3

Respostas emocionais da variação linguística: Análise exploratória de rastreio ocular 语言变异的情绪反应:眼扫描的探索性分析

Anais do XIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2021) Pub Date : 2021-11-29 DOI: 10.5753/stil.2021.17820

Raquel Meister Ko. Freitag, Julian Tejada, René Alain Santana de Almeida, Paloma Batista Cardoso, V. Souza, Vanesca Carvalho Leal

引用次数: 0

Avaliação de parsers na detecção de relações essenciais do modelo Universal Dependencies para o português 解析器在检测葡萄牙语通用依赖模型的基本关系中的评价

Anais do XIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2021) Pub Date : 2021-11-29 DOI: 10.5753/stil.2021.17826

Luana Balador Belisário, T. Pardo

引用次数: 0

Classificação multimodal para detecção de produtos proibidos em uma plataforma marketplace 在市场平台上检测违禁产品的多模式分类

Anais do XIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2021) Pub Date : 2021-11-29 DOI: 10.5753/stil.2021.17790

Alan da Silva Romualdo, Livy Real, Helena de Medeiros Caseli

引用次数: 1

Descrição de uma metodologia desenvolvida para revisão de um léxico de palavras de emoção 描述一种为修订情感词汇词典而开发的方法

Anais do XIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2021) Pub Date : 2021-11-29 DOI: 10.5753/stil.2021.17819

Barbara C. Ramos

引用次数: 1

Porttinari - a Large Multi-genre Treebank for Brazilian Portuguese Porttinari -巴西葡萄牙人的大型多流派树库

Anais do XIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2021) Pub Date : 2021-11-29 DOI: 10.5753/stil.2021.17778

T. Pardo, M. Duran, Lucelene Lopes, Ariani Di Felippo, N. T. Roman, M. G. V. Nunes

引用次数: 13

Ferramenta linguístico-computacional como facilitadora para o ensino de gramática na escola

Anais do XIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2021) Pub Date : 2021-11-29 DOI: 10.5753/stil.2021.17824

Lívia Vicente Dutra, Natália Sathler Sigiliano

引用次数: 0

Evaluation of Synthetic Datasets Generation for Intent Classification Tasks in Portuguese 葡萄牙语意图分类任务合成数据集生成的评价

Anais do XIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2021) Pub Date : 2021-11-29 DOI: 10.5753/stil.2021.17806

Robson T. Paula, Décio G. Aguiar Neto, David Romero, Paulo T. Guerra

{"title":"Evaluation of Synthetic Datasets Generation for Intent Classification Tasks in Portuguese","authors":"Robson T. Paula, Décio G. Aguiar Neto, David Romero, Paulo T. Guerra","doi":"10.5753/stil.2021.17806","DOIUrl":"https://doi.org/10.5753/stil.2021.17806","url":null,"abstract":"A chatbot is an artificial intelligence based system aimed at chatting with users, commonly used as a virtual assistant to help people or answer questions. Intent classification is an essential task for chatbots where it aims to identify what the user wants in a certain dialogue. However, for many domains, little data are available to properly train those systems. In this work, we evaluate the performance of two methods to generate synthetic data for chatbots, one based on template questions and another based on neural text generation. We build four datasets that are used training chatbot components in the intent classification task. We intend to simulate the task of migrating a search-based portal to an interactive dialogue-based information service by using artificial datasets for initial model training. Our results show that template-based datasets are slightly superior to those neural-based generated in our application domain, however, neural-generated present good results and they are a viable option when one has limited access to domain experts to hand-code text templates.","PeriodicalId":194867,"journal":{"name":"Anais do XIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2021)","volume":"38 1","pages":"0"},"PeriodicalIF":0.0,"publicationDate":"2021-11-29","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":null,"resultStr":null,"platform":"Semanticscholar","paperid":"134556559","PeriodicalName":null,"FirstCategoryId":null,"ListUrlMain":null,"RegionNum":0,"RegionCategory":"","ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":"","EPubDate":null,"PubModel":null,"JCR":null,"JCRName":null,"Score":null,"Total":0}

引用次数: 0

Relation extraction in structured and unstructured data: a comparative investigation on smartphone titles in the e-commerce domain 结构化和非结构化数据中的关系提取:电子商务领域智能手机标题的比较调查

Anais do XIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2021) Pub Date : 2021-11-29 DOI: 10.5753/stil.2021.17789

João Gabriel Melo Barbirato, Livy Real, Helena de Medeiros Caseli

引用次数: 0

A propósito do verbo falar no português brasileiro: uma análise em corpus e em bases de dados verbais 关于巴西葡萄牙语动词talk:语料库和动词数据库的分析

Anais do XIII Simpósio Brasileiro de Tecnologia da Informação e da Linguagem Humana (STIL 2021) Pub Date : 2021-11-29 DOI: 10.5753/stil.2021.17811

Isaac Souza de Miranda Junior, Marcela Monteiro Lemos Couto, Francimeire Leme Coelho, Roana Rodrigues, Oto Vale

引用次数: 0