Lanna Lima, Vasco Furtado, E. Furtado, V. Almeida, Thiago Silva
{"title":"Discrimination analysis of intelligent voice assistants","authors":"Lanna Lima, Vasco Furtado, E. Furtado, V. Almeida, Thiago Silva","doi":"10.1145/3357155.3358483","DOIUrl":null,"url":null,"abstract":"Assistentes de Voz Inteligentes (AVI) estão se tornando cada vez mais populares em todo o mundo, provendo fácil interação para realização de serviços e acessos a dispositivos. No entanto, o treinamento desses assistentes de voz pode estar limitado a falas padronizadas gerando o risco de desestimular a adoção desta tecnologia inclusiva por grupos com características de fala distintas da padrão. A eventual diferença de qualidade de desempenho dos assistentes em virtude das formas específicas da fala de diferentes grupos de pessoas nos países em desenvolvimento pode ser considerado um viés, bem como um fator que discriminará principalmente os grupos mais vulneráveis e, consequentemente, aumentará a lacuna digital nestes países. Neste trabalho, apresentamos um estudo de caso que analisa a presença de viés na interação por voz com os assistentes, ou seja, uma diferença na qualidade do desempenho dadas características específicas de fala dos usuários. Avaliamos o comportamento do Google Assistente e da Siri para grupos de pessoas distribuídas por gênero e região do país, avaliando duas características da linguagem: a cacoépia e a disfluência. Resultados preliminares indicam que a cacoépia e a disfluência estão relacionadas com a região de origem do falante e têm impacto no desempenho dos assistentes de voz.","PeriodicalId":237718,"journal":{"name":"Proceedings of the 18th Brazilian Symposium on Human Factors in Computing Systems","volume":"96 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2019-10-22","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"6","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Proceedings of the 18th Brazilian Symposium on Human Factors in Computing Systems","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.1145/3357155.3358483","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 6
Abstract
Assistentes de Voz Inteligentes (AVI) estão se tornando cada vez mais populares em todo o mundo, provendo fácil interação para realização de serviços e acessos a dispositivos. No entanto, o treinamento desses assistentes de voz pode estar limitado a falas padronizadas gerando o risco de desestimular a adoção desta tecnologia inclusiva por grupos com características de fala distintas da padrão. A eventual diferença de qualidade de desempenho dos assistentes em virtude das formas específicas da fala de diferentes grupos de pessoas nos países em desenvolvimento pode ser considerado um viés, bem como um fator que discriminará principalmente os grupos mais vulneráveis e, consequentemente, aumentará a lacuna digital nestes países. Neste trabalho, apresentamos um estudo de caso que analisa a presença de viés na interação por voz com os assistentes, ou seja, uma diferença na qualidade do desempenho dadas características específicas de fala dos usuários. Avaliamos o comportamento do Google Assistente e da Siri para grupos de pessoas distribuídas por gênero e região do país, avaliando duas características da linguagem: a cacoépia e a disfluência. Resultados preliminares indicam que a cacoépia e a disfluência estão relacionadas com a região de origem do falante e têm impacto no desempenho dos assistentes de voz.