通过机器学习技术支持的评论对教育视频进行自动分类:使用Youtube的实验分析

Henrique Carlos Fonte Boa Carvalho, F. Dorça, C. Pitangui, L. Assis, Alessandro Vivas Andrade, Eduardo Augusto Costa Trindade
{"title":"通过机器学习技术支持的评论对教育视频进行自动分类:使用Youtube的实验分析","authors":"Henrique Carlos Fonte Boa Carvalho, F. Dorça, C. Pitangui, L. Assis, Alessandro Vivas Andrade, Eduardo Augusto Costa Trindade","doi":"10.5753/rbie.2022.2455","DOIUrl":null,"url":null,"abstract":"O avanço tecnológico permite que novos conteúdos sejam criados e disponibilizados via Web a cada minuto, propiciando grande avanço em diversas áreas. Entretanto, essa disponibilidade também aponta desvantagens no âmbito Educacional. Destaca-se que o excesso de materiais ofertados dificultam o processo de ensino-aprendizagem devido ao demasiado tempo utilizado em busca de conteúdos que atendam às necessidades dos usuários. Nesse sentido, novos métodos para identificar conteúdos educacionais, em vídeos, por exemplo, precisam ser desenvolvidos. Percebe-se, sob essa perspectiva, diferenças significativas nos comentários fornecidos por usuários em vídeos educacionais, indicando assim, potencial para que estes sejam utilizados para a seleção de vídeos educativos. Neste contexto, esse trabalho realiza a análise e coleta de comentários de 500 vídeos da plataforma Youtube, sendo 250 educacionais e 250 não educacionais, e utiliza técnicas de Mineração de Textos e Aprendizado de Máquina para desenvolver um modelo de classificação que, baseado nos vocábulos mais frequentes dos comentários dos vídeos, os categorize em educacionais ou não educacionais. Com isto, provê-se um mecanismo que filtra os vídeos de acordo com a sua classe e retorna ao usuário apenas vídeos de conteúdo educacional. Resultados obtidos demonstram que é possível categorizar vídeos educacionais e não educacionais com acurácia de até 91,30%, ao se utilizar o classificador Random Forest. Ademais, devido aos resultados promissores, desenvolveu-se a API SysVidEduc, que utiliza os comentários dos usuários nos vídeos do Youtube e os classifica automaticamente em educacionais ou não educacionais.","PeriodicalId":383295,"journal":{"name":"Revista Brasileira de Informática na Educação","volume":"33 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2022-09-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Classificação automática de vídeos educacionais por meio de comentários apoiada por técnicas de Aprendizado de Máquina: uma análise experimental utilizando o Youtube\",\"authors\":\"Henrique Carlos Fonte Boa Carvalho, F. Dorça, C. Pitangui, L. Assis, Alessandro Vivas Andrade, Eduardo Augusto Costa Trindade\",\"doi\":\"10.5753/rbie.2022.2455\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"O avanço tecnológico permite que novos conteúdos sejam criados e disponibilizados via Web a cada minuto, propiciando grande avanço em diversas áreas. Entretanto, essa disponibilidade também aponta desvantagens no âmbito Educacional. Destaca-se que o excesso de materiais ofertados dificultam o processo de ensino-aprendizagem devido ao demasiado tempo utilizado em busca de conteúdos que atendam às necessidades dos usuários. Nesse sentido, novos métodos para identificar conteúdos educacionais, em vídeos, por exemplo, precisam ser desenvolvidos. Percebe-se, sob essa perspectiva, diferenças significativas nos comentários fornecidos por usuários em vídeos educacionais, indicando assim, potencial para que estes sejam utilizados para a seleção de vídeos educativos. Neste contexto, esse trabalho realiza a análise e coleta de comentários de 500 vídeos da plataforma Youtube, sendo 250 educacionais e 250 não educacionais, e utiliza técnicas de Mineração de Textos e Aprendizado de Máquina para desenvolver um modelo de classificação que, baseado nos vocábulos mais frequentes dos comentários dos vídeos, os categorize em educacionais ou não educacionais. Com isto, provê-se um mecanismo que filtra os vídeos de acordo com a sua classe e retorna ao usuário apenas vídeos de conteúdo educacional. Resultados obtidos demonstram que é possível categorizar vídeos educacionais e não educacionais com acurácia de até 91,30%, ao se utilizar o classificador Random Forest. Ademais, devido aos resultados promissores, desenvolveu-se a API SysVidEduc, que utiliza os comentários dos usuários nos vídeos do Youtube e os classifica automaticamente em educacionais ou não educacionais.\",\"PeriodicalId\":383295,\"journal\":{\"name\":\"Revista Brasileira de Informática na Educação\",\"volume\":\"33 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2022-09-30\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Revista Brasileira de Informática na Educação\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5753/rbie.2022.2455\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Revista Brasileira de Informática na Educação","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/rbie.2022.2455","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

技术的进步使得每分钟都有新的内容被创造出来,并通过网络提供,在几个领域提供了巨大的进步。然而,这种可用性也指出了教育方面的缺点。值得注意的是,由于花费了太多的时间来寻找满足用户需求的内容,过多的材料阻碍了教学过程。从这个意义上说,需要开发识别教育内容的新方法,例如视频。从这个角度可以看出,用户在教育视频中提供的评论存在显著差异,表明这些评论有可能被用于教育视频的选择。在这样的环境下,工作进行分析,收集了500个视频的Youtube平台和教育教育250和250,并使用文本挖掘技术和机器学习开发了一个分类模型,基于视频的分类的词汇频繁评论教育在教育或不。因此,它提供了一种机制,根据视频的类别过滤视频,并只返回给用户教育内容的视频。结果表明,使用随机森林分类器可以对教育视频和非教育视频进行分类,准确率高达91.30%。此外,由于有希望的结果,SysVidEduc API被开发出来,它使用用户对Youtube视频的评论,并自动将它们分类为教育或非教育。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Classificação automática de vídeos educacionais por meio de comentários apoiada por técnicas de Aprendizado de Máquina: uma análise experimental utilizando o Youtube
O avanço tecnológico permite que novos conteúdos sejam criados e disponibilizados via Web a cada minuto, propiciando grande avanço em diversas áreas. Entretanto, essa disponibilidade também aponta desvantagens no âmbito Educacional. Destaca-se que o excesso de materiais ofertados dificultam o processo de ensino-aprendizagem devido ao demasiado tempo utilizado em busca de conteúdos que atendam às necessidades dos usuários. Nesse sentido, novos métodos para identificar conteúdos educacionais, em vídeos, por exemplo, precisam ser desenvolvidos. Percebe-se, sob essa perspectiva, diferenças significativas nos comentários fornecidos por usuários em vídeos educacionais, indicando assim, potencial para que estes sejam utilizados para a seleção de vídeos educativos. Neste contexto, esse trabalho realiza a análise e coleta de comentários de 500 vídeos da plataforma Youtube, sendo 250 educacionais e 250 não educacionais, e utiliza técnicas de Mineração de Textos e Aprendizado de Máquina para desenvolver um modelo de classificação que, baseado nos vocábulos mais frequentes dos comentários dos vídeos, os categorize em educacionais ou não educacionais. Com isto, provê-se um mecanismo que filtra os vídeos de acordo com a sua classe e retorna ao usuário apenas vídeos de conteúdo educacional. Resultados obtidos demonstram que é possível categorizar vídeos educacionais e não educacionais com acurácia de até 91,30%, ao se utilizar o classificador Random Forest. Ademais, devido aos resultados promissores, desenvolveu-se a API SysVidEduc, que utiliza os comentários dos usuários nos vídeos do Youtube e os classifica automaticamente em educacionais ou não educacionais.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信