qFEx -一个在HTML文档中搜索和提取调查问卷的爬虫

Anais do III Dataset Showcase Workshop (DSW 2021) Pub Date : 2017-11-06 DOI:10.5753/dsw.2021.17409

Gilney Nathanael Mathias, C. Dorneles

{"title":"qFEx -一个在HTML文档中搜索和提取调查问卷的爬虫","authors":"Gilney Nathanael Mathias, C. Dorneles","doi":"10.5753/dsw.2021.17409","DOIUrl":null,"url":null,"abstract":"Questionários de pesquisa podem ser utilizados por empresas ou instituições para avaliar itens ou produtos, mediar a satisfação de seus funcionários/clientes, ou serem utilizados por pesquisadores para coleta de dados que podem ser usados em estudos. Alguns problemas na criação de tais questionários envolvem: decidir quais perguntas fazer, como fazê-las e como organizá-las. Visando isso, este trabalho propõe a criação de um Web Crawler, que varre a Web em busca de sites que possivelmente contenham questionários, e de um Extrator, capaz de extrair os questionários da lista de páginas coletadas pelo crawler e salvá-las em um banco de dados relacional. A base de dados criada pode depois, servir para a análise desses dados e/ou como uma base centralizada de exemplos para a elaboração de novos questionários ou ainda para o reuso de questões existentes. Alguns experimentos são apresentados para demonstrar a correta coleta de questionários pelo crawler, e a posterior extração das questões presentes nos questionários.","PeriodicalId":314975,"journal":{"name":"Anais do III Dataset Showcase Workshop (DSW 2021)","volume":"24 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2017-11-06","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"qFEx - um crawler para busca e extração de questionários de pesquisa em documentos HTML\",\"authors\":\"Gilney Nathanael Mathias, C. Dorneles\",\"doi\":\"10.5753/dsw.2021.17409\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"Questionários de pesquisa podem ser utilizados por empresas ou instituições para avaliar itens ou produtos, mediar a satisfação de seus funcionários/clientes, ou serem utilizados por pesquisadores para coleta de dados que podem ser usados em estudos. Alguns problemas na criação de tais questionários envolvem: decidir quais perguntas fazer, como fazê-las e como organizá-las. Visando isso, este trabalho propõe a criação de um Web Crawler, que varre a Web em busca de sites que possivelmente contenham questionários, e de um Extrator, capaz de extrair os questionários da lista de páginas coletadas pelo crawler e salvá-las em um banco de dados relacional. A base de dados criada pode depois, servir para a análise desses dados e/ou como uma base centralizada de exemplos para a elaboração de novos questionários ou ainda para o reuso de questões existentes. Alguns experimentos são apresentados para demonstrar a correta coleta de questionários pelo crawler, e a posterior extração das questões presentes nos questionários.\",\"PeriodicalId\":314975,\"journal\":{\"name\":\"Anais do III Dataset Showcase Workshop (DSW 2021)\",\"volume\":\"24 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2017-11-06\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Anais do III Dataset Showcase Workshop (DSW 2021)\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5753/dsw.2021.17409\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Anais do III Dataset Showcase Workshop (DSW 2021)","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5753/dsw.2021.17409","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}

引用次数: 0

摘要

调查问卷可以被公司或机构用来评估项目或产品，调解其员工/客户的满意度，或被研究人员用来收集可用于研究的数据。制作这类问卷的一些问题包括:决定问什么问题，如何问问题，以及如何组织问题。针对这一目标，本文提出创建一个网络爬虫，扫描网络上可能包含问卷的网站，以及一个提取器，能够从爬虫收集的页面列表中提取问卷，并将它们保存在关系数据库中。然后，创建的数据库可以用于分析这些数据和/或作为一个集中的示例数据库，用于开发新的问卷或重用现有的问题。通过实验证明了爬虫正确收集问卷，并对问卷中出现的问题进行了提取。

本文章由计算机程序翻译，如有差异，请以英文原文为准。

查看原文本刊更多论文

qFEx - um crawler para busca e extração de questionários de pesquisa em documentos HTML

Questionários de pesquisa podem ser utilizados por empresas ou instituições para avaliar itens ou produtos, mediar a satisfação de seus funcionários/clientes, ou serem utilizados por pesquisadores para coleta de dados que podem ser usados em estudos. Alguns problemas na criação de tais questionários envolvem: decidir quais perguntas fazer, como fazê-las e como organizá-las. Visando isso, este trabalho propõe a criação de um Web Crawler, que varre a Web em busca de sites que possivelmente contenham questionários, e de um Extrator, capaz de extrair os questionários da lista de páginas coletadas pelo crawler e salvá-las em um banco de dados relacional. A base de dados criada pode depois, servir para a análise desses dados e/ou como uma base centralizada de exemplos para a elaboração de novos questionários ou ainda para o reuso de questões existentes. Alguns experimentos são apresentados para demonstrar a correta coleta de questionários pelo crawler, e a posterior extração das questões presentes nos questionários.

求助全文

通过发布文献求助，成功后即可免费获取论文全文。去求助

来源期刊

Anais do III Dataset Showcase Workshop (DSW 2021)

自引率

0.00%

发文量