ANÁLISE DE DOMÍNIO DA PRODUÇÃO CIENTÍFICA SOBRE COLETA DE DADOS NO CONTEXTO DO INSTITUTE OF ELECTRICAL AND ELECTRONICS ENGINEERS

Fábio Mosso Moreira, Fernando de Assis Rodrigues, Ricardo César Gonçalves Sant’Ana
{"title":"ANÁLISE DE DOMÍNIO DA PRODUÇÃO CIENTÍFICA SOBRE COLETA DE DADOS NO CONTEXTO DO INSTITUTE OF ELECTRICAL AND ELECTRONICS ENGINEERS","authors":"Fábio Mosso Moreira, Fernando de Assis Rodrigues, Ricardo César Gonçalves Sant’Ana","doi":"10.18542/COMPLEXITAS.V3I1.6634","DOIUrl":null,"url":null,"abstract":"Este estudo teve como objetivo identificar pesquisas que versam sobre a temática de coleta de dados. Para tanto foi utilizada análise de domínio em publicações científicas, com a aplicação de uma análise de citações e cocitações de autores. A identificação dos representantes da temática de coleta de dados e a interlocução existente entre eles foi obtida a partir do processamento dos conjuntos de metadados sobre publicações em periódicos disponíveis da base de conhecimento IEEE Xplore(r) Digital Library. Como estratégia de busca, utilizou-se na interface de busca avançada os termos ‘Data Collecting’, ‘Data Collect’ e ‘Data Gathering’, concatenados pelo operador booleano ‘OU’. Foram recuperados dados sobre 2.278 publicações e a amostra foi delimitada aos artigos publicados em periódicos científicos, totalizando 281 publicações. Para cada artigo, foi coletado o conjunto de referências na forma de documento HTML. Sobre o conteúdo obtido foi aplicado um algoritmo para a conversão das referências de HTML para CSV e a serialização das referências para o padrão de estilo IEEE Editorial Style. Foram processadas 5.867 referências e identificados 8.267 autores, sendo descartadas 270 referências por estarem fora do padrão. Aplicou-se a Lei do Elitismo de Price para a delimitação do corpo de autores nas análises de citação e cocitação de autores, totalizando 91 autores, número este que foi arredondado para 94 para contabilizar mais 3 autores que possuíam o mesmo número de citação do 91º autor. Posteriormente, aplicou-se um algoritmo para a geração das matrizes i) citados e citantes e ii) de frequência absoluta de cocitação de autores. A partir destes dados, a identificação de informações sobre nacionalidade e associação institucional foram obtidas por processamento manual. Foram calculados os indicadores de rede social: i) Densidade da Rede, representando a intensidade de relacionamentos entre autores da rede e ii) Centralidade de Grau, representando o número de ligações incidentes em um autor. A análise dos dados resultou em uma Densidade de Rede no valor de 3,20% e desvio padrão amostral de 3,34%, ou seja, cada pesquisador têm aproximadamente 3% de fazer relacionamentos com pares da rede; e Centralidade de Grau no valor de 20,93%, demonstrando dispersão, com cada vértice possuindo 20,93% de probabilidade de receber alguma interação da rede. A dispersão está associada com a amplitude do domínio analisado, pois coleta de dados é um tema recorrente em diferentes áreas do conhecimento, mas aderente ao contexto de publicação dos periódicos da IEEE. Ao analisar a Centralidade de Grau dos autores individualmente, é possível observar uma relação com a quantidade de citações recebidas, uma vez que os 13 principais autores do indicador de Centralidade de Grau são também os mais citados. Conclui-se que a temática apesar de amplamente citada apresenta um núcleo estadunidense, ligado às instituições UC, USC e MIT.","PeriodicalId":101492,"journal":{"name":"Complexitas – Revista de Filosofia Temática","volume":"15 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2019-02-13","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Complexitas – Revista de Filosofia Temática","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.18542/COMPLEXITAS.V3I1.6634","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Este estudo teve como objetivo identificar pesquisas que versam sobre a temática de coleta de dados. Para tanto foi utilizada análise de domínio em publicações científicas, com a aplicação de uma análise de citações e cocitações de autores. A identificação dos representantes da temática de coleta de dados e a interlocução existente entre eles foi obtida a partir do processamento dos conjuntos de metadados sobre publicações em periódicos disponíveis da base de conhecimento IEEE Xplore(r) Digital Library. Como estratégia de busca, utilizou-se na interface de busca avançada os termos ‘Data Collecting’, ‘Data Collect’ e ‘Data Gathering’, concatenados pelo operador booleano ‘OU’. Foram recuperados dados sobre 2.278 publicações e a amostra foi delimitada aos artigos publicados em periódicos científicos, totalizando 281 publicações. Para cada artigo, foi coletado o conjunto de referências na forma de documento HTML. Sobre o conteúdo obtido foi aplicado um algoritmo para a conversão das referências de HTML para CSV e a serialização das referências para o padrão de estilo IEEE Editorial Style. Foram processadas 5.867 referências e identificados 8.267 autores, sendo descartadas 270 referências por estarem fora do padrão. Aplicou-se a Lei do Elitismo de Price para a delimitação do corpo de autores nas análises de citação e cocitação de autores, totalizando 91 autores, número este que foi arredondado para 94 para contabilizar mais 3 autores que possuíam o mesmo número de citação do 91º autor. Posteriormente, aplicou-se um algoritmo para a geração das matrizes i) citados e citantes e ii) de frequência absoluta de cocitação de autores. A partir destes dados, a identificação de informações sobre nacionalidade e associação institucional foram obtidas por processamento manual. Foram calculados os indicadores de rede social: i) Densidade da Rede, representando a intensidade de relacionamentos entre autores da rede e ii) Centralidade de Grau, representando o número de ligações incidentes em um autor. A análise dos dados resultou em uma Densidade de Rede no valor de 3,20% e desvio padrão amostral de 3,34%, ou seja, cada pesquisador têm aproximadamente 3% de fazer relacionamentos com pares da rede; e Centralidade de Grau no valor de 20,93%, demonstrando dispersão, com cada vértice possuindo 20,93% de probabilidade de receber alguma interação da rede. A dispersão está associada com a amplitude do domínio analisado, pois coleta de dados é um tema recorrente em diferentes áreas do conhecimento, mas aderente ao contexto de publicação dos periódicos da IEEE. Ao analisar a Centralidade de Grau dos autores individualmente, é possível observar uma relação com a quantidade de citações recebidas, uma vez que os 13 principais autores do indicador de Centralidade de Grau são também os mais citados. Conclui-se que a temática apesar de amplamente citada apresenta um núcleo estadunidense, ligado às instituições UC, USC e MIT.
电气电子工程师协会背景下的数据收集科学生产领域分析
本研究旨在确定与数据收集主题相关的研究。为此,我们在科学出版物中使用了领域分析,并应用了引文分析和作者引用。通过对IEEE Xplore(r)数字图书馆知识库中可用的期刊出版物元数据集的处理,确定了数据收集主题的代表及其之间的对话。作为搜索策略,在高级搜索界面中使用了术语“数据收集”、“数据收集”和“数据收集”,由布尔运算符“或”连接。检索了2278篇论文的数据,并将样本划分为发表在科学期刊上的论文,共计281篇。对于每一篇文章,引用集都以HTML文档的形式收集。在获得的内容上,应用了一种算法将HTML引用转换为CSV,并将引用序列化为IEEE编辑风格标准。我们处理了5867篇参考文献,确定了8267位作者,270篇参考文献因不符合标准而被丢弃。在对作者的引用和勾引进行分析时,应用普莱斯精英主义定律对作者群体进行了界定,总共91位作者,这个数字四舍五入到94位,以计算另外3位作者的引用数量与第91位作者相同。随后,应用算法生成矩阵i)被引用和被引用,ii)作者的绝对引文频率。从这些数据中,通过人工处理获得国籍和机构关联信息的识别。计算社会网络指标:i)网络密度,表示网络作者之间关系的强度;ii)程度中心性,表示作者中发生的联系数量。数据分析结果显示,网络密度为3.20%,样本标准差为3.34%,即每个研究人员与网络中的同行建立关系的比例约为3%;和度中心性为20.93%,显示离散性,每个顶点有20.93%的概率接收一些网络交互。这种分散与所分析领域的广度有关,因为数据收集是不同知识领域中反复出现的主题,但符合IEEE期刊出版的背景。当分析个别作者的程度中心性时,可以观察到与收到的被引数量的关系,因为程度中心性指标的前13位作者也是被引最多的。结论是,尽管这个主题被广泛引用,但它有一个美国核心,与加州大学、南加州大学和麻省理工学院有关。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信