Unstructured data analysis and visualization “Korean Journal of Industrial and Organizational Psychology(2010~2017)”

Insun Yi, Na, Eun Young
{"title":"Unstructured data analysis and visualization “Korean Journal of Industrial and Organizational Psychology(2010~2017)”","authors":"Insun Yi, Na, Eun Young","doi":"10.24230/KSIOP.31.2.201805.499","DOIUrl":null,"url":null,"abstract":"빅데이터가 보급되면서 비정형자료 분석기술에 관한 관심이 증가하고 있으며, 방대한 양의 학술 데이터에서 가치 있는 정보를 도출해 내는 연구들이 수행되고 있다. 대부분 대용량 텍스트를 인간이 수동적으로 분석하는 것은 시간과 노력이 많이 들고 어려우므로 이를 보완하기 위해 자동으로 분류해줄 수 있는 기술이 필요하다. 이에 본 연구는 2010년부터 2017년까지 발간한 ‘한국심리학회지: 산업 및 조직’ 논문의 주요어, 논문제목, 초록과 같은 비정형자료를 이용하여 분석하고 시각화하였다. 연구결과는 다음과 같다. 첫째, 주요어를 워드클라우드로 시각화한 결과 ‘조직몰입’이 빈번히 사용되었으며, 직무만족, 직무열의, 이직의도, 정서노동 순으로 나타났다. 둘째, 논문제목과 초록을 LDA 확률에 근거하여 자동으로 10개의 주제로 분류하였으며, 주제 8(조직/몰입/지각)이 가장 높았고, 주제 5(행동/관리/상사)는 가장 낮았다. 셋째, 주저자와 교신저자와의 관계는 6개의 큰 집단과 다수의 작은 집단으로 나타났으며, 집단 내의 유력자를 알 수 있었다. 본 연구에서는 방대한 양의 학술 데이터에서 보다 빠르고 쉽게 정보를 도출하여 제공함으로써 관련 연구자들이 또 다른 연구에 접근할 수 있도록 도움을 줄 수 있다는데 의의를 둔다.","PeriodicalId":154246,"journal":{"name":"The Korean Journal of Industrial and Organizational Psychology","volume":"os-31 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2018-05-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"The Korean Journal of Industrial and Organizational Psychology","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.24230/KSIOP.31.2.201805.499","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 1

Abstract

빅데이터가 보급되면서 비정형자료 분석기술에 관한 관심이 증가하고 있으며, 방대한 양의 학술 데이터에서 가치 있는 정보를 도출해 내는 연구들이 수행되고 있다. 대부분 대용량 텍스트를 인간이 수동적으로 분석하는 것은 시간과 노력이 많이 들고 어려우므로 이를 보완하기 위해 자동으로 분류해줄 수 있는 기술이 필요하다. 이에 본 연구는 2010년부터 2017년까지 발간한 ‘한국심리학회지: 산업 및 조직’ 논문의 주요어, 논문제목, 초록과 같은 비정형자료를 이용하여 분석하고 시각화하였다. 연구결과는 다음과 같다. 첫째, 주요어를 워드클라우드로 시각화한 결과 ‘조직몰입’이 빈번히 사용되었으며, 직무만족, 직무열의, 이직의도, 정서노동 순으로 나타났다. 둘째, 논문제목과 초록을 LDA 확률에 근거하여 자동으로 10개의 주제로 분류하였으며, 주제 8(조직/몰입/지각)이 가장 높았고, 주제 5(행동/관리/상사)는 가장 낮았다. 셋째, 주저자와 교신저자와의 관계는 6개의 큰 집단과 다수의 작은 집단으로 나타났으며, 집단 내의 유력자를 알 수 있었다. 본 연구에서는 방대한 양의 학술 데이터에서 보다 빠르고 쉽게 정보를 도출하여 제공함으로써 관련 연구자들이 또 다른 연구에 접근할 수 있도록 도움을 줄 수 있다는데 의의를 둔다.
非结构化数据分析与可视化“韩国产业与组织心理学杂志(2010~2017)”
随着大数据的普及,对非定型资料分析技术的关注也在增加,从庞大的学术数据中得出有价值的信息的研究也在进行中。人类被动地分析大部分大容量文本需要很多时间和努力,而且很困难,因此为了弥补这一缺陷,需要能够自动分类的技术。为此,本研究利用2010年至2017年发行的《韩国心理学会志:产业及组织》论文的主要语言、论文题目、摘要等非定型资料进行了分析和视觉化。研究结果表明:第一,主要词用word cloud视觉化的结果显示,“组织投入”频繁使用,其后依次为职务满足、职务热情、离职意图、情绪劳动。第二,根据LDA概率,论文题目和摘要自动分为10个主题,主题8(组织/投入/知觉)最高,主题5(行动/管理/上司)最低。第三,犹豫者和通信作者之间的关系分为6个大集团和多数小集团,可以看出集团内的有力人士。本研究的意义在于,通过从大量学术数据中更快、更容易地导出和提供信息,可以帮助相关研究者接触其他研究。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信