{"title":"Unstructured data analysis and visualization “Korean Journal of Industrial and Organizational Psychology(2010~2017)”","authors":"Insun Yi, Na, Eun Young","doi":"10.24230/KSIOP.31.2.201805.499","DOIUrl":null,"url":null,"abstract":"빅데이터가 보급되면서 비정형자료 분석기술에 관한 관심이 증가하고 있으며, 방대한 양의 학술 데이터에서 가치 있는 정보를 도출해 내는 연구들이 수행되고 있다. 대부분 대용량 텍스트를 인간이 수동적으로 분석하는 것은 시간과 노력이 많이 들고 어려우므로 이를 보완하기 위해 자동으로 분류해줄 수 있는 기술이 필요하다. 이에 본 연구는 2010년부터 2017년까지 발간한 ‘한국심리학회지: 산업 및 조직’ 논문의 주요어, 논문제목, 초록과 같은 비정형자료를 이용하여 분석하고 시각화하였다. 연구결과는 다음과 같다. 첫째, 주요어를 워드클라우드로 시각화한 결과 ‘조직몰입’이 빈번히 사용되었으며, 직무만족, 직무열의, 이직의도, 정서노동 순으로 나타났다. 둘째, 논문제목과 초록을 LDA 확률에 근거하여 자동으로 10개의 주제로 분류하였으며, 주제 8(조직/몰입/지각)이 가장 높았고, 주제 5(행동/관리/상사)는 가장 낮았다. 셋째, 주저자와 교신저자와의 관계는 6개의 큰 집단과 다수의 작은 집단으로 나타났으며, 집단 내의 유력자를 알 수 있었다. 본 연구에서는 방대한 양의 학술 데이터에서 보다 빠르고 쉽게 정보를 도출하여 제공함으로써 관련 연구자들이 또 다른 연구에 접근할 수 있도록 도움을 줄 수 있다는데 의의를 둔다.","PeriodicalId":154246,"journal":{"name":"The Korean Journal of Industrial and Organizational Psychology","volume":"os-31 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2018-05-31","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"1","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"The Korean Journal of Industrial and Organizational Psychology","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.24230/KSIOP.31.2.201805.499","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 1
Abstract
빅데이터가 보급되면서 비정형자료 분석기술에 관한 관심이 증가하고 있으며, 방대한 양의 학술 데이터에서 가치 있는 정보를 도출해 내는 연구들이 수행되고 있다. 대부분 대용량 텍스트를 인간이 수동적으로 분석하는 것은 시간과 노력이 많이 들고 어려우므로 이를 보완하기 위해 자동으로 분류해줄 수 있는 기술이 필요하다. 이에 본 연구는 2010년부터 2017년까지 발간한 ‘한국심리학회지: 산업 및 조직’ 논문의 주요어, 논문제목, 초록과 같은 비정형자료를 이용하여 분석하고 시각화하였다. 연구결과는 다음과 같다. 첫째, 주요어를 워드클라우드로 시각화한 결과 ‘조직몰입’이 빈번히 사용되었으며, 직무만족, 직무열의, 이직의도, 정서노동 순으로 나타났다. 둘째, 논문제목과 초록을 LDA 확률에 근거하여 자동으로 10개의 주제로 분류하였으며, 주제 8(조직/몰입/지각)이 가장 높았고, 주제 5(행동/관리/상사)는 가장 낮았다. 셋째, 주저자와 교신저자와의 관계는 6개의 큰 집단과 다수의 작은 집단으로 나타났으며, 집단 내의 유력자를 알 수 있었다. 본 연구에서는 방대한 양의 학술 데이터에서 보다 빠르고 쉽게 정보를 도출하여 제공함으로써 관련 연구자들이 또 다른 연구에 접근할 수 있도록 도움을 줄 수 있다는데 의의를 둔다.