{"title":"Studies on Clauses in Computational Linguistics Focused on Korean Corpora","authors":"Sangah Lee","doi":"10.15811/jkl.2023..107.015","DOIUrl":null,"url":null,"abstract":"본 논의에서는 컴퓨터언어학 분야에서 고려되는 ‘구문’의 정의를 살펴보고 이들이 연구에서 다루어지는 양상을 확인하였다. 컴퓨터언어학 및 자연언어처리 분야의 연구에서의 구문은 다른 언어학 분야와 크게 다른 정의를 내리고 있지는 않으나, 특히 문장을 이루는 통사적, 의미적 구조 정보와 깊은 관련이 있다고 볼 수 있다. 문장 내의 단어 혹은 다른 단위의 구성 성분들이 서로 만나 이루는 관계를 학습한 언어 모델이 그 지식을 활용해 다양한 언어 데이터를 처리하는 것이다. 본고에서는 ‘구문 분석 말뭉치’라는 이름으로 제공되어 한국어 컴퓨터언어학 연구에서 주로 분석 및 활용되는 데이터에 대해 설명하고, 이와 관련하여 이루어지고 있는 한국어 구문 분석 연구 및 배포된 라이브러리를 소개하였다. 또한 이러한 데이터가 포함하는 구문 정보를 학습하고 활용하는 BERT, GPT 등 언어 모델의 원리인 어텐션 메커니즘이 곧 문장 혹은 문서 내 구성 성분 사이의 관계성에 기반한 것임을 살펴보았다.","PeriodicalId":472278,"journal":{"name":"Gug'eohag - Gug'eo haghoe","volume":"30 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-09-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Gug'eohag - Gug'eo haghoe","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.15811/jkl.2023..107.015","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0
Abstract
본 논의에서는 컴퓨터언어학 분야에서 고려되는 ‘구문’의 정의를 살펴보고 이들이 연구에서 다루어지는 양상을 확인하였다. 컴퓨터언어학 및 자연언어처리 분야의 연구에서의 구문은 다른 언어학 분야와 크게 다른 정의를 내리고 있지는 않으나, 특히 문장을 이루는 통사적, 의미적 구조 정보와 깊은 관련이 있다고 볼 수 있다. 문장 내의 단어 혹은 다른 단위의 구성 성분들이 서로 만나 이루는 관계를 학습한 언어 모델이 그 지식을 활용해 다양한 언어 데이터를 처리하는 것이다. 본고에서는 ‘구문 분석 말뭉치’라는 이름으로 제공되어 한국어 컴퓨터언어학 연구에서 주로 분석 및 활용되는 데이터에 대해 설명하고, 이와 관련하여 이루어지고 있는 한국어 구문 분석 연구 및 배포된 라이브러리를 소개하였다. 또한 이러한 데이터가 포함하는 구문 정보를 학습하고 활용하는 BERT, GPT 등 언어 모델의 원리인 어텐션 메커니즘이 곧 문장 혹은 문서 내 구성 성분 사이의 관계성에 기반한 것임을 살펴보았다.