{"title":"基于韩语语料库的计算语言学分句研究","authors":"Sangah Lee","doi":"10.15811/jkl.2023..107.015","DOIUrl":null,"url":null,"abstract":"본 논의에서는 컴퓨터언어학 분야에서 고려되는 ‘구문’의 정의를 살펴보고 이들이 연구에서 다루어지는 양상을 확인하였다. 컴퓨터언어학 및 자연언어처리 분야의 연구에서의 구문은 다른 언어학 분야와 크게 다른 정의를 내리고 있지는 않으나, 특히 문장을 이루는 통사적, 의미적 구조 정보와 깊은 관련이 있다고 볼 수 있다. 문장 내의 단어 혹은 다른 단위의 구성 성분들이 서로 만나 이루는 관계를 학습한 언어 모델이 그 지식을 활용해 다양한 언어 데이터를 처리하는 것이다. 본고에서는 ‘구문 분석 말뭉치’라는 이름으로 제공되어 한국어 컴퓨터언어학 연구에서 주로 분석 및 활용되는 데이터에 대해 설명하고, 이와 관련하여 이루어지고 있는 한국어 구문 분석 연구 및 배포된 라이브러리를 소개하였다. 또한 이러한 데이터가 포함하는 구문 정보를 학습하고 활용하는 BERT, GPT 등 언어 모델의 원리인 어텐션 메커니즘이 곧 문장 혹은 문서 내 구성 성분 사이의 관계성에 기반한 것임을 살펴보았다.","PeriodicalId":472278,"journal":{"name":"Gug'eohag - Gug'eo haghoe","volume":"30 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-09-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Studies on Clauses in Computational Linguistics Focused on Korean Corpora\",\"authors\":\"Sangah Lee\",\"doi\":\"10.15811/jkl.2023..107.015\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"본 논의에서는 컴퓨터언어학 분야에서 고려되는 ‘구문’의 정의를 살펴보고 이들이 연구에서 다루어지는 양상을 확인하였다. 컴퓨터언어학 및 자연언어처리 분야의 연구에서의 구문은 다른 언어학 분야와 크게 다른 정의를 내리고 있지는 않으나, 특히 문장을 이루는 통사적, 의미적 구조 정보와 깊은 관련이 있다고 볼 수 있다. 문장 내의 단어 혹은 다른 단위의 구성 성분들이 서로 만나 이루는 관계를 학습한 언어 모델이 그 지식을 활용해 다양한 언어 데이터를 처리하는 것이다. 본고에서는 ‘구문 분석 말뭉치’라는 이름으로 제공되어 한국어 컴퓨터언어학 연구에서 주로 분석 및 활용되는 데이터에 대해 설명하고, 이와 관련하여 이루어지고 있는 한국어 구문 분석 연구 및 배포된 라이브러리를 소개하였다. 또한 이러한 데이터가 포함하는 구문 정보를 학습하고 활용하는 BERT, GPT 등 언어 모델의 원리인 어텐션 메커니즘이 곧 문장 혹은 문서 내 구성 성분 사이의 관계성에 기반한 것임을 살펴보았다.\",\"PeriodicalId\":472278,\"journal\":{\"name\":\"Gug'eohag - Gug'eo haghoe\",\"volume\":\"30 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-09-30\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Gug'eohag - Gug'eo haghoe\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.15811/jkl.2023..107.015\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Gug'eohag - Gug'eo haghoe","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.15811/jkl.2023..107.015","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
Studies on Clauses in Computational Linguistics Focused on Korean Corpora
본 논의에서는 컴퓨터언어학 분야에서 고려되는 ‘구문’의 정의를 살펴보고 이들이 연구에서 다루어지는 양상을 확인하였다. 컴퓨터언어학 및 자연언어처리 분야의 연구에서의 구문은 다른 언어학 분야와 크게 다른 정의를 내리고 있지는 않으나, 특히 문장을 이루는 통사적, 의미적 구조 정보와 깊은 관련이 있다고 볼 수 있다. 문장 내의 단어 혹은 다른 단위의 구성 성분들이 서로 만나 이루는 관계를 학습한 언어 모델이 그 지식을 활용해 다양한 언어 데이터를 처리하는 것이다. 본고에서는 ‘구문 분석 말뭉치’라는 이름으로 제공되어 한국어 컴퓨터언어학 연구에서 주로 분석 및 활용되는 데이터에 대해 설명하고, 이와 관련하여 이루어지고 있는 한국어 구문 분석 연구 및 배포된 라이브러리를 소개하였다. 또한 이러한 데이터가 포함하는 구문 정보를 학습하고 활용하는 BERT, GPT 등 언어 모델의 원리인 어텐션 메커니즘이 곧 문장 혹은 문서 내 구성 성분 사이의 관계성에 기반한 것임을 살펴보았다.