基于韩语语料库的计算语言学分句研究

Sangah Lee
{"title":"基于韩语语料库的计算语言学分句研究","authors":"Sangah Lee","doi":"10.15811/jkl.2023..107.015","DOIUrl":null,"url":null,"abstract":"본 논의에서는 컴퓨터언어학 분야에서 고려되는 ‘구문’의 정의를 살펴보고 이들이 연구에서 다루어지는 양상을 확인하였다. 컴퓨터언어학 및 자연언어처리 분야의 연구에서의 구문은 다른 언어학 분야와 크게 다른 정의를 내리고 있지는 않으나, 특히 문장을 이루는 통사적, 의미적 구조 정보와 깊은 관련이 있다고 볼 수 있다. 문장 내의 단어 혹은 다른 단위의 구성 성분들이 서로 만나 이루는 관계를 학습한 언어 모델이 그 지식을 활용해 다양한 언어 데이터를 처리하는 것이다. 본고에서는 ‘구문 분석 말뭉치’라는 이름으로 제공되어 한국어 컴퓨터언어학 연구에서 주로 분석 및 활용되는 데이터에 대해 설명하고, 이와 관련하여 이루어지고 있는 한국어 구문 분석 연구 및 배포된 라이브러리를 소개하였다. 또한 이러한 데이터가 포함하는 구문 정보를 학습하고 활용하는 BERT, GPT 등 언어 모델의 원리인 어텐션 메커니즘이 곧 문장 혹은 문서 내 구성 성분 사이의 관계성에 기반한 것임을 살펴보았다.","PeriodicalId":472278,"journal":{"name":"Gug'eohag - Gug'eo haghoe","volume":"30 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-09-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"Studies on Clauses in Computational Linguistics Focused on Korean Corpora\",\"authors\":\"Sangah Lee\",\"doi\":\"10.15811/jkl.2023..107.015\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"본 논의에서는 컴퓨터언어학 분야에서 고려되는 ‘구문’의 정의를 살펴보고 이들이 연구에서 다루어지는 양상을 확인하였다. 컴퓨터언어학 및 자연언어처리 분야의 연구에서의 구문은 다른 언어학 분야와 크게 다른 정의를 내리고 있지는 않으나, 특히 문장을 이루는 통사적, 의미적 구조 정보와 깊은 관련이 있다고 볼 수 있다. 문장 내의 단어 혹은 다른 단위의 구성 성분들이 서로 만나 이루는 관계를 학습한 언어 모델이 그 지식을 활용해 다양한 언어 데이터를 처리하는 것이다. 본고에서는 ‘구문 분석 말뭉치’라는 이름으로 제공되어 한국어 컴퓨터언어학 연구에서 주로 분석 및 활용되는 데이터에 대해 설명하고, 이와 관련하여 이루어지고 있는 한국어 구문 분석 연구 및 배포된 라이브러리를 소개하였다. 또한 이러한 데이터가 포함하는 구문 정보를 학습하고 활용하는 BERT, GPT 등 언어 모델의 원리인 어텐션 메커니즘이 곧 문장 혹은 문서 내 구성 성분 사이의 관계성에 기반한 것임을 살펴보았다.\",\"PeriodicalId\":472278,\"journal\":{\"name\":\"Gug'eohag - Gug'eo haghoe\",\"volume\":\"30 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-09-30\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Gug'eohag - Gug'eo haghoe\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.15811/jkl.2023..107.015\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Gug'eohag - Gug'eo haghoe","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.15811/jkl.2023..107.015","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

摘要

本讨论研究了计算机语言学领域中考虑的“句文”的定义,并确认了他们在研究中所涉及的情况。在计算机语言学和自然语言处理领域的研究中,句子的定义与其他语言学领域没有太大的不同,但与构成句子的通史、语义结构信息有很大的关系。学习文章内的单词或其他单位的组成成分相互接触形成的关系的语言模型,利用其知识处理多样的语言数据。本稿以“语法分析语言团”的名字提供,对韩国语计算机语言学研究中主要分析及使用的数据进行了说明,并介绍了与此相关的韩国语语法分析研究及发布的库。他还研究了BERT、GPT等语言模型的原理,即学习和使用这些数据所包含的句文信息的注意力机制,就是基于句子或文档中组成成分之间的关系。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
Studies on Clauses in Computational Linguistics Focused on Korean Corpora
본 논의에서는 컴퓨터언어학 분야에서 고려되는 ‘구문’의 정의를 살펴보고 이들이 연구에서 다루어지는 양상을 확인하였다. 컴퓨터언어학 및 자연언어처리 분야의 연구에서의 구문은 다른 언어학 분야와 크게 다른 정의를 내리고 있지는 않으나, 특히 문장을 이루는 통사적, 의미적 구조 정보와 깊은 관련이 있다고 볼 수 있다. 문장 내의 단어 혹은 다른 단위의 구성 성분들이 서로 만나 이루는 관계를 학습한 언어 모델이 그 지식을 활용해 다양한 언어 데이터를 처리하는 것이다. 본고에서는 ‘구문 분석 말뭉치’라는 이름으로 제공되어 한국어 컴퓨터언어학 연구에서 주로 분석 및 활용되는 데이터에 대해 설명하고, 이와 관련하여 이루어지고 있는 한국어 구문 분석 연구 및 배포된 라이브러리를 소개하였다. 또한 이러한 데이터가 포함하는 구문 정보를 학습하고 활용하는 BERT, GPT 등 언어 모델의 원리인 어텐션 메커니즘이 곧 문장 혹은 문서 내 구성 성분 사이의 관계성에 기반한 것임을 살펴보았다.
求助全文
通过发布文献求助,成功后即可免费获取论文全文。 去求助
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:604180095
Book学术官方微信