{"title":"基于句子相似度和句子属性的韩英英翻译平行语料库质量预测模型","authors":"Wonhee Go, Jinhyuk Choi, Kyudong Choi","doi":"10.5626/ktcp.2023.29.9.410","DOIUrl":null,"url":null,"abstract":"본 연구를 통해 한영·영한 번역 병렬 말뭉치의 품질을 평가하는 모델을 제안하고, 이를 이용해 시중의 한영·영한 번역 병렬 말뭉치에 대해 품질 평가를 실시한다. 연구의 의의는 다음과 같다. 첫 번째로, DA(Direct Assessment) 점수로 평가하는 한영·영한 QE(Quality Estimation) 연구를 실시하며 관련 데이터를 최초 구축했다. 두 번째로 번역 병렬 말뭉치 품질 평가 모델 TwiQE를 구축했다. 세 번째로 복수의 전문가가 수립한 품질 기준을 제시하며 번역 병렬 말뭉치 품질 개선의 기틀을 마련했다. 마지막으로, 구축된 모델을 활용하여 AI HUB1)에 공개된 한영 번역 병렬 말뭉치 2종2), 영한 번역 병렬 말뭉치 2종에 대한 품질평가를 실시했다. TwiQE를 통해 도출한 품질 평가 점수를 바탕으로 개선이 필요한 말뭉치를 두 수준으로 나누어 파악했고, 각 수준에 미치지 못하는 말뭉치의 수량과 비율을 파악하여 품질 개선의 기틀을 마련했다.","PeriodicalId":479646,"journal":{"name":"Jeongbogwahakoe keompyuting-ui silje nonmunji","volume":"49 1","pages":"0"},"PeriodicalIF":0.0000,"publicationDate":"2023-09-30","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":"{\"title\":\"A Quality Prediction Model for the Parallel Corpora of Korean-English and English-Korean Translation Utilizing Sentence Similarity and Sentence Attributes\",\"authors\":\"Wonhee Go, Jinhyuk Choi, Kyudong Choi\",\"doi\":\"10.5626/ktcp.2023.29.9.410\",\"DOIUrl\":null,\"url\":null,\"abstract\":\"본 연구를 통해 한영·영한 번역 병렬 말뭉치의 품질을 평가하는 모델을 제안하고, 이를 이용해 시중의 한영·영한 번역 병렬 말뭉치에 대해 품질 평가를 실시한다. 연구의 의의는 다음과 같다. 첫 번째로, DA(Direct Assessment) 점수로 평가하는 한영·영한 QE(Quality Estimation) 연구를 실시하며 관련 데이터를 최초 구축했다. 두 번째로 번역 병렬 말뭉치 품질 평가 모델 TwiQE를 구축했다. 세 번째로 복수의 전문가가 수립한 품질 기준을 제시하며 번역 병렬 말뭉치 품질 개선의 기틀을 마련했다. 마지막으로, 구축된 모델을 활용하여 AI HUB1)에 공개된 한영 번역 병렬 말뭉치 2종2), 영한 번역 병렬 말뭉치 2종에 대한 품질평가를 실시했다. TwiQE를 통해 도출한 품질 평가 점수를 바탕으로 개선이 필요한 말뭉치를 두 수준으로 나누어 파악했고, 각 수준에 미치지 못하는 말뭉치의 수량과 비율을 파악하여 품질 개선의 기틀을 마련했다.\",\"PeriodicalId\":479646,\"journal\":{\"name\":\"Jeongbogwahakoe keompyuting-ui silje nonmunji\",\"volume\":\"49 1\",\"pages\":\"0\"},\"PeriodicalIF\":0.0000,\"publicationDate\":\"2023-09-30\",\"publicationTypes\":\"Journal Article\",\"fieldsOfStudy\":null,\"isOpenAccess\":false,\"openAccessPdf\":\"\",\"citationCount\":\"0\",\"resultStr\":null,\"platform\":\"Semanticscholar\",\"paperid\":null,\"PeriodicalName\":\"Jeongbogwahakoe keompyuting-ui silje nonmunji\",\"FirstCategoryId\":\"1085\",\"ListUrlMain\":\"https://doi.org/10.5626/ktcp.2023.29.9.410\",\"RegionNum\":0,\"RegionCategory\":null,\"ArticlePicture\":[],\"TitleCN\":null,\"AbstractTextCN\":null,\"PMCID\":null,\"EPubDate\":\"\",\"PubModel\":\"\",\"JCR\":\"\",\"JCRName\":\"\",\"Score\":null,\"Total\":0}","platform":"Semanticscholar","paperid":null,"PeriodicalName":"Jeongbogwahakoe keompyuting-ui silje nonmunji","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.5626/ktcp.2023.29.9.410","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
A Quality Prediction Model for the Parallel Corpora of Korean-English and English-Korean Translation Utilizing Sentence Similarity and Sentence Attributes
본 연구를 통해 한영·영한 번역 병렬 말뭉치의 품질을 평가하는 모델을 제안하고, 이를 이용해 시중의 한영·영한 번역 병렬 말뭉치에 대해 품질 평가를 실시한다. 연구의 의의는 다음과 같다. 첫 번째로, DA(Direct Assessment) 점수로 평가하는 한영·영한 QE(Quality Estimation) 연구를 실시하며 관련 데이터를 최초 구축했다. 두 번째로 번역 병렬 말뭉치 품질 평가 모델 TwiQE를 구축했다. 세 번째로 복수의 전문가가 수립한 품질 기준을 제시하며 번역 병렬 말뭉치 품질 개선의 기틀을 마련했다. 마지막으로, 구축된 모델을 활용하여 AI HUB1)에 공개된 한영 번역 병렬 말뭉치 2종2), 영한 번역 병렬 말뭉치 2종에 대한 품질평가를 실시했다. TwiQE를 통해 도출한 품질 평가 점수를 바탕으로 개선이 필요한 말뭉치를 두 수준으로 나누어 파악했고, 각 수준에 미치지 못하는 말뭉치의 수량과 비율을 파악하여 품질 개선의 기틀을 마련했다.