XÂY DỰNG HỆ THỐNG TỰ ĐỘNG GIẢI ĐÁP THẮC MẮC VỀ QUY ĐỊNH HỌC TẬP TẠI TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP BẰNG KỸ THUẬT HỌC SÂU

ĐẶNG THỊ PHÚC, Nguyễn Thanh Long, ĐẶNG VĂN NGHIÊM, TRẦN THỊ MINH KHOA
{"title":"XÂY DỰNG HỆ THỐNG TỰ ĐỘNG GIẢI ĐÁP THẮC MẮC VỀ QUY ĐỊNH HỌC TẬP TẠI TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP BẰNG KỸ THUẬT HỌC SÂU","authors":"ĐẶNG THỊ PHÚC, Nguyễn Thanh Long, ĐẶNG VĂN NGHIÊM, TRẦN THỊ MINH KHOA","doi":"10.46242/jstiuh.v61i07.4725","DOIUrl":null,"url":null,"abstract":"Hiện nay, đối với trường đại học có quy mô lớn như Đại học Công nghiệp TPHCM, số lượng quy định, quy chế, thông báo rất lớn và cập nhật thường xuyên dẫn đến việc tìm hiểu và nắm bắt nội dung trở nên khó khăn. Trong bài báo, chúng tôi xây dựng hệ thống tự động trả lời câu hỏi dựa trên nội dung của các file văn bản bằng kỹ thuật deep learning. Hệ thống trích chọn thông tin từ câu hỏi, đưa vào là các từ khoá và trả về đoạn văn bản liên quan bằng thuật toán BM25. Ứng với đoạn văn bản có độ liên quan cao nhất, mô hình deep learning được huấn luyện để trích xuất ra câu trả lời tương ứng. Mô hình được huấn luyện dựa trên bộ dữ liệu huấn luyện với 10000 và bộ dữ liệu test 1600 cặp câu hỏi và câu trả lời tương ứng từ các đoạn văn bản được lấy từ các thông báo, quy định, quy chế của nhà trường. Chúng tôi tinh chỉnh các mô hình deep learning để huấn luyện và đánh giá, dựa trên hiệu quả và độ chính xác để lựa chọn mô hình tối ưu nhất. Kết quả độ chính xác đạt được theo F1-score của mô hình BERT là 73.93%, RoBERTa là 75.59% PhoBERT là 45.13% và DistilBERT là 72.95%.  Mô hình RoBERTa được lựa chọn với tốc độ huấn luyện và độ chính xác cao nhất và được triển khai lên hệ thống để đánh giá kết quả.","PeriodicalId":16979,"journal":{"name":"Journal of Science and Technology - IUH","volume":"53 1","pages":""},"PeriodicalIF":0.0000,"publicationDate":"2023-03-03","publicationTypes":"Journal Article","fieldsOfStudy":null,"isOpenAccess":false,"openAccessPdf":"","citationCount":"0","resultStr":null,"platform":"Semanticscholar","paperid":null,"PeriodicalName":"Journal of Science and Technology - IUH","FirstCategoryId":"1085","ListUrlMain":"https://doi.org/10.46242/jstiuh.v61i07.4725","RegionNum":0,"RegionCategory":null,"ArticlePicture":[],"TitleCN":null,"AbstractTextCN":null,"PMCID":null,"EPubDate":"","PubModel":"","JCR":"","JCRName":"","Score":null,"Total":0}
引用次数: 0

Abstract

Hiện nay, đối với trường đại học có quy mô lớn như Đại học Công nghiệp TPHCM, số lượng quy định, quy chế, thông báo rất lớn và cập nhật thường xuyên dẫn đến việc tìm hiểu và nắm bắt nội dung trở nên khó khăn. Trong bài báo, chúng tôi xây dựng hệ thống tự động trả lời câu hỏi dựa trên nội dung của các file văn bản bằng kỹ thuật deep learning. Hệ thống trích chọn thông tin từ câu hỏi, đưa vào là các từ khoá và trả về đoạn văn bản liên quan bằng thuật toán BM25. Ứng với đoạn văn bản có độ liên quan cao nhất, mô hình deep learning được huấn luyện để trích xuất ra câu trả lời tương ứng. Mô hình được huấn luyện dựa trên bộ dữ liệu huấn luyện với 10000 và bộ dữ liệu test 1600 cặp câu hỏi và câu trả lời tương ứng từ các đoạn văn bản được lấy từ các thông báo, quy định, quy chế của nhà trường. Chúng tôi tinh chỉnh các mô hình deep learning để huấn luyện và đánh giá, dựa trên hiệu quả và độ chính xác để lựa chọn mô hình tối ưu nhất. Kết quả độ chính xác đạt được theo F1-score của mô hình BERT là 73.93%, RoBERTa là 75.59% PhoBERT là 45.13% và DistilBERT là 72.95%.  Mô hình RoBERTa được lựa chọn với tốc độ huấn luyện và độ chính xác cao nhất và được triển khai lên hệ thống để đánh giá kết quả.
建立自动化系统,解决工业大学学习规则的疑难问题
现在,对于像胡志明市工业大学这样规模较大的大学来说,大量的规章制度、规章制度、报告和经常性的更新导致学习和捕捉内容变得困难。在这篇文章中,我们根据深度学习技术的文本文件的内容构建了一个自动回答问题的系统。系统从问题中提取信息,输入关键字,并通过BM25算法返回相关文本。对于相关性最高的文本,深度学习模型被训练来提取相应的答案。基于训练数据集的训练模型,有10000个训练数据集和测试数据集,1600对问题和答案来自学校的通知、法规和规章。我们优化了深度学习模式,以培训和评估,基于效率和准确性,选择最佳模式。BERT模型F1-score的准确率为73.93%,RoBERTa为75.59%,PhoBERT为45.13%,severbert为72.95%。罗伯塔模型被选择以最高的训练速度和精确度,并被部署到系统中来评估结果。
本文章由计算机程序翻译,如有差异,请以英文原文为准。
求助全文
约1分钟内获得全文 求助全文
来源期刊
自引率
0.00%
发文量
0
×
引用
GB/T 7714-2015
复制
MLA
复制
APA
复制
导出至
BibTeX EndNote RefMan NoteFirst NoteExpress
×
提示
您的信息不完整,为了账户安全,请先补充。
现在去补充
×
提示
您因"违规操作"
具体请查看互助需知
我知道了
×
提示
确定
请完成安全验证×
copy
已复制链接
快去分享给好友吧!
我知道了
右上角分享
点击右上角分享
0
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信