北京师范大学黄浩勇、贾维嘉团队ES&T Lett.:大语言模型在水工程研究知识任务中的测评与性能提升策略初探

环境人Environmentor 2025-02-26 12:46
文章摘要
本文由北京师范大学黄浩勇、贾维嘉团队撰写,探讨了大语言模型(LLM)在水工程与科学研究领域的应用。研究团队构建了一个名为WaterER的评估数据集,包含1043个水领域知识问答,评估了包括GPT-4在内的8种LLM。结果显示,GPT-4在工程与研究知识任务中表现优异,而Gemini在研究知识任务上表现突出。为了降低研究成本,团队对开源的Llama3-8B模型进行了微调,开发出WaterGPT,其在某些任务上的表现接近商业模型GPT-3.5。研究强调了高质量数据在模型微调中的重要性,并提出了未来研究方向,包括构建更高质量的领域知识库和开发新的评估方法。
北京师范大学黄浩勇、贾维嘉团队ES&T Lett.:大语言模型在水工程研究知识任务中的测评与性能提升策略初探
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。
环境人Environmentor
最新文章
热门类别
相关文章
联系我们:info@booksci.cn Book学术提供免费学术资源搜索服务,方便国内外学者检索中英文文献。致力于提供最便捷和优质的服务体验。 Copyright © 2023 布克学术 All rights reserved.
京ICP备2023020795号-1
ghs 京公网安备 11010802042870号
Book学术文献互助
Book学术文献互助群
群 号:481959085
Book学术官方微信