小语言模型SLM综述|大模型论文日报
学术头条
2024-10-31 18:02
文章摘要
本文介绍了哈佛大学研究团队提出的SocialGPT框架,该框架结合了视觉基础模型(VFMs)和大语言模型(LLMs)的能力,用于社会关系推理。SocialGPT通过将图像内容转化为文本社交故事,并利用LLMs进行文本推理,实现了零样本学习和可解释性。为了优化LLMs的提示设计,研究团队提出了贪婪分段提示优化(GSPO)方法,显著提高了性能。实验结果表明,SocialGPT在社会关系识别任务中表现出色,且适用于不同的图像风格。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。