李沐时隔一年,回归B站了!
机器学习算法与自然语言处理
2026-05-23 00:00
文章摘要
背景:本文介绍了李沐及其团队Boson AI在B站发布的最新成果——Higgs Avatar v1。距离上次发布语音大模型教程已过去近一年,此次团队将AI语音助手升级,为其添加了实时面部反应功能。研究目的:研究旨在突破传统数字人的局限,即预录制视频或基于模板的虚拟形象,转而开发一个能实时生成口型、表情和头部动作的AI语音助手交互界面,使AI能够在对话中“露脸”,提升交互的信任感和自然度。结论:Higgs Avatar v1的核心创新在于实现了实时对话中的面部生成,单张H100显卡即可流畅运行。该技术指向了更广阔的应用场景,如客服、销售、培训、医疗咨询等需要“面对面服务”的领域。作者认为,这标志着AI Agent的界面从文本框、语音,进化到包含实时反应的面部表情,使AI不再仅是工具,而更像一个服务窗口。
本站注明稿件来源为其他媒体的文/图等稿件均为转载稿,本站转载出于非商业性的教育和科研之目的,并不意味着赞同其观点或证实其内容的真实性。如转载稿涉及版权等问题,请作者速来电或来函联系。