新壹科技李璋揭秘：视频垂直大模型如何重塑智能数字人未来？

发布时间：2024-12-10 18:37 来源：ITBEAR 作者：顾雨柔

近日，备受瞩目的2024中国生成式AI大会在上海圆满结束。本次大会上，新壹科技AI算法主任架构师李璋作为特邀嘉宾，就《视频垂直大模型在智能数字人中的应用》这一主题发表了深刻见解，不仅分享了公司在AI领域的最新研究成果，还通过实际案例展示了其在数字人和视频生成方面的技术实力，引发了与会者的热烈反响。

在活动现场，李璋首先回顾了新壹科技从一下科技转型而来的发展历程，以及在AI领域的深耕细作。他提到，一下科技在移动视频和视频推荐领域有着深厚的积累，但随着AI技术的兴起，公司决定把握住这一时代机遇，将重心转向AI，并在视频生成领域持续探索。

李璋强调，新壹科技在AI转型过程中，逐渐形成了自己的核心技术优势，特别是在数字人和视频生成两大领域取得了显著成果。他提到，公司推出的国内首款视频生成大模型——新壹视频大模型，在数字人动作、表情和视频质量上进行了全面优化，为用户带来了更加逼真的视频体验。

在谈及垂直大模型的优势时，李璋指出，随着大模型的普及，其参数量不断增大，导致部署和训练成本上升。而垂直大模型则更加专注于特定领域，如视频生成和数字人，能够在保留大模型强大能力的同时，降低部署和训练成本，让更多企业能够享受到AI技术带来的便利。

李璋进一步介绍了新壹科技在视频生成大模型研发过程中攻克的技术难题。例如，在数字人动作模拟方面，公司采用了先进的动作捕捉技术和深度学习算法，使得生成的视频中人物动作更加自然流畅；在表情迁移方面，通过生成式对抗网络实现了表情的精准迁移，让数字人能够展现出更加拟人化的丰富情感。

新壹科技还积极推动视频生成大模型在各个领域的应用。目前，围绕新壹视频大模型的产品及应用平台已拥有超过300万用户，每天生成超过15万分钟的视频内容，客户覆盖保险金融、媒体营销、出版、政务、汽车、医疗和教育等多个领域，显著提升了各垂直领域的创造力和生产力。

在智能数字人领域，李璋也分享了新壹科技的最新进展。他提到，公司推出的AI数字人产品架构包括底层能力、中间层和应用层。底层能力接入大语言模型，支持自然语言理解和生成，使数字人能够与用户进行流畅对话；同时，还支持声音克隆和多种数字人形象选择。中间层则负责处理复杂的AI任务，如人脸关键点检测、表情迁移等，确保数字人在各种场景下都能展现出逼真的表情和动作。应用层则支持多端交互，为用户提供更加沉浸式的体验。

李璋还展示了多个数字人应用案例，包括数字人播报、实景数字人、图片数字人和直播数字人等。这些案例充分展示了新壹科技在AI数字人领域的创新能力和应用实力，以及视频垂直大模型在智能数字人领域的巨大潜力和商业价值。

在演讲的最后部分，李璋强调了新壹科技将继续深耕AI领域，不断探索和创新，为用户带来更加丰富、生动的交互体验。同时，他也期待与更多合作伙伴携手共进，共同推动AI技术的发展和应用。

更多>同类内容