在人工智能领域的不断前行中,一项旨在促进科研合作与技术转化的联合基金引发了广泛关注。CCF-网易雷火联合基金自2023年成立以来,已成功助力多项尖端技术的研发,并在2024中国计算机大会(CNCC2024)上揭晓了首批优秀成果。其中,浙江大学软件学院的研究员王皓波所带领的团队,凭借在“基于大小模型协同的低资源标注技术”领域的突破,成为此次发布的亮点之一。
王皓波在大会上详细阐述了团队的研究成果。他指出,数据标注作为AI发展的“燃料”,其效率与质量对AI应用效果至关重要。然而,在垂直领域的应用中,通用大模型往往难以直接输出标注结果,仍需大量人工辅助。为此,团队聚焦于如何利用大模型与小模型的协同作用,实现低资源条件下的高效、精准标注。
研究过程分为三个阶段。首先,团队在鲁棒噪声标签学习方面取得进展,提出了ProMix算法,通过创新的样本选择方式,成功解决了噪声标签学习中的样本不平衡问题。其次,团队研发了FreeAL框架,实现了大模型与小模型的协同标注,通过迭代优化,显著提升了标注的准确率。最后,团队基于FreeAL框架,进一步研发了CORAL协作式自动标注系统,通过引入人机协同的标注范式,实现了高质量的数据标注,极大地降低了时间和人工成本。
王皓波在演讲中强调,在实际生产环境中,机器标注仍需人类领域知识的支撑。因此,团队正在探索将大小模型协同标注系统与网易有灵平台的AOP体系深度集成,以构建更加高效、智能的人机协同标注体系。
CCF-网易雷火联合基金的支持为团队的研究提供了坚实保障。王皓波表示,感谢基金提供的平台与合作机会,以及团队成员的辛勤付出。他相信,团队的研究成果将为数据标注领域的发展贡献一份力量,共同推动人工智能技术迈向新的高度。