在人工智能领域,2024年的焦点无疑聚焦于大模型的迅猛发展及其在各行业的落地应用。近日,百度集团副总裁及深度学习技术及应用国家工程研究中心副主任吴甜受邀参与CCTV-2《对话》节目,深度剖析了当前大模型技术的进展及其在产业实践中的应用。
吴甜在节目中指出,大模型技术如同一把双刃剑,其创造力与幻觉并存。在创意需求高涨的场景中,大模型的创造力无疑是一大优势;然而,在解决实际行业问题时,模型的稳定性和准确性则显得至关重要。她进一步分享了抑制模型幻觉的两大策略:一是优化基础模型,降低幻觉出现的频率和程度;二是在模型应用中引入检索增强、智能体等技术,提高模型对事实的准确性。
根据《全球数字经济白皮书(2024年)》的数据,全球人工智能大模型数量已达1328个,中国占比高达36%。从“百模大战”到如今的“拼落地”“拼应用”,大模型的发展速度惊人。吴甜透露,百度文心大模型的日调用量已从一年前的5千万次跃升至如今的15亿次,半年内增长了7.5倍,与去年同期相比更是激增了30倍。
飞桨文心平台的开发者数量已突破1808万,服务了43万家企业,创建了101万个模型。这些数据不仅展示了文心大模型的发展速度,也揭示了其广泛的应用潜力。然而,吴甜也强调,尽管大模型应用已初具规模,但要真正落地到各个场景,还需进一步的开发和完善。
针对大模型落地产业所面临的挑战,吴甜认为,这取决于行业自身的数字化基础及业务面向数字化的抽象程度。例如,互联网行业与AI技术结合紧密,落地距离可能仅为“半公里”;而农业等行业由于数字化基础相对薄弱,落地距离可能长达几十公里甚至上百公里。她进一步指出,当前人工智能赋能千行百业面临两大难题:一是挖掘基于真实场景的真实需求,二是专业数据的缺乏。为此,百度设立了AICA人才培养项目,旨在培养既懂业务又精通AI技术的人才,并强调社会各界需共同努力建设专业数据,为人工智能的广泛应用提供支撑。
在算力方面,吴甜坦言,随着模型规模的扩大,算力需求也随之激增。她表示,百度通过深度学习平台飞桨和文心大模型的联合优化,训练效率提升了5.1倍,推理效率提升了125倍,并将继续优化。同时,百度积极推动算力的多元化,飞桨已支持超过60个芯片系列,为算力的多元化提供了有力保障。这不仅有助于降低成本、提高效率,也为大模型的广泛应用提供了坚实的算力基础。
当前,国内大模型市场正处于从“百模大战”到“大浪淘沙”的转变阶段,各行业都在依据自身的场景、经验和数据进行大模型落地的产业实践。这一过程中,形成了庞大的应用生态,推动了人工智能技术的快速发展和广泛应用。