在湖南长沙举办的第五届长沙·中国1024程序员节上,智能文档处理成为热议话题。活动期间,合合信息面向开发者推出了智能文档处理“百宝箱”系列产品,提供免费体验。这一产品旨在解决文档解析精度低、效果评估难等问题,推动文档处理应用的个性化与高效开发。
在《模型与工具》论坛上,合合信息智能创新事业部研发总监常扬详细介绍了“百宝箱”的三大产品。这组工具包含前端可视化组件,让开发者能够直观交互并编辑解析效果,提升解析精度。还开源了自研的文本向量模型acge,助力大模型性能优化。
针对市面上文档解析产品效果缺乏统一标准的问题,“百宝箱”提供了文档解析测评工具,从多个维度为工具筛选提供定量测评依据,节省开发者时间。这一工具通过雷达图等可视化形式,直观展示文本识别、解析和翻译结果。
在知识库搭建、智能文档抽取等场景中,“百宝箱”也展现出了深度应用能力。以工程制造业为例,通过“百宝箱”及合合信息的智能文档处理技术,开发者可以精准提取复杂文档信息,优化知识库构建。在面对多语种文档时,“百宝箱”也能批量、精确区分并提取信息,提高翻译质量。