站内搜索 | 手机版

巨人财经 - 专业科技行业财经媒体

巨人网 > 数据 > 正文内容

微软开源OmniParser，GPT-4V秒解析屏幕截图，智能新突破！

发布时间：2024-10-29 10:38 来源：ITBEAR 作者：杨凌霄

微软近日宣布了一项重大开源项目——OmniParser，这是一款专为解析和识别屏幕上可交互图标设计的AI工具。传统自动化方法受限于HTML或视图层次结构，而现有的视觉语言模型在处理复杂GUI元素时又显得力不从心。为此，微软推出了这款纯视觉基础的工具，旨在解决当前屏幕解析技术的局限性。

OmniParser结合了可交互区域检测模型、图标描述模型和OCR模块，无需依赖HTML标签或视图层次结构等显式基础数据。这一特性使得它能够在桌面、移动设备和网页等多种平台上跨平台工作，显著提高了用户界面的解析准确性。OmniParser还能将识别出的屏幕元素转换成结构化的数据。

在实际测试中，OmniParser展现出了卓越的性能。在ScreenSpot数据集中，它的准确率提高了73%，远超依赖HTML解析的模型。同时，当GPT-4V使用OmniParser的输出后，图标的正确标记率从70.5%提升至93.8%。这些改进充分证明了OmniParser在解决当前GUI交互模型根本缺陷方面的有效性。

微软已在Hugging Face上发布了OmniParser，这一举措将有助于普及这一前沿技术，进一步推动多模态AI的发展，特别是在无障碍、自动化和智能用户辅助等领域。

更多>同类内容

熵基科技2025合作伙伴大会启航AI新时代，石家庄站圆满落幕！

03-25

哪吒汽车CTO及智驾负责人变动，官方证实离职消息

03-25

拓维信息华为大会展风采，鸿蒙AI创新产品赢多项大奖

03-25

苹果COO杰夫·威廉姆斯重申：中国市场地位无可替代，将继续大规模投资

03-25

北航团队研发小型深海机器人，突破万米深渊探索新可能

03-25

比亚迪自研“天神之眼C”智驾系统，年内将实现端到端城区智驾量产？

03-25

帅丰集成灶AWE2025：科技重塑厨房，四大新发明引领烹饪新时代

03-25

GoPro Hero 13 Black推出极地白限量版，售价略涨

03-25

江波龙电子赴港上市，年营收破174亿，蔡华波掌握过半投票权

03-25

微软云OpenAI业务：中国市场贡献全球营收四分之一

03-25

松下AJ-UPX380摄录一体机：高端配置，专为现场制作与直播设计，5月上市！

03-25

华为景联文科技联手，打造AI数据湖新引擎，赋能行业智能升级

03-25

积加ERP赋能亚马逊VC卖家：精细化运营，全球生意一键管理

03-25

全国市场监管信用修复平台正式上线，助力企业一键修复信用

03-25

从代码到对话：AI时代，我们如何重新定义“编程”？

03-25

点击查看更多 +

全站最新

熵基科技2025合作伙伴大会启航AI新时代，石家庄站圆满落幕！

熵基科技2025合作伙伴大会启航AI新时代，石家庄站圆满落幕！

SATA世达五金博览会大秀“肌肉”，七大行业解决方案引围观

SATA世达五金博览会大秀“肌肉”，七大行业解决方案引围观

2025上海铜展回归，铜业创新盛宴即将开启，你准备好了吗？

2025上海铜展回归，铜业创新盛宴即将开启，你准备好了吗？

安吉尔哪吒2代净水器上市：先净化再矿化，健康饮水新选择！

安吉尔哪吒2代净水器上市：先净化再矿化，健康饮水新选择！

ASKO家电荣耀艾普兰奖，创新设计引领高端生活新风尚

ASKO家电荣耀艾普兰奖，创新设计引领高端生活新风尚

《沙丘：觉醒》预购开启，探索厄拉科斯星球，你的配置达标了吗？

《沙丘：觉醒》预购开启，探索厄拉科斯星球，你的配置达标了吗？

理想汽车独秀周销量，重启宣传不再比拼同行，你怎么看？

理想汽车独秀周销量，重启宣传不再比拼同行，你怎么看？

华人领导美国芯片巨头，但中国芯片未来还需自力更生？

华人领导美国芯片巨头，但中国芯片未来还需自力更生？

热门内容

本栏最新

熵基科技2025合作伙伴大会启航AI新时代，石家庄站圆满落幕！

熵基科技2025合作伙伴大会启航AI新时代，石家庄站圆满落幕！

哪吒汽车CTO及智驾负责人变动，官方证实离职消息

哪吒汽车CTO及智驾负责人变动，官方证实离职消息

拓维信息华为大会展风采，鸿蒙AI创新产品赢多项大奖

拓维信息华为大会展风采，鸿蒙AI创新产品赢多项大奖

苹果COO杰夫·威廉姆斯重申：中国市场地位无可替代，将继续大规模投资

苹果COO杰夫·威廉姆斯重申：中国市场地位无可替代，将继续大规模投资

北航团队研发小型深海机器人，突破万米深渊探索新可能

北航团队研发小型深海机器人，突破万米深渊探索新可能

比亚迪自研“天神之眼C”智驾系统，年内将实现端到端城区智驾量产？

比亚迪自研“天神之眼C”智驾系统，年内将实现端到端城区智驾量产？

帅丰集成灶AWE2025：科技重塑厨房，四大新发明引领烹饪新时代

帅丰集成灶AWE2025：科技重塑厨房，四大新发明引领烹饪新时代

GoPro Hero 13 Black推出极地白限量版，售价略涨

GoPro Hero 13 Black推出极地白限量版，售价略涨

巨人财经微信：netspread（注明:巨人财经）简体繁体根据客户端智能切换，如显示有问题，请点击页面右上角的简繁切换功能！
Copyright © 2016-2023 jur.com.cn All rights reserved. 鲁ICP备11015305号-4