AI可以帮你做作业、写小说……但却栽在了“看时间”上!
【蜂耘网 人工智能】如今,人工智能能够生成栩栩如生的图像、写小说、帮你完成家庭作业,甚至还能预测蛋白质结构。然而,一项新的研究却表明,它在一项非常基础的任务上常常栽跟头 —— 看时间。
爱丁堡大学的研究人员测试了七款知名的多模态大言模型的“识时”能力 —— 让它们根据不同的时钟或日历图像回答与时间相关问题。
他们的研究将于 4 月正式发表,不过,目前已经在科研共享平台 arXiv 上发布了,该研究表明,这些大型语言模型在这种基础任务上“变成智障”了。
研究人员在研究中写道:“从视觉输入中解读时间并进行推理的能力,对于许多现实世界的应用至关重要 —— 从事件安排到自动驾驶系统等领域皆是如此。尽管多模态大语言模型(MLLMs)取得了进展,但大多数研究工作都集中在目标检测、图像描述或场景理解等方面,对时间推理的探索仍不够充分。”
本次测试的对象包括 OpenAI 的 GPT-4o 和 GPT-o1、谷歌 DeepMind 的 Gemini 2.0、Anthropic 的 Claude 3.5 Sonnet、Meta 的 Llama 3.2-11B-Vision-Instruct、阿里的 Qwen2-VL7B-Instruct、以及 ModelBest 的 MiniCPM-V-2.6。研究人员向这些模型输入了不同的模拟时钟图片(这些图片中的时钟或带有罗马数字、或有不同的表盘颜色,有些则没有指针)、以及十年来的日历图片等。
向这些大模型上传时钟图片的同时,还会提出问题:上传图片中的时钟显示的时间是多少?而对于日历的图片,研究人员则会提出一些简单的问题,比如:元旦是星期几?以及一些较难的问题,诸如:一年中的第 153 天是哪一天?
“读取模拟时钟的时间和理解日历涉及到复杂的认知步骤”,研究人员解释说,“这需要进行精细的视觉识别(例如,时钟指针的位置、日期单元格的布局),以及不简单的数值推理(例如,计算日期偏移量)”
总而言之,这些AI模型的表现很不理想 —— 它们正确读取模拟时钟时间的概率不到 25%。研究人员表示,无论是带有罗马数字和风格化指针的时钟,还是没有指针的时装,它们的表现都不甚理想。
在最终的测试结果中,谷歌的Gemini 2.0 在时钟测试中表现最 好,而 GPT-o1 在日历任务上准确率为 80% —— 比竞争对手都要好。这也意味着, 即使最出色的AI大模型,错误率也高达 20%。
这项研究的共同作者、爱丁堡大学信息学院的博士生 Rohit Saxena 在一份学校声明中表示:“大多数人从小就会看时间和日历。我们的研究结果凸显了 AI 在执行对人类来说相当基础的技能方面存在的显著差距。如果要将 AI 系统成功集成到对时间敏感的现实世界应用中,比如日程安排、自动化和辅助技术等领域,就必须解决这些不足。”
所以,AI 或许能够帮你完成家庭作业,但别指望它能按时完成任务,至少现在还是这样。
(蜂耘人工智能网 责任编辑:行云)
如今,人工智能能够生成栩栩如生的图像、写小说、帮你完成家庭作业,甚至还能预测蛋白质结构。然而,一项新的研究却表明,它在一项非常基础的任务上常常栽跟头 —— 看时间。
- 2025-05-09
- 2025-05-09
- 2025-05-09
- 2025-05-09
- 2025-05-09
- 2025-05-09
-
当机器人学会"轻拿轻放":亚马逊仓库上演人机共舞
来源:蜂耘网
在亚马逊的物流中心里,新来的"员工"Vulcan正用气动夹具轻轻捏起一盒玻璃瓶装香水,0.6秒后准确放入塑料周转箱。这个看似平常的动作背后,藏着让仓储专家惊叹的变革——机器人指尖的压力传感器正在以每秒200次的频率微调力度,就像人类手指触摸丝绸时的本能反应。2025-05-09
-
当狗狗的语言被破译:百度打开跨物种对话的黑匣子
来源:蜂耘网
深夜的北京某小区,金毛犬"可乐"突然对着阳台狂吠。主人李女士打开百度新上线的宠物插件,手机屏上跳出实时翻译:"东南方向23米,流浪猫闯入领地区域。"这个看似科幻的场景,正随着百度最新公布的动物语言专利走向现实。这项技术像一把万能钥匙,试图解开地球千万年来的生物密码。2025-05-09
- 2022-08-25
- 2022-10-13
- 2022-10-24
- 2023-09-01
- 2022-10-18
- 2022-09-30
- 2024-05-28
- 2023-03-29
-
坚定扛牢“走在前、挑大梁”的使命担当(权威访谈·谋发展 启新篇)
来源:人民日报
2024年,山东经济社会高质量发展取得积极成效。新的一年,作为经济大省的山东如何坚定扛牢“走在前、挑大梁”的使命担当?如何全面贯彻落实中央经济工作会议精神,奋力推动经济社会高质量发展?记者采访了山东省委书记林武。넶54 2025-01-21 -
一文了解查理·芒格:为什么他是巴菲特最推崇的人
来源:
①巴菲特写道,“如果没有查理的灵感、智慧和参与,伯克希尔-哈撒韦公司不可能发展到今天的地位”;
②芒格曾表示,“如果世上未曾有过查理·芒格这个人,巴菲特的业绩依然会像现在这么漂亮 ”
③两周前,芒格还公开在节目中维护93岁的老友巴菲特。넶212 2023-11-29 -
面壁者,拉里·佩奇
来源:中欧商业评论
这两年,硅谷钢铁侠埃隆·马斯克在社交媒体上口无遮拦,这为他的公司引来了铺天盖地的负面新闻,然而,他的好友、谷歌联合创始人拉里·佩奇却因为看不到人同样被媒体炮轰多时。他已经在公共视野中消失太久了。넶340 2022-06-15
-
4月23日丨苏州人工智能产业生态大会即将启幕,行业大咖论剑技术突围与生态共建
来源:蜂耘网
以蜂耘网为代表的科技平台责无旁贷地肩负起推动中国人工智能产业高质量发展的使命,将于4月23日举办苏州人工智能产业生态大会。넶47 2025-04-03 -
-
3月26日丨成都人工智能产业生态大会强势来袭!不容错过!
来源:蜂耘网
蜂耘网将在成都举办人工智能产业生态大会,汇聚行业顶尖专家、企业领袖、投资机构及政府代表,为行业人士提供一个交流、学习与合作的平台。넶81 2025-02-21
- 2025-05-09
- 2025-05-09
- 2025-05-09
- 2025-05-09
- 2025-05-09
- 2025-05-09
- 2025-05-09
- 2025-05-09
- 2025-05-09
- 2025-05-09
- 2025-05-09
- 2025-05-09