科技行业资讯门户

广告

广告

广告

广告

广告

AI可以帮你做作业、写小说……但却栽在了“看时间”上!

【蜂耘网 人工智能】如今,人工智能能够生成栩栩如生的图像、写小说、帮你完成家庭作业,甚至还能预测蛋白质结构。然而,一项新的研究却表明,它在一项非常基础的任务上常常栽跟头  看时间。

 

img1

 

爱丁堡大学的研究人员测试了七款知名的多模态大言模型  让它们根据不同的时钟或日历图像回答与时间相关问题。

 

他们的研究将 4 月正式发表,不过,目前已经在科研共享平 arXiv 上发布了,该研究表明,这些大型语言模型在这种基础任务变成智了。

 

研究人员在研究中写道从视觉输入中解读时间并进行推理的能力,对于许多现实世界的应用至关重  从事件安排到自动驾驶系统等领域皆是如此。尽管多模态大语言模型MLLMs)取得了进展,但大多数研究工作都集中在目标检测、图像描述或场景理解等方面,对时间推理的探索仍不够充分

 

本次测试的对象包 OpenAI  GPT-4o  GPT-o1、谷 DeepMind  Gemini 2.0Anthropic  Claude 3.5 SonnetMeta  Llama 3.2-11B-Vision-Instruct、阿里 Qwen2-VL7B-Instruct、以 ModelBest  MiniCPM-V-2.6。研究人员向这些模型输入了不同的模拟时钟图片(这些图片中的时钟或带有罗马数字、或有不同的表盘颜色,有些则没有指针)、以及十年来的日历图片等。

 

img2

 

向这些大模型上传时钟图片的同时,还会提出问题:上传图片中的时钟显示的时间是多少?而对于日历的图片,研究人员则会提出一些简单的问题,比如:元旦是星期几?以及一些较难的问题,诸如:一年中的 153 天是哪一天?

 

读取模拟时钟的时间和理解日历涉及到复杂的认知步,研究人员解释说这需要进行精细的视觉识别(例如,时钟指针的位置、日期单元格的布局),以及不简单的数值推理(例如,计算日期偏移量

 

总而言之,这AI模型的表现很不理  它们正确读取模拟时钟时间的概率不 25%。研究人员表示,无论是带有罗马数字和风格化指针的时钟,还是没有指针的时装,它们的表现都不甚理想。

 

在最终的测试结果中,谷歌Gemini 2.0 在时钟测试中表现 好, GPT-o1 在日历任务上准确率 80%  比竞争对手都要好。这也意味着 即使最出色的AI大模型,错误率也高 20%

 

这项研究的共同作者、爱丁堡大学信息学院的博士 Rohit Saxena 在一份学校声明中表示大多数人从小就会看时间和日历。我们的研究结果凸显 AI 在执行对人类来说相当基础的技能方面存在的显著差距。如果要 AI 系统成功集成到对时间敏感的现实世界应用中,比如日程安排、自动化和辅助技术等领域,就必须解决这些不足

 

所以AI 或许能够帮你完成家庭作业,但别指望它能按时完成任务,至少现在还是这样。

 

 

 

(蜂耘人工智能网 责任编辑:行云)

2025-03-18 09:28

广告

来源:站长之家
如今,人工智能能够生成栩栩如生的图像、写小说、帮你完成家庭作业,甚至还能预测蛋白质结构。然而,一项新的研究却表明,它在一项非常基础的任务上常常栽跟头 —— 看时间。

声明:凡来源标明“蜂耘网”的文章版权均为本站所有,如需转载请务必注明出处,违者本网将追究相关法律责任;所有未标明来源为“蜂耘网”的转载文章目的在于传递更多信息,均不代表本网立场及观点,“蜂耘网”不对这些第三方内容或链接做任何保证或承担任何责任;如涉及版权等问题,请在内容发表之日起一周内与本网联系,否则视为放弃相关权利。

所有评论仅代表网友意见,与本站立场无关

最新资讯

推荐阅读

热门排行

1、

2、

3、

4、

5、

6、

7、

8、

专题推荐

人物访谈

  • 坚定扛牢“走在前、挑大梁”的使命担当(权威访谈·谋发展 启新篇)

    来源:人民日报
    2024年,山东经济社会高质量发展取得积极成效。新的一年,作为经济大省的山东如何坚定扛牢“走在前、挑大梁”的使命担当?如何全面贯彻落实中央经济工作会议精神,奋力推动经济社会高质量发展?记者采访了山东省委书记林武。

    54 2025-01-21
  • 一文了解查理·芒格:为什么他是巴菲特最推崇的人

    来源:
    ①巴菲特写道,“如果没有查理的灵感、智慧和参与,伯克希尔-哈撒韦公司不可能发展到今天的地位”;
    ②芒格曾表示,“如果世上未曾有过查理·芒格这个人,巴菲特的业绩依然会像现在这么漂亮 ”
    ③两周前,芒格还公开在节目中维护93岁的老友巴菲特。

    212 2023-11-29
  • 面壁者,拉里·佩奇

    来源:中欧商业评论
    这两年,硅谷钢铁侠埃隆·马斯克在社交媒体上口无遮拦,这为他的公司引来了铺天盖地的负面新闻,然而,他的好友、谷歌联合创始人拉里·佩奇却因为看不到人同样被媒体炮轰多时。他已经在公共视野中消失太久了。

    340 2022-06-15

会议活动

微信公众号

广告

相关新闻