科技行业资讯门户

广告

广告

广告

广告

广告

黑客入侵OpenAI,细节一年后才公开,三类数据资源让AI公司成为活靶子

【蜂耘网  IT业界】OpenAILeopold Aschenbrenner,最近在一档播客中暗OpenAI曾被黑客成功入侵。随后,《纽约时报》对这次攻击进行了更详细的报道。

 

2023 年初,一名黑客成功入侵 OpenAI 的内部通信系统,并进入了内部员工的在线社区,平台中包含公司最新人工智能技术的讨论。

 

2023  4 OpenAI 的高管向员工和董事会披露了这一事件,但由于没有客户或合作伙伴的相关数据被泄露OpenAI决定不将其公之于众。领导层认为,黑客是一个独立的实体,与任何外国政府都没有关联,因此他们没有让执法部门介入。这也引发了人们OpenAI透明度的质疑。

 

虽然OpenAI强调在这起入侵事件中,没有泄露任何用户的对话或个人信息。然而,这次黑客攻击本身给人带来的不安还只是表面性更重要的提示是AI公司已经迅速成为黑客们最有吸引力的目标之一。

 

任何安全漏洞都不应被轻视,尤其是窃听内OpenAI开发讨论确实有巨大的价值。但这远非黑客的全部目标:获取内部系统、研发中的模型、秘密路线图等等   

 

事实上,这AI公司已经成为庞大数据的守门人。

 

OpenAI和其AI公司创建了海量的数据,最值得被黑的莫过于:高质量的训练数据、大量用户互动及客户数据。

 

 1.高质量的训练数据 

 

目前尚不清楚它们拥有哪些训练数据,因为这些公司对它们的数据库进行了严格保密。

 

但认为它们只是大量收集的网络数据是错误的AI公司确实使用网络爬虫或Pile这样的数据集,不过要将这些原始数据塑造成能够训练GPT-4o这样的模型所需的数据,需要大量的人工工这只能部分自动化。

 

一些机器学习工程师推测,在创建大型语言模型(或任何基Transformer的系统)时,最重要的因素之一是数据集的质量。这就是为什么TwitterReddit上训练的模型永远不会像在上个世纪的所有出版作品上训练的模型那样雄辩。(也可能OpenAI据称使用了在法律上有争议的数据来源,如版权书籍,他们声称已放弃这种做法。)

 

因此OpenAI构建的训练数据集对竞争对手来说具有巨大的价值,无论是其他公司、对手国家还是美国的监管机构。

 

 2.用户互动数据 

 

更有价值的也许OpenAI拥有的大量用户数  大约数十亿ChatGPT进行的对话,涉及数十万个主题。

 

就像搜索数据曾经是理解网络集体心理的关键一样ChatGPT现在触及的人群也许没有谷歌用户那么广泛,但提供了更多的深度。(如果你不知道,除非你选择退出,否则你的对话正在用作训练数据。          

 

img1

 

为所有用户改进模时,对话会进入训练数据          

 

例如Google上搜的频率增加,则说明该市场正在升温。但这些用户接下来不会告诉谷歌:他们想要什么、愿意花多少钱、他们的家是什么样子、他们想避免的制造商等等。

 

但你知道这是非常有价值的信谷歌正试图通过AI交互替代搜索来获取这些信息!

 

想想人们ChatGPT的对话有多少,以及这些信息对开AI的人员、市场团队、顾问、分析师来说有多有用,这是一座金矿。

 

 3.客户数据 

 

最后一类数据可能是开放市场上价值最高的:客户实际如何使AI,以及他们自己向模型输入的数据。

 

数百家大公司和无数小公司使用OpenAIAnthropicAPI这样的工具,执行同样广泛的任务。为了使语言模型对他们有用,通常需要在它们自己的内部数据库上进行微调或以其他方式提供访问权限。

 

这可能是一些乏味的旧预算表或人事记录(例如,使它们更易搜索),也可能是未发布的软件代码。他们如何利AI的能力(以及它们是否真的有用)是他们的事,但事实是AI提供商有特权访问,就像其他任SaaS产品一样。

 

这些都是工业机密,AI公司突然间就处在这些机密的核心位置。这个行业的新奇性带来了特殊的风险,因AI流程尚未标准化或完全理解。

 

像任SaaS提供商一样AI公司完全有能力提供行业标准的安全性、隐私性、本地选项,并且通常会负责任地提供服务。我毫不怀OpenAI的财500强客户的私密数据库API调用是严密锁定的!他们肯定对AI环境下处理机密数据的风险非常了解。OpenAI没有报告此次攻击是他们的选择,但这并未增加一个急需信任的公司的信任。)

 

但良好的安全措施并不会改变它们所保护的东西的价值,也不会改变恶意行为者和各种对手正在试图闯入的事实。

 

安全不仅仅是选择正确的设置或保持软件更尽管基础的举措也很重要。

 

 4.写在最后 

 

黑客与公司数据之间,是一场永无止境的猫鼠游戏,讽刺的是,现在这场游戏正AI本身大大加速:代理和攻击自动化程序正在探查这些公司每一个角落和缝隙的攻击面。

 

我们没有理由惊拥有大量个人或商业价值数据的公司多年来一直面临并管理着类似的风险。

 

AI公司代表了一个更新、更年轻、潜在更有吸引力的目标,比你常见的配置不良的企业服务器或不负责任的数据经纪人更具吸引力。即使是像上面报道的那样的黑客攻击,据我们所知没有严重的数据泄露,也应该让任何AI公司有业务往来的人感到担忧。

 

OpenAI们已经在自己背上标上了靶子。当任何人,甚至所有人,试图攻击他们时,不要感到惊讶。

 

参考链接:

1.     https://techcrunch.com/2024/07/05/openai-breach-is-a-reminder-that-ai-companies-are-treasure-troves-for-hackers/

 

(蜂耘IT业界网    责任编辑:九言)

2024-07-16 10:32

广告

来源:51CTO
前OpenAI员工Leopold Aschenbrenner,最近在一档播客中暗示OpenAI曾被黑客成功入侵。随后,《纽约时报》对这次攻击进行了更详细的报道。

声明:凡来源标明“蜂耘网”的文章版权均为本站所有,如需转载请务必注明出处,违者本网将追究相关法律责任;所有未标明来源为“蜂耘网”的转载文章目的在于传递更多信息,均不代表本网立场及观点,“蜂耘网”不对这些第三方内容或链接做任何保证或承担任何责任;如涉及版权等问题,请在内容发表之日起一周内与本网联系,否则视为放弃相关权利。

所有评论仅代表网友意见,与本站立场无关

最新资讯

推荐阅读

热门排行

1、

2、

3、

4、

5、

6、

7、

8、

专题推荐

人物访谈

  • 一文了解查理·芒格:为什么他是巴菲特最推崇的人

    来源:
    ①巴菲特写道,“如果没有查理的灵感、智慧和参与,伯克希尔-哈撒韦公司不可能发展到今天的地位”;
    ②芒格曾表示,“如果世上未曾有过查理·芒格这个人,巴菲特的业绩依然会像现在这么漂亮 ”
    ③两周前,芒格还公开在节目中维护93岁的老友巴菲特。

    124 2023-11-29
  • 面壁者,拉里·佩奇

    来源:中欧商业评论
    这两年,硅谷钢铁侠埃隆·马斯克在社交媒体上口无遮拦,这为他的公司引来了铺天盖地的负面新闻,然而,他的好友、谷歌联合创始人拉里·佩奇却因为看不到人同样被媒体炮轰多时。他已经在公共视野中消失太久了。

    238 2022-06-15
  • 百岁中科院院士文圣常逝世!被誉为我国海浪研究的“点灯人”

    来源:南方都市报
     3月21日上午,中国海洋大学发布讣告,中国科学院院士、著名物理海洋学家、该校教授文圣常,因病医治无效,于3月20日15时37分在山东青岛逝世,享年101岁。

    281 2022-03-21

会议活动

微信公众号

广告

相关新闻