马斯克硬刚OpenAI,用户惨遭池鱼之殃
只听说过社交媒体想方设法让用户多停留的,没听说过主动给人加个上限的。如今开眼了,埃隆·马斯克正在给所有推特用户加“未成年人保护”,而这一切,居然是被AI逼的?
如今推特用户每天最多能浏览多少推特,不取决于手速或者舍不舍得熬夜,而是有一个明确的数字:已验证(也就是付费的“蓝鸟”服务)账户10000条、未验证账户1000条,而新注册的未验证账户只有500条。
就这,还是马斯克面对愤怒的用户,两次提高后的标准。至于原因,是“为了解决极端水平的数据抓取和系统操纵问题”。
(资料图片)
他指的正是AI公司们,为了训练模型,这些企业需要大量数据作为喂养的饲料。去年12月,马斯克切断了与OpenAI的数据联系,今年4月又指责微软非法使用推特的数据。
在马斯克为阻止数据抓取采取激进措施的同时,OpenAI正在面临一项集体诉讼。诉讼的原告有16名,都是个人,换句话说,都是普通的互联网冲浪人。他们指控OpenAI秘密地“从互联网抓取了3000亿字词”,未经允许从互联网那个用户那里窃取“大量私人信息”,以培训ChatGPT。
一边是互联网用户和多年来积累大量UGC内容的平台,另一面是新兴的AIGC企业,一场围绕数据抓取、隐私安全的战争已经打响。
A
周五周五,敲锣打鼓。好不容易要周末了,推特的用户却傻了,屏幕上显示报错信息,提醒其已经超过了“速率限制”,违反了推特的规则,查看了过多推文。
人们压根不知道这是什么意思,推特老板马斯克站了出来,表示的确是有速率限制,而且宣布:为了解决极端水平的数据抓取和系统操纵问题,已验证、未验证、新注册未验证账户每天的浏览上限是6000、600和300条推文。
在此之前,马斯克刚宣布推特开始禁止未登录的用户浏览内容,用户尚且能接受。限制实锤,用户麻了,继而看着这验证与否的区别对待,眉毛挑起来了:你个老六该不会是想用这招推行“蓝鸟订阅”吧?在评论区,不止一位用户评论:“现在得用钱制胜了?”
不满的声音很大,推特的竞品Hive、Mastodon、Tumblr等出现在热门话题里,一张推特墓碑的梗图被大量使用。争议声中,马斯克两次提高标准至验证用户10000条浏览、未验证用户1000条。
一个马斯克的高仿号调侃道:“我设置限制,是因为你们这些推特成瘾者需要出去走走。我这是在为世界做好事啊”。这种上价值的思路好,马斯克反手就是一个转发,自己还单独发了条“去拜访下你的朋友和家人吧”。
不过玩笑归玩笑,马斯克为自己的这次“测试”给出了明确的解释:应对数据爬取。用户的不满,也在于限流的做法是否有效,而不在数据爬取的问题上。
AI初创公司跑来推特“扒数据”的情况有多严重呢?马斯克在一条推文中说,流量激增,推特不得不启用备用服务器:“在紧急情况下启用大量在线服务器,仅仅是为了给某些AI初创公司高得离谱的估值帮忙,这太令人恼火了。”
在限流风波的前一天,Epic Games的CEO蒂姆(Tim Sweeney)还发推抱怨推特也在建墙,马斯克回复:“数百个(甚至更多)阻止正在极其激进地爬取推特数据,到了影响用户体验的地步。我们应该怎么做?我对所有想法都保持开放。”
刚才还在抱怨的蒂姆,很快就给出了认真的建议,如在推特的服务条款中加入禁止数据爬取、以信息安全工程保护平台,以及针对大规模滥用推特的公司采取法律行动。
值得注意的是,马斯克在回复中提到,“绝对”会对那些窃取数据的人采取法律行动:“(乐观地说)从现在起2到3年,期待在法庭上看到他们。”
不管“为付费订阅添柴”的猜想是不是以小人之心度了马斯克之腹,马斯克高举用户隐私大旗之外,多少有可能抱有私心。4月,马斯克被传出成立X.AI新人工智能公司,要对抗ChatGPT。如果真的要训练大语言模型,推特的用户数据,当然是只给自己用最好。
不论如何,主动给平台限流都做得出来,马斯克已经做好准备,要和AI初创公司们硬刚到底了。
B
就在马斯克重拳出击给全平台限流的时候,这场AICG热潮的“始作俑者”、ChatGPT的造物主OpenAI,正卷入一场集体诉讼中。
这起诉讼在美国加州北区地方法院发起,原告16人,均为匿名,均为个人。诉状很长,足足有157页,以斯蒂芬·霍金的一句话作为开头:“强大人工智能的崛起,要么是人类有史以来最好的事,要么是最糟的。”被告除了OpenAI,还有为其注资上百亿美元的微软。
核心指控是,ChatGPT使用从互联网上收集的数据来“训练其技术”时,侵犯了“无数人的版权和隐私。”
起诉书中称,OpenAI从互联网上秘密抓取3000亿字词,窃听了“书籍、文章、网站和帖子,包括未经同意获得的个人信息”,违反了隐私法。其中就提到了OpenAI爬取大量网络数据,包括社交媒体中的数据。
他们还指出OpenAI有个专有AI语料库,积累了大量个人数据,包括从Reddit帖子及其链接到网站中获取的数据。
这是训练模型方面的指控,此外,原告还称用户与OpenAI的产品的互动、在产品中的私人信息,也都被OpenAI非法访问、大规模盗用。
这已经不是OpenAI第一次在美国面临集体诉讼。去年11月,就有Github程序员对Github、OpenAI和微软发起集体诉讼的事件,指控OpenAI涉嫌违反开源许可,使用他们贡献的代码训练专有AI工具GitHub Copilot。
彼时ChatGPT还没有上线,如今回头看,AI训练的问题那时就已经暴露。如今,最新的集体诉讼针对的是用户更为广泛、被侵犯人群也更加广泛(基本上就是全员受害)的ChatGPT,更重要的是,在AIGC的狂潮之下,任何法律先例都可能影响未来。
代理该案的克拉克森公益律师事务所(Clarkson)在一封声明中,将这次的集体诉讼称作“里程碑式”的联邦案件,是对整个人工智能的警告。
从这个角度看,OpenAI肩上的担子的确很重。
OpenAI因数据抓取和隐私安全已经惹上诸多麻烦,平台上锁、用户翻脸都只是冰山一角。
在欧洲,OpenAI已经遭到了多个国家的调查,甚至在今年4月,意大利担心ChatGPT会违反欧洲数据保护法,暂时封禁过ChatGPT。
针对整个人工智能领域的监管正在推进。法国于5月推出人工智能行动计划,其中在AIGC方面,法国隐私监管机构特别关注一些AI模型从互联网上搜集数据、建立数据集,用来训练大语言模型的做法。
最重磅的是欧盟人工智能监管法案(EU AI Act),目前已经走向收尾阶段。该法案将有可能成为全球AI治理的范本。
C
平台、用户、监管,三股力量已经形成合围之势,誓要尽早给AIGC立立规矩,并且要从大模型训练这个起点开始。
一方面,时间紧迫,AIGC发展得太快。
马斯克说“估值高得离谱的AI初创公司”指的是谁,咱也不知道。但这话一出,中箭的确实不少,毕竟现在AIGC领域融资一波接一波,全是热钱。
在初创公司里,OpenAI估值近300亿美元,融资总规模113亿美元,是AIGC里最有钱的;然后是Anthropic,第二有钱,估值超过40亿美元。而前几天才以13亿美元融资震惊硅谷的Inflection,估值也已经有40亿美元,而它成立不过一年多。
大的可能还在后头。Inflection用的是自家的大语言模型,这次13亿美元到手,宣布要搞2.2万张英伟达H100芯片,做全球最大的人工智能集群。如此大规模算力,目标参数量和数据集势必也是惊人的。
另一方面,ChatGPT横空出世,等它暴露出问题时,想“修补”并不是那么容易。OpenAI的几代大语言模型,GPT-2数据集有40GB文本,GPT-3(也就是ChatGPT发布时用的模型)训练数据有570GB,至于今年才发布的GPT-4,数据集大小压根没透露。
海量的数据并没有从一开始就做好记录。谷歌前研究科学家尼西亚·桑巴斯万曾在采访中表示,科技公司不会记录它们是如何收集或注释AI训练数据的,甚至不知道数据集中到底有什么。
木已成舟的ChatGPT就像一个黑匣子,而且是一个打造在密室里的黑匣子,如今要做透明化、隐私保护,比如罗列到底爬取了哪些数据、阐释使用过程中会如何使用这些数据、应用户要求删除某条数据,其实很难。
互联网冲浪人和监管死咬OpenAI们,还有一个不容忽视的原因——在社媒发展壮大的那些年,对个人网络数据保护的意识还在襁褓中,待要抗衡时,发现已错过太远。
当扎克伯格2018年首次坐上国会听证席时,他的社交媒体平台Facebook已经推出了14年。彼时Facebook身陷“剑桥丑闻”,公司首席技术官称有8700万用户受影响。那也是一次因数据抓取酿成的大错。
等到今年5月阿尔特曼坐上美国国会听证席,议员频频表达着在社媒时代行动不足的悔恨,意思很明了:这一次,就算不能超前,也至少要跟上AIGC的脚步。
一个接一个的大模型仍然在训练当中,数据抓取是一根线头,攥住它才有望理清AIGC的糊涂账。
参考资料:
1、新浪科技:《马斯克跟微软杠上了?Twitter称微软非法使用其数据》
2、黑马程序员:《这些程序员把GitHub告了!要求索赔649亿》
3、界面新闻:《欧盟AI法案出炉,OpenAI等公司可打几分,核心争议点有哪些?》
4、腾讯科技:《对数据的渴求正反伤OpenAI?多国指控其违反数据保护法》
5、网易科技:《ChatGPT在意大利恢复上线 但OpenAI的监管麻烦才刚刚开始》
标签:
推荐
- 马斯克硬刚OpenAI,用户惨遭池鱼之殃
- 美国国庆假前航班大面积延误 政府航司各有说法|全球时讯
- 大写的六为什么是陆(大写的六)
- 每日聚焦:苏震清之子参选 苏清泉证实谈非绿联盟
- 突发大消息,暴涨30%!什么情况?保健品龙头崩11%!股吧炸了
- 深圳市首次公开招标投放共享单车 美团、哈啰等企业表示将应标
- 全球简讯:老师用漂亮的脚搓球
- 赣东中心与上饶市龙翔船员培训学校达成船员培训合作 微资讯
- 万能空调遥控怎么设置代码(万能空调遥控器怎么调代码) 全球看点
- 焦点资讯:金鸡叫天都图片_黄山金鸡叫天都
- 【天天报资讯】汽车知识解答柴油车提不起速度无力是什么原因?
- 多所高校宣布:恢复!
- 纪念张国荣64岁生日_纪念张国荣64岁生日
- 意媒:利雅得青年人将为伊卡尔迪报价2000万欧,提供4000万欧年薪_要闻
- 天天即时看!600777股票怎么样 600477怎么样
- 黄百韬最后怎么了_黄百韬的最后结局
- 最优化计算机原理与算法程序设计(关于最优化计算机原理与算法程序设计介绍)|世界快播
- 【世界速看料】燕京啤酒代言人 燕京啤酒董秘办回应蔡徐坤事件影响 基本情况讲解
- 焦磷酸钠有危害吗(焦磷酸钠) 天天快消息
- 温网发布新禁令!禁止在俄罗斯和白俄罗斯出售温网周边商品
- 天天讯息:湖北省公路学会官网网址_湖北省公路学会官网
- 天天头条:中国电建(601669.SH):“十四五”期间计划核准抽水蓄能项目219个,开工目标达2.7亿千瓦
- 【天天速看料】美独立日假期变 “血腥周末” 大规模枪击致2死,数十人受伤
- 气海灸 关于气海灸介绍-全球新动态
- 中超控股:预计上半年归母净利润2.02亿元–3.02亿元 同比扭亏_环球播报
- 5月第三周走访活动
- pptv破解软件_pptv加速器
- 穆迪:中国钢铁行业的集中度正逐渐提升
- 株洲市一中是省重点吗(株洲市一中是公办还是民办)
- 环球百事通!6月上海新建住宅成交面积创年内新高 4个单价超十万元新盘将入市
- 搭建高层次人才培养平台 嘉博文博士后科研工作站正式授牌
- 好看的十部泰剧推荐 不用带脑子看的四部泰剧
- 首次发售|四缸动力|即将在国内上市,售20万元以上宝马M 1000 R-世界热讯
- 贾生王安石_贾生
- 环球观察:安徽合力股盘中创历史新高
- 蓉火相传,工商银行与成都大运会同行 环球热闻
- 一级建造师报考入口2023_全球最资讯
- 两岸百余名专家学者福建东山共话关帝文化新融合-环球热点
- 环球热议:闫瑞祥:黄金短期向上修正,后续关注恢复下跌
- 环球热讯:孙正义“踩雷”!知名社交平台突然倒闭:2000万用户95%是机器人!曾号称“脸书劲敌”,估值超80亿…
- 宁高宁:企业家如何应对复杂变局|中企荐读
- 安全宣传进校园 金山区为暑假学生安全保驾护航 天天热议
- 咸宁市终止气象灾害(暴雨)三级应急响应
- 徐家汇7月3日快速上涨
- 高效完成!电力服务“加速度”,助推重大项目早投产 全球热推荐
- 每日热文:兆讯传媒6月13日盘中涨幅达5%
- 【天天速看料】从“法律进村”到“法治在村”
- 复合集流体商业化加速 在新能源领域应用前景广阔 世界报道
- 与别人交谈时,少说自己的这三件事,福气会越来越多
- 今年最流行的毛衣领带打结方法,4种毛衣图案,漂亮简单又独特
- doremifasolasido怎么读_doremifasolasido发音
- 资讯:汤姆猫:后续有望植入更多来自TikTok海外广告平台的广告
- 荣耀x40max上市时间官方消息(荣耀x40max是曲屏的吗)
- 江西封闭式学校有哪些 江西哪些封闭式的学校比较好
- 话筒怎么连接电脑音响_话筒怎么连接电脑
- 重庆少年军事管理学校 什么是重庆少年军事管理学校|天天最新
- 每日快播:集美新增一批停车位
- 侠盗飞车罪恶都市秘籍全部_侠盗飞车罪恶都市秘籍无限子弹和钱 世界简讯
- 土地使用权分为哪两类_土地使用权分几种 有什么区别-当前通讯
- 流星雨又来临歌词是什么意思_流星雨又来临歌词 全球快播报
- 《哥斯拉2》基多拉退隐江湖,魔姐魂魄还在,金刚需要打出情怀_环球观焦点
- 每日精选:欧洲运动员决赛!安赛龙争冠,男女双老将夺冠,羽球运动青黄不接
- 缅甸“Z世代”华裔走进云南迪庆爱上藏族文化|快看点
- 凰图腾历史原型_凰图腾大结局最后怎样了-焦点日报
- fold3 配件(fold3自带充电器吗)
- 360抢票王三代(360抢票三代)
- 当前关注:山上花开
- 2021年财神方位在哪个方位 2021年财神的方位在哪边 世界快播报
- 定兴心明医院有限公司
- 萱草聊戏 | 一场生动而生涩的表演——音乐剧《白夜追凶》
- 环球热点评!本色湾区人|7分01秒“港”新声
- 53岁“黑珍珠超模”娜奥米喜获二胎娃!晒宝宝照片,都没见她怀孕|热闻
- 莲菜怎么凉拌 ?教你超经典的凉拌脆藕在家也能做-新视野
- 焦点热门:“有一种叫云南的生活”亮相第八届西旅会
- 环球即时:百发百中类似成语都有一个什么共同点_百发百中类似成语
- 环球视点!香肠派对悬浮滑板刷新点位置攻略(内附最新兑换码)
- 西峰区多部门联合组织召开全区燃气安全专题培训会 全球新消息
- 世界热讯:突发!特斯拉官宣:现车大降价
- 每日简讯:高温黄色预警继续:京津冀局地气温可达40℃
- 全球速读:吉林体育学院2023年硕士研究生招生考试复试名单(一志愿)
- 当前视点!excel两列合并一列内容保留 excel两列合并一列
- 全球微资讯!拥有约7.3亿读者 135年历史的《国家地理》宣布:解雇最后一批专职撰稿人!
- 上海出口集装箱综合运价指数较上期上涨3.2%
- 卡尔文循环的三个阶段_卡尔文循环 世界速读
- 打开bin文件需要什么软件_BIN文件是什么文件啊|全球热点
- 6月30日基金净值:鹏扬中证500质量成长ETF联接A最新净值1.5281,涨0.62%
- 里氏硬度计哪个牌子好 硬度计哪个牌子好
- 谷歌浏览器卡顿怎么办?禁用浏览器插件加载项的方法
- 赫赫伟绩是什么意思啊_赫赫伟绩是什么意思相关介绍简介
- 每日播报!株洲市三三一医院:提振信心促发展 接续奋斗再前行
- 厦门大学嘉庚学费多少_厦门大学嘉庚学费
- 重庆脑与智能科学中心建成投用 将打造脑科学与类脑智能创新高地
- 视焦点讯!川观深度丨新突破!华西医院公布脑出血“组合管理方案” 当前已应用到临床
- 聘任廉政监督员 共筑廉洁“防火墙”_世界通讯
- 当前资讯!银行板块涨0.91% 无锡银行涨3.08%居首
- 最小的恐龙视频大全_最小的恐龙
- 深圳有楼盘一天揽金上百亿
- 中央气象台:湖南湖北安徽浙江等地将有强对流天气 今日看点
- 微信支付,为何惹毛多所高校? 每日速读
- YGM贸易公布2023财年年度权益分配方案_今日最新
X 关闭
行业规章
X 关闭