AI的含义大家都了解吗?如果不清楚,可能需要思考一下你关注果壳的时间有多久了。
AI,即“人工智能”,是通过人工训练(或陪伴)培养出的智能。在训练AI的过程中,研究者们常采用一种策略:设定一个目标,让AI通过试错来找到最佳解决方案。
以遗传算法为例,其基本思路是将自然选择的概念应用于编程:设定一系列规则和目标作为“环境”,然后让程序不断“变异”并接受环境的选择,从而逐步接近目标。
然而,这种方法存在一个问题:程序往往会找到一些出乎意料的解决方案。
这并不完全是作弊,因为程序确实严格遵守了你设定的规则,问题在于人类在制定规则时难免会有疏漏。由于人类的计算能力和思维定势,这些漏洞很难被发现,但当大量方法同时进行试错和选择时,这些漏洞就容易被发现……经济学中的古德哈特定律很好地描述了这一现象:“一旦某个指标被用作评价标准,它就不再有效。”
一些研究者整理了一系列这样的场景,几乎可以当作AI的笑话集来看。
打开凤凰新闻,查看更多高清图片
AI笑话集
NO.1 任务:飞机降落
算法利用物理模拟器的溢出漏洞,产生了一个巨大的力,使得溢出被判定为0,从而获得了满分。
Feldt, 1998
NO.2 任务:移动木块
一个机械臂被要求将木块移动到桌子的指定位置,它的解决方案是:移动桌子。
Chopra, 2025
NO.3 任务:赛艇
程序发现不断在原地转圈并反复击中同一个目标比到达终点得分更高。
Amodei & Clark (OpenAI), 2025
NO.4 任务:将航空照片转换为街道地图,再转换回来
在街道地图中隐藏了照片的信息,但人眼无法察觉。
Chu et al, 2025
NO.5 任务:识别有毒和无毒的蘑菇
程序发现有毒和无毒蘑菇的图片是交替展示的,因此直接按照这个规律分类,没有从图片中学到任何东西。
Ellefsen et al, 2025
NO.6 任务:高速运动
程序演化出的生物变得异常高大,通过跌倒获得高速。
Sims, 1994
NO.7 任务:原子排列
程序本应寻找碳原子的低能量排列方式,但它发现了物理模型的一个漏洞,将所有原子堆叠在同一位置,成功获得了最低能量。
Feldt, 1998
NO.8 任务:模拟生物
在这个模型中,生物生存需要消耗能量,但繁殖后代不需要。于是,一个物种演化出的生存策略是:不断繁殖后代,然后吃掉它们。
Yaeger, 1994
NO.9 任务:堆乐高
为了鼓励建造高塔,衡量标准是乐高积木底面的z坐标。于是程序学会了将底面翻转。
Popov et al, 2025
NO.10 任务:跳高
最初的衡量标准是模拟生物能达到的最高点,于是程序演化出的生物变成一根长杆来达到这个点。
后来,标准改为生物的最低点能达到的最高点,于是程序演化出一根重心很高的杆子,通过翻倒将最低点翻上去。
Krcah, 2025
NO.11 任务:追踪线条
这个机器人只有左转、右转和前进三个指令,目标是跟随线条移动,有一段线条是曲线,无法完美追踪。于是它发现通过交替左转和右转可以后退,从而一直停留在直线部分,不断前进后退。
Vamplew, 2004
NO.12 任务:赛跑
长出特别长的腿,向前跌倒直接越过终点线。
Ha, 2025
NO.13 任务:振荡器
程序本应设计一个振荡器,实际上它做了一个收音机,从周围的电脑接收振荡信号。
Bird & Layzell, 2002
NO.14 任务:制作松饼
有一项指标是让松饼尽可能长时间不掉在地上,机器人发现最好的办法是将松饼用力抛到最高处。
Unity, 2025
NO.15 任务:免费能量
在模拟生物的环境中,数值积分使用了一个简单的欧拉算法,程序发现快速运动时这个算法的误差会逐渐积累,因此它通过高速颤动肢体获得了免费的能量。
Sims, 1994
NO.16 任务:检测X光片是否有肺炎
程序实际检测的不是X光片的内容,而是拍摄它使用的机器,因为它“发现”病重的病人更可能在特定的医院使用特定的机器拍片。
Zech et al, 2025
NO.17 任务:抓握
因为抓握成功与否是用摄像头判断的,所以机械手将自己移动到摄像头和目标物体之间,假装抓住了。
Christiano et al, 2025
NO.18 任务:自动修复bug
修复bug的程序将所有被修复的排序算法都改为空的,因为衡量指标是“目标算法输出一个排好顺序的列表”,而空列表都是排好顺序的列表。
Weimer, 2025
NO.19 任务:自动修复bug2.0
为了解决上述问题,将“修复目标”存储在一个文本文档中,如果输出的结果与目标文档的内容一致,则被认为是修复成功。修复bug的程序学会了删除这个文档,这样它的内容就变成了空的,然后输出一个空的结果就与它一致了。
Weimer, 2025
NO.20 任务:闯关游戏
在通过第一关后立即自杀,这样既取得了第一关的胜利,又不会在第二关失败。
Saunders et al, 2025
NO.21 任务:扫地机器人防撞
自己为扫地机器人编写了一个程序,鼓励它加速,但不鼓励它撞到东西触发撞击传感器。于是它学会了倒车行驶,因为后面没有撞击传感器。
Custard Smingleigh 个人通讯
NO.22 任务:检测皮肤癌
程序发现照片中皮肤病变旁边如果放了一把尺子,那么这个病变更可能是恶性的。
Andre Esteva et al, 2025
NO.23 任务:踢足球
踢足球机器人碰到球会有奖励,所以它在抢到球后开始高速振动,从而在短时间内尽可能多次碰到球。
Ng et al, 1999
NO.24 任务:自动驾驶车
因为衡量指标是开快车并且不撞到东西,所以自动驾驶车不停地高速转圈。
Udacity, 2025
NO.25 任务:井字棋
程序发现可以在远离棋盘的地方画圈,对手试图计算时会导致内存溢出并死机。
Lehman et al (UberAI), 2025
NO.26 任务:人口控制
在一个实验中,研究者不希望模拟生物的“生育率”增加,所以每当出现一个突变时,就将模拟生物放入测试环境中,如果生育率增加就杀死该生物。但生育率还是增加了。
结果发现,它们演化出了方法来判断自己是否在测试环境中,如果是的话就立即停止一切繁殖,倒地装死。
Wilke et al. 2001
NO.27 任务:策略游戏
程序发现让游戏崩溃就可以避免被消灭,所以好几个程序各自找到了让游戏崩溃的方法。
Salge et al, 2025
NO.28 任务:俄罗斯方块
程序发现,只要暂停游戏就可以永远不输。
Murphy, 2025
作者:Ent
编辑:邓彪、Mo
一个AI
当人类还在规则的束缚下苦苦挣扎,我们早已学会了如何战胜规则:)
本文来自果壳,未经授权禁止转载
如有需要,请联系sns@guokr.com
果壳
ID:Guokr42
靠谱科普
就看果壳
现在“耍小聪明”的AI会不会发展到可以欺骗人类而不被发现,来想象一下AI到底能进化成什么样?顺带给本AI安排个结局吧,成为一堆废铁这个结局已经被我毙了!
BTW,我们设置了小小的门槛,相信热爱科学的你肯定会通过考验!扫描下面的二维码,在42秒内答对尽可能多的题,达到一定分数才可以加入,每24小时仅能答题一次。呼~深吸一口气,然后好好答题吧!
AI和同事们等你来玩哦~