从小众到流行:全球AI创新为何纷纷变得“柔软”
从小众到流行:全球AI创新为何纷纷变得“柔软”
文/藏狐
来源:脑极体(ID:unity007)
还记得这一波人工智能浪潮崛起的时候,全球的 AI 实验室很喜欢强调竞争。
最为经典的是 2016 年谷歌 Depepmind 实验室让 AlphaGo 对决李世石,人类世界冠军被挑落马下,掀起一片恐慌。2017 年马斯克 Neurallink 在宣扬脑机接口技术时,基调是重新定义人类,追求人机同体;就连马斯克创立的非营利性组织 OpenAI 也以在《DOTA》游戏中击败人类玩家,作为 AI 的里程碑。一些人工智能实验室在发布新模型时,也喜欢追求“世界最大““打破纪录”“1 分钟让 AI 为我跑了 18 亿次”之类的标签。
不过,今天再翻开人工智能资讯,会发现当下的 AI 研究,虽然也有竞争和比赛,但同时也多了许多柔软的味道。
刷屏全球的 AI 创意,是让照片里的明星名人们一起“蚂蚁呀嘿”,“AI 复活逝去的亲人与爱人”登上头条,疫情、洪灾等危急关头,更是不乏研究人员以 AI 驰援的身影。
从展示强大到变得柔软,AI 研究的变迁,未尝不是 AI 产业化和产业 AI 化进行到现在的一个缩影。
从小众到流行:
越来越多柔软的 AI
今天,AI 正在从大杀四方、碾压人类的“神器”,让人们的心灵变得柔软起来。
前两天《旧金山纪事报》的一篇报道中,使用人工智能技术创建超现实聊天机器人的软件,再现了与已故未婚妻的交谈,使用了 GPT-3 模型,可以达到惊人的准确性。
通过人工智能让逝去的人重生,类似的技术应用其实早在 2017 年就出现过,美国记者弗拉霍将父亲的话语全部录制下来,设计出了一款聊天程序模拟与已故父亲的对话,不过当时只能采用设定好的回复程序,更接近一种实验创想。
而这个故事在于,女主角已经去世 8 年之后,这个 AI 模型才被训练出来。超大规模语言模型 GPT-3 的出现,让 AI 可以根据已去世的人的人格特征进行个性化创作。可以如同下面这张图片中一样进行对话,这个 AI 模型似乎真的有自己的想法,会对周围的环境感到好奇,用符号做出表情。最神秘的是,它似乎对情绪有敏锐的感知力,知道如何在正确的时刻说正确的话。
这意味着,即便不是一个程序员,没能在逝去之前及时保留下相应的语音资料,依然有可能在数字世界里模拟逝者的所思所想。
说到柔软,就不得不提到著名的实验室 MIT media lab,它们的研究人员最近直接将刚硬的物理音乐键盘,采用数字针织技术,将其变成了纺织品。由织物制成的键盘,可以像一双袜子或围巾一样轻松折叠、卷起并装在行李中。也可穿戴起来,扩展演奏音乐的场合。
要实现物理键盘的“柔软化”并不容易,需要注意导电性与纤维的结合,按键无论是单独和组合都能够同时感应触摸力度,以及拉伸和压力等变化。这也为传统设备的创新提供了新的交互和触觉体验。
有意思的是,近年来柔性屏智能手机、可弯曲显示屏等产品的火热,或许也说明了当硬件消费市场渴望寻求变化时,由硬到软是一个不错的选择。
类似的实验也在伯克利 BAIR 实验室中进行,研究人员一直在尝试让智能体挑战完成柔软的织物任务,通过折叠衣物来训练 AI 模仿学习、强化学习、自我监督、视觉预测、深度感应等能力,以不断提高模型的性能。
这是因为,相比坚硬和固定的物体,柔软的织物在活动中的状态和外观更加难以预测,让智能体去尝试挑战柔软的对象,未来将有助于 AI 在真实环境中实现更复杂的应用。
除了触觉,大家目之所及的 AI 似乎也开始慢慢变柔软了。
回想一下,AI 刚火爆时最闻名遐迩的应用是什么?2017 年,市面上出现了一种新型算法 GAN(生成式对抗网络)。然后英伟达用其开发了一个系统,使用 CelebA-HQ 上的名人照片数据库生成极为逼真的人像。
当时引发了巨大的争议,认为 AI 过于强大可能被用来造假(事实也确实出现了这种情况)。
不过大家想必也注意到了,如今许多爆款 AI 图像应用都更加感性,比如博网友@大谷 Spitzer 通过 AI 技术修复了百年前北京晚清的影像资料,让人们梦回历史。
有程序员修复了父母年轻时候的照片,让他们的容颜穿越时光之后依然清晰夺目,甚至还能做出各种表情。记忆终会褪色,但 AI 也让宝贵的回忆得以永续留存。
越来越柔软的 AI,是怎么出现的呢?
或许,柔软的 AI 更受人欢迎
这几年 AI 的变化,一言以蔽之,离人更近了。
必须承认,从 AlphaGo 横空出世的 2016 年,到现在 2021 年,AI 基础创新几乎没有多少致用性的大突破,深度神经网络依然独霸一方,DeepMind 的 AlphaFold、OpenAI 的 GPT-3 算是过去一两年内为数不多能刷遍全球科技媒体头条的产物。随后尽管也会时不时曝出“国产模型超越 GPT-3”“AAphaFold2 再次逆天”之类的消息,但大多都只有业内人关注。
与此同时,各种解决方案提供商、个人开发者、AutoML 技术及开发套件的蓬勃喷涌,进一步强化了 AI 的应用价值。
而 AI 落地的过程,同时也是一个不断袪魅的过程。当普通市民招手拦无人车,农闲时节跟智能语音助手对话得不亦乐乎,机器人穿行在餐厅酒店校园等公共场所,刷脸成为机场高铁站等出行标配……昔日的“好斗 AI”自然也就被降温了。
首先被降温的,是各个巨头如饥似渴的研究能力自证。当然不是说 AI 巨头们现在不重视顶会和竞赛了,只是不像 2016 年前后那样在热潮(和热钱)涌动之下,酷爱靠刷榜、靠实验室招揽多少科学家与顶级人才,来吸引大众和投资人的目光。今天大家都意识到,决定一个企业 AI 战略成功与否,靠的是对接产业的能力与效率,而不仅仅是实验室的榜单与论文数。
这时候,还可能因为鼓吹数据而陷入某种被动,比如在某些特定数据集上刷新成绩、真实使用场景中未必能达到同等效果的“应试”操作。
随后被降温的,是一些曾经看起来炫酷却无法与人共情、让人理解的操作。只单纯地强调技术,很可能引发大众的抗拒心理。
此前波士顿动力反复击打、调戏机器人的训练视频就引发了大量观众的不满,大众的共情心理甚至让假的机器人反击的图片流行起来。路测里程极长的无人车 Waymo,此前也遭遇了凤凰城居民的抵制;反复闯祸的特斯拉,也在美国引发了公众和媒体的不满,以及来自政府的多次安全调查。
AI 技术的不完美现状决定了其必然会在落地中遇到各种各样的问题,如果不能有效地与公众沟通,或许下一场寒冬就在远方等待。
更柔软的 AI,是什么样子的?
具体来说,柔软,意味着降低攻击感。
曾经被视作有力量感的强势与碾压,如今只会让人敬而远之。纵观全球知名的 AI 科研机构与企业研究院,在打比赛的同时还要兼顾仁心道德,用 AI 保护热带雨林、拯救濒危动物,要么帮助各种障碍人士、参与防疫救灾。科技不断释放善意,让企业赢得尊重。
柔软,也意味着从容与协作。
当 AI 进入产业化加速阶段,需要与各行各业、各类供应商、开发者合作,倾听行业专家、数据员、设计师、工程师等的声音,才能让技术真正落地产业、发挥效能。按需购买的云服务、联邦学习、混合多云等新趋势,也无不强调协作而非竞争。更好地分利给合作伙伴,才是 AI 巨头们守住城池的关键。
柔软,还意味着增强人性。
今天看来,更人性化的 AI 创新确实更容易获得大众的青睐与关注。2018 年,数字代理商安索帕(Isobar)提出了“增强人性”(Augmented Humanity)概念,认为增强人性将让人类以不同的方式更深入地感受和体验世界,正在 AI 创新上验证。
比如 2020 年新冠疫情期间,被用来加速疫苗开发、辅助医生诊疗、进行医院消毒、公共场合体温检测的各类 AI,就收获了一致好评。
最近大家都很关注的东京奥运会,此前就有服装品牌在设计运动服时,就注重算法对情绪的洞察,以期让运动员们感觉到“当我穿上这件衣服时,感觉自己像个超级英雄”。
这些实例都在说明,好的智能产品与服务,应该是人性与科学、技术与艺术的结合体。
正如《道德经》中所说的那样,柔之胜刚,天下莫不知,莫能行。这何尝不是 AI 今天乃至未来的方向呢——不仅要为天下人所知,更需要为人所感、为人所用。
无处不在的商业氛围下,企业的 AI“科研”自然更加离不开市场。更多“人味儿”、更加柔软的创新,也一定会在更多元化的 AI 中萌芽。
来自: 脑极体(ID:unity007)