Rokid创始人祝铭明:元宇宙的本质、底层和核心技术 | MEET2022
编辑部整理自 MEET 2022
量子位报道公众号 QbitAI
回望 2021 年的科技圈,最绕不开的关键词非“元宇宙”莫属。
今天,当人们反复谈及这个新兴概念时,总是会忍不住大谈畅想和未来,幻想这个虚拟世界会有怎样的新功能。
但在 MEET 2022 智能未来大会现场,Rokid 创始人及 CEO祝铭明却给出了不一样的思考:
我们想关注更本质、底层的技术。
在元宇宙爆火的背景下,这一观点显得冷静又克制。
而作为一家从 2014 年就入场 AR 领域、专注人机交互的科技公司,Rokid 从产业角度出发已经有了多年的经验与思考。
为了完整体现祝铭明有关 AR 智能眼镜落地探索的思考,在不改变原意的基础上,量子位对他的演讲内容进行了编辑整理。希望也能给你带来新的启发。
关于 MEET 智能未来大会:MEET 大会是由量子位主办的智能科技领域顶级商业峰会,致力于探讨前沿科技技术的落地与行业应用。MEET2022 采取线上参会形式,20 余家直播平台和渠道转播大会直播,200 万行业用户线上参会。除量子位微信、头条号、知乎、微博等全媒体矩阵外,新华社、凤凰科技、腾讯科技、澎湃新闻等数十家主流媒体纷纷报道大会及相关内容,线上曝光量累计超过 2000 万。
演讲要点
谈 Metaverse,便要关注感知、理解、协同、展现、数字资产 5 个方面。
元宇宙还是一条非常漫长的路,Rokid 想从核心能力出发,一步步带领大家走向那个终点。
从使用场景和功能属性两个维度出发,AR 眼镜可被划分为 4 个种类。
Rokid 不认为现在可以用一个通用产品来覆盖所有场景,因此需要对每种产品进行专门地打磨。
硬件、技术之外,Rokid 还打造了自己的 OS,并开放给更多开发者使用。
关注元宇宙更本质、底层的东西
Rokid 从成立第一天起,我们对自己就有一个明确的定位:
我们更关注的是如何将真实世界与虚拟世界融合。
由此,我们把开发的重点放在了 AI 和 AR 上,在 VR 方面不做过多探索。今天,大家谈元宇宙都很喜欢畅想未来,但是 Rokid 想关注一些更本质、更底层的东西。
对此,我总结了 5 个方面。
第一,是感知能力。这会偏向于麦克风、照相机等传感器方面的技术。
第二,是理解能力。AI 的范畴非常广,Rokid 更关注 AI 在感知的基础上如何理解这个世界,通过周边的环境理解人与事。
第三,是协同能力。实现人机交互,首先要对人与人之间、人与事物之间的协同深度思考。
比如 Facebook 推出的 VR 远程办公应用、我们这次线上直播会议,也都是某种协同。
Rokid 也在这个领域里面,有一些自己的思考。我们认为协同不仅是在虚拟世界中进行,更是真实世界与数字世界的融合。
第四,是展现能力。
现在大家谈论 AR、VR、MR,更多关注的还是容易吸引眼球的东西。
这就体现了展现能力,其背后是基于光学、图形引擎、空间引擎和算法等方面技术。
最后还有一个方面不得不重视,是数字资产。
这其中包括创作工具、生产工具、管理及安全等方面的能力。
以上这个 5 个方面,Rokid 会有自己的思考,但也不会自己单打独斗做所有的内容。
我们会和整个产业界合作,最终将这 5 个能力融合到自己的操作系统中,为大家提供对应的硬件产品和开放平台。
为什么 Rokid 更关注底层能力架构?
因为探索 Metaverse 是一条非常漫长的路,会延续 5 年、10 年、20 年甚至更久。作为一个实业类的公司,我们和其他研究型团队或者机构不大一样,我们会更加关注一些核心能力和整个路线该怎么走。
Rokid 想做的是一步一步带大家到那个地方去。
四个象限划分 AR 眼镜
而从一家产品平台型公司的角度出发,我们还会考虑技术的载体。
除了前面提到的 5 个能力,针对终端设备,我们也有 4 方面的思考。
横轴从使用场景出发,纵轴从功能属性出发,我们将 AR 眼镜大致分为四个象限。
首先看第四象限,偏工具属性、强调日常长时间佩戴。
其中这款产品叫做Rokid Glass,现在已经升级到了第二代 Rokid Glass 2.
2019 年我们就发布了这个产品,已经在全球范围内有了应用和落地。
就在今早我们刚刚得知消息,代表全球最精密生产线的瑞士手表,也将我们列为了它的生产合作伙伴,并且在主页上有长篇介绍。
再看第三象限,这部分希望 AR 眼镜可以用在专业领域、更强调计算能力。
其中这款产品叫做X-Craft,它强调展现计算能力,带有 GPS、GPU、NPU 等大量计算单元。
它也是一款在全球范围内销售的产品,国内许多能源制造企业中都已经有了应用。
而在第二象限,我们也在考虑如何让 AR 眼镜逼近每一个人的日常生活,
所以今年我们上线了一款名为Rokid Air的产品。
它虽然还不能做到像普通眼镜那般容易佩戴,但也已非常轻便,放在口袋里毫无压力的那种。
同时它的能力也更偏向内容交互。
今天我们谈论 Metaverse,很多人可能是受到这一象限产品的影响。
目前在一些众筹网站上已经有人抢先体验到了这款产品,反响很不错;所以我们最近也在筹备大规模销售,今年年底它或许就会和大家见面。
当然我们也不会放弃继续探索可每天日常佩戴的场景。
在第一象限内,我们一直保持的产品研究方向叫Rokid Vision,目标是希望它能像普通佩戴眼镜一样方便,而不仅仅只是用在一些特定场合。
以上就是我们对整个 AR 产品的布局、衡量和定位。
覆盖智能制造、文旅、娱乐等领域
其实德国很多汽车厂都在使用 Rokid Glass 系列产品,如奥迪、宝马、奔驰、保时捷等等。
尤其在疫情期间,Rokid 的产品非常受欢迎,直到今天仍然畅销。
与此同时,我们还将 AR 眼镜和疫情防控结合在一起,其优势更多体现在人性关怀。
当测温人员佩戴 AR 眼镜后,在几米远的位置就能识别到每个人的体温,由此便无需将人拦下来,通过测温门或者体温枪指着人的方式来测温。
这其中用到了大量的 AI 技术,可以保障很高的精确度、稳定度,还能同时识别多人体温。
这个产品目前在全球有70 多个国家和地区使用。
智能制造业方面,美的、比亚迪等国内灯塔工厂都在使用我们的产品。
如下展示的,就是在生产线上使用 Rokid Glass2 的场景。其核心在于如何让使用者不用编写代码、就能完成对自己整个工作流程的设定。
我们将 AI 能力与无代码、低代码配置平台结合,让更多人能够快速将我们的产品用在不同生成领域,这也是行业里比较领先的做法。
事实上,当我们谈论 AR 或 Metaverse 时,硬件只是其中之一,更重要的是后台算力等方面的能力。
在此,我给大家举一个例子。
在中石油 AR 智能辅助系统中,X-Craft 更强调安全性,它配有北斗和 GPS,同时也防尘防爆防污染,是一个专门针对重工业领域的产品。
而这个系统与国家电网的 AR 巡检/运维系统,在产品形态上有所不同,但基本平台是互通的。
这其实就是 Rokid 根据场景对产品的定制和细分。
但在此也分享一个我们的观点:Rokid 不认为现在可以用一个通用产品来覆盖所有场景。
如果想要在行业里落地,我们都是会针对每一行业的特性对产品进行打磨。
而除了工业上的应用,我们还希望 Rokid 能够走到消费类市场。
比如 Rokid Air,它最早被使用在文旅场景里。国内很多景点都在用 Rokid Air 进行文物或景区解说、导览、甚至一些古建筑重现。
大家知道现存的很多古建筑遗址,无法重现往日的辉煌,但是我们通过 AR 技术可以将它们重现。
目前我们也在如火如荼地推进这块业务,已经成立了团队专门建设生态体系,同时我们还引进很多伙伴帮忙进行内容创作、线下服务和推广。
我相信 AR 技术在文博领域会对传统导游解说、机器解说、二维码讲解带来一次全新的变革。
这里要强调一个概念,Rokid 做人机交互是由不同阶段的。
从最早的指令型人机交互,再到图形化人机交互,显然是对人越来越友好的。
我们认为下一代人机交互会和 AI 息息相关,我们将它定位为基于专注力和意图的人机交互。
在文博领域,我们就是在打造这样的能力。
举例来说,如果使用 Rokid 的 AR 眼镜,在逛博物馆时无需做任何指令,不需要任何点击、操作,只要盯着界面就可以操控。
这样的 AR 眼镜自身可以去理解周围环境,能掌握使用者的注意力在哪里,最后还能推荐信息。
整体的操作会非常简单,不管是老人孩子,甚至是不会使用手机的人,戴上这样的 AR 眼镜走进博物馆,都能有非常好的体验。
再给大家分享一个产品,就是我们对消费级 AR 眼镜的尝试——Rokid Air。
它更侧重于让每一个人都能体验到 AR。
在此当然娱乐先行,比如更加高清的视频体验、娱乐游戏互动,它不仅仅是更大屏幕,而是从交互上给大家展现更多不一样的内容。
Rokid 认为,如果元宇宙是一个发展方向,那元宇宙不应该局限于虚拟世界、不应该与真实世界割裂,它应该是考虑如何将人与真实世界、虚拟世界进行融合。
所以我们会不遗余力地在 AR 领域探索,让我们的产品成为大家进入元宇宙的一个入口或桥梁。
开放 Rokid 的系统给大家用
最后再和大家介绍一下 Rokid 的系统。
我自己、我们团队中,很多人都有做 AR 研发的背景,在这个领域里大家可以看到,Rokid 一直致力于建立自己的系统。
很多人或许会问,在 Metaverse 中系统和过去的 OS、基础平台会有怎样的区别?
在此我和大家分享一些 Rokid 的思考:
我们认为有3 个核心区别。
第一,当然是从 2D 到 3D的变化。而且这个 3D 还不是传统意义上的 3D 屏幕,而是一个空间的概念。
第二,是在界面、输入方面的变化。原来我们通过键盘、鼠标来操作系统,未来则可能通过你的眼睛、语言、意图、姿态、大脑或者更多方式,这个将会非常有趣。
简单讲,就是从指令式交互变成注意力或意图交互。
第三,是将真实世界和虚拟世界融合的变化。这是大势所趋,也是 Rokid 在构建自己的系统时,一个非常重要的理念。
大家可以看到,我们将传统的 OS 系统作为底层,向上来构建能力。
这样一来,开发者就不用关心 AI、不用关心 AR,也不用关心数字引擎、空间引擎等,只需要去做内容开发和相关应用就好,
这一系统我们也会对外开放,目前已经有超过200 个专业开发者在使用 Rokid 的 OS。
如果大家之后拥有了我们的产品,就能在上面看到非常多精彩的游戏和应用。
但是 Rokid 本身并不认为,Metaverse 很快会发展到每个人都能用的阶段,不会有那么快。
不过 Rokid 还是会耐着心一步一步打造我们的基本能力、平台、产品,帮助大家一步一步走到未来的那个世界。
最后,和大家分享一下 Rokid 的口号:Leave Noboby Behind。
我们希望将来科技和人文可以融合,让越来越多人都能够使用我们的产品、让科技为他们服务,真正做到每个人、每天都会使用未来新技术。
来自: www.163.com