元宇宙至少需要1万倍算力?
理想的元宇宙在算力上,比现在至少要提升多少倍?感觉一直以来都是个迷。
先说一下本文的答案,至少1万倍(云边端融为一体,在IDC内,评估总算力;保守估计):
分辨率10倍 x 刷新率2倍 x 其他感官10倍 x 并发人数 50倍 = 10000 倍
下面我先引述一下中文媒体此前和元宇宙算力相关的报道。为了确保真实性,我做了一些调研,后面把英文报道(含Intel官网等)也列出来。
芯东西12月16日报道,本周二,英特尔在RTC 2021上首次公开谈论元宇宙话题。
英特尔公司高级副总裁兼加速计算系统和图形事业部总经理Raja Koduri撰文称解读了英特尔赋能元宇宙的三层技术基石,并在接受外媒QUARTZ专访时称,要想实现《雪崩》和《头号玩家》中天马行空的体验,需将现在的算力提升1000倍。
最早见于报道的英文网页是2021年12月14日的Intel官网:
https://www.intel.com/content/www/us/en/newsroom/opinion/powering-metaverse.html
Truly persistent and immersive computing, at scale and accessible by billions of humans in real time, will require even more: a 1,000-times increase in computational efficiency from today’s state of the art.
翻译:真正持久和身临其境的计算,大规模且数十亿人实时访问,将需要更多:计算效率比当今最先进的提高1000倍。
这是英特尔第一次公开谈论元宇宙。详见:
https://valleyimallcom.b-cdn.net/intel-is-ready-to-talk-about-the-metaverse-quartz/
如果我没弄错的话,这也是全球第一次有IT巨头,针对元宇宙所需算力,表明观点:
"One foundational thing we always knew is that for what we imagined in Snow Crash, what we imagined in Ready Player One, for those experiences to be delivered, the computational infrastructure that is needed is 1000 times more than what we currently have."
翻译:我们一直知道的一件基本的事情是,对于我们在《雪崩》中想象的,以及我们在《头号玩家》中想象的,为了提供这些体验,所需要的计算基础设施是当前的1000倍。
后续也有其他IT巨头针对元宇宙所需算力提出自己的看法,比较遗憾的是,当我通过各种途径,询问倍数的推算逻辑,或者出处时,没有得到所需。
上周,有位朋友仔细阅读了《元宇宙十大技术》,并提到将在随后的公开采访想提出这个问题。我开始认真地思考,有了初步的结论。考虑并不周全,但有好过于无,期待今天的文章,能够抛砖引玉,希望更资深的专家拿出更令人信服的说法。如下是计算公式:
n=f1(a1, a2, a3,…) x f2(b1, b2,…) x f3(c1, c2,… ) x f4() x f5() x … x g() x h() …
n表示结果,也即倍数。
f包括 f1, f2, … f5, …,和g, h都代表影响倍数的变量,其中f主要指视觉、听觉、体感、触觉、嗅觉、味觉等感官,要达到逼真的感觉,相关的倍数。
一、视觉之分辨率和刷新率
Meta Quest 2的头显可提供1832 x 1920像素的分辨率,90Hz刷新率。但要达到沉浸感所需的视网膜级别的显示效果,需要12450*6840的分辨率,也即最好在14K以上,如下图1;且刷新率fps最好在180以上(取150~240fps中间偏低的数据)。
1832x1920是2K的分辨率。2022年9月Pico 4头显刚刚发布,其单眼分辨率高达2160*2160,也大约为2K;市场上有少量高端的头显能达到4K分辨率,升级到14K,是一个平方的差距关系。
图1 VR 头显需要多高的分辨率才能实现「视网膜」效果?(源自知乎)
我们先来看一下VR头显的视觉,涉及到两个变量,a1代表因分辨率所需提高倍数,a2代表因刷新率所需提高倍数。
分辨率:a1= 14*14 /4/4 = 12.25,就按十倍计算
刷新率:a2= 180/90 = 2,也即两倍
仅两者就有20倍的算力需求了,也即f1=20
二、其他感觉
个人认为视觉和听觉,即使是三维空间,也难以让远程的交互有身临其境的感觉。触觉和体感会大大增强交互的体验,笔者在2022年春节时,体验了PICO Neo 3,即使是手柄,当人在三维空间和他人握手时,手柄的震动带来的触觉的感受,也令人印象深刻。如果触觉手套、触感背心逐渐普及,会让人感觉到比邻若天涯,例如2021年6月,触觉反馈公司bHaptics推出触感背心bHaptics TactSuit,用户佩戴该产品玩支持的游戏,可体会到游戏中角色受到的击打感。
从视觉拓展到更多维的感官,甚至包括未来可能要普及的嗅觉、味觉,算力需求提升10倍,已经是非常保守的数据了,也即:
f2 x f3 x f4 x f5 = 10
三、多人并发
其实硬件的各个方面距离元宇宙雏形所需算力,差距都不小。我自己曾经用过一款元宇宙会议APP,大约二三十人,运行了20多分钟后,手机就比较烫了。
Matthew Ball在其新书《元宇宙改变一切》里提到:
《自由之火》中的大逃杀仅限50个玩家同时参与。
当《堡垒之夜》或Roblox等游戏在更狭窄的空间,比如在虚拟演唱会现场开展社交活动时,它们会将并发用户减少到50个或更少。与标准游戏模式相比,它们还限制了用户可以做的事情。例如建筑项目可能会被关闭,另外舞蹈动作的数量也会从正常的十几个或两个减少到只有一个预设选项。
Roblox现在起保真度相对较低的世界中支持多达200名玩家。
英伟达黄仁勋设想把“粒子物理定律、引力定律、电磁定律、电磁波(包括光)和无线电波……压力和声音”应用到元宇宙中。
不难感觉,如果要构建多人并发的持续共享且实时响应的元宇宙,道路还很漫长。我们假设高保真度,或者较逼真的三维游戏,目前的并发人数为100;如果我们希望完成一个较为简单的任务,在一个能够容纳5000人的元宇宙会议室。这就意味着需要50倍的算力提升,也即:
g=50
综上所述,n=20 x 10 x 50=10000,也即1万倍。
这已经是最保守的数据了,例如除了视觉以外,其他多维感官,可能带来不止10倍的算力提升;并发人数从100到5000,可能不是线性的提升,有可能更多?假设一个场景,周杰伦要在能容纳5000人的“元宇宙音乐厅”开大型演唱会,他的数字化身,突然一时兴起,邀请200个粉丝的化身上台分组比赛。这时,要让5000个人(包含周杰伦、200个粉丝、台下的观众的化身们)看到的景象保持基本的一致,渲染的工作量比100个人的“元宇宙音乐厅”,提升很可能不止50倍。
另外,更理想的元宇宙,是不是需要百万、千万,甚至上亿的人并发?
还有,很可能还存在本篇文章没有考虑到的因素,也将成为算力倍增所需考虑的变量。
元宇宙的算力给我们带来巨大的挑战。另外,众所周知,近些年来,摩尔定律放缓,每年晶体管密度的提升不到3%,如下图,一方面,算力可能会成为元宇宙迅猛发展的掣肘,但同时元宇宙也会倒逼算力提供商们,尽其所能发展相关软硬件和算法。
当前可以看到,采用异构加速、多元融合等方式来应对。借助AI,英伟达在过去的4年内将性能提升了16倍。
需要指出的是,应用场景(元宇宙)和底层基础设施(算力、存储、网络等元宇宙五大地基)是相辅相成,相互促进的;算力也是逐渐增加的,应用场景会“鞭打”算力。总算力每提升10倍,预计就有一批新的应用横空出世。正如,通信的2G成就了短信和自由通话,3G成就了移动互联网下的彩信和语音,4G成就了在线视频和直播。5G会成就什么呢?