一个被称作“Acheron”的微小程序,居然能够致使市面上最为强大的显卡呼吸急促,它究竟施展了什么样的神奇法术呢? 。
渲染技术的路径分野
如今的现代型游戏图像所主要依赖的是光栅化技术,它会把3D模型的顶点数据转变成为屏幕上的二维像素,这个转变过程具备高效性然而原理相对来讲较为直接,具体的步骤是先对顶点坐标展开处理,接着去确定像素覆盖的范围,最终进行着色并输出 。
那另一种路径是光线追踪,它去模拟真实光线的行为,进而能够产生更为逼真的反射以及阴影,不过对硬件的要求是极高的。而Acheron采用的是光线步进,它是完全凭借数学函数来描述场景的,借助计算着色器为每个像素分配线程去进行“步进”探测,直接写入最终的图像,还绕过了传统的管线。
光线步进的独特魅力
核心为光线步进的是符号距离场,这是一种借助数学函数去定义物体表面距离的方式,程序靠着计算光线与SDF的交点来对几何体予以渲染,这种方法并不需要去存储复杂的网格数据。
于Acheron里,全部场景,涵盖球拍、球以及砖块,皆由纯粹数学计算予以生成。并无纹理,亦无预烘焙光照,所有视觉效果皆源自计算着色器针对SDF的实时求解。这般情形致使代码极为精简,然而计算密度却令人惊叹。
Acheron基准测试的设计思路
此前,硬件媒体的一位曾经的撰稿人Alan开展了此项测试环节,起初,它仅仅是一个在周末兴起的兴趣导向的项目,初衷是搭建出一个工具,可以纯粹地对GPU浮点计算能力予以衡量,将显存带宽、光追以及AI加速单元等干扰因素排除在外 。
测试涵盖两个预设,默认预设“Normal”于720p分辨率下运行,其中含有80个可破坏碎片,极限预设“Hard”将分辨率提升至1080p,碎片数量剧增至640个,对GPU造成持续高压 。
对顶级显卡的极限压榨
以目前泄露信息里性能处于顶尖水平的RTX 5090作为例子,在默认状态下的720p预设情况时,它能够获取到2085分,平均帧率为76.2 FPS,在这个时候计算负载已然是相当可观的了。
在切换至极限1080p预设之后,情形发生了急剧的转变。碎片的上限达到了640个,光线步进的次数是72步,RTX 5090的平均帧率一下子剧烈下降到了2至3 FPS。只有在碎片大量生成之前,帧率才能够维持在41.8 FPS左右,这充分地将纯计算压力之下的性能边界暴露了出来。
体积微小与缓存优势
Acheron的体积具备极大颠覆性,整个程序压缩后仅80KB,其默认预设的着色器代码约5KB,极限预设也不过32KB,如此微小的代码量能够轻松完整载入现代GPU的L1缓存。
这表明测试全然避开了因从显存里频繁读取指令以及数据所引发的延迟,性能瓶颈切实地被锁定于 GPU 的 FP32 浮点计算单元的执行效率还有吞吐量之上,其结果相较而言更能够体现架构的计算本质。
带来的启示与安全提醒
具有强大实力象征的Acheron的现身,预告了一个趋向,那便是,鉴于计算着色器的本领越发强劲,往后的游戏极有可能更加倚仗这类纯粹的计算渲染技术以达成复杂的视觉成效,它给开发者评估硬件的计算潜能带来了全新的工具。
鉴于测试会致使持续处于极高状态的负载出现,开发者特地告诫用户要保证显卡散热状况良好,还要查看供电接口是不是稳固。这在侧面证实了其“显卡压力锅”的称谓名副其实。
你觉得,这般单纯较量计算“傻力气”的测试,能不能变成接下来衡量显卡性能的全新标准?欢迎于评论区去分享你所拥有的想法啷。 。
