主页 > S品生活 >GeForce GTX 10 系列提速技术全面睇GeForc >

GeForce GTX 10 系列提速技术全面睇GeForc

发布时间:2020-06-07   浏览量:629   

 

GeForce GTX 10 系列提速技术全面睇GeForc

GP104 核心架构图,由 4 组 GPC 组成,记忆体控制器则分为 8 组。

每组 GPC 由 5 组 TPC 组成,但所谓的 TPC 其实与上代的 SMM 功能一致, TPC 正是 SM 加上 PolyMorph Engine 而成,后者已升级至第四代,下文将另作介绍;而每组 SM 是由 128 个 CUDA 核心及 8 组 TU 等组成,与 Maxwell 没有分别。由于每组 GPC 变成 5 组 TPC ( Maxwell 为 4 组 SMM ),每组 GPC 的 CUDA 核心增至 640 个, TU 亦增至 40 个,所以 GTX 1080 正正提供 2,560 个 CUDA 核心与 160 个 TU ,比 GTX980 多出五分之一。

Pascal 架构可以轻易达到极高运作时脉, GTX 1080 的预设核心时脉已达 1,607MHz , Boost 更可达 1,733MHz ,远高于各款 Maxwell 型号,而且 GPU Boost 3.0 技术将 Frequency Offset 由固定改为根据电压点实时调节,可以更迅速提升时脉。 GTX 1080 之浮点运算能力更是惊人,官方数字高达 9 TFLOPS ,比上代 GTX Titan X ( 6.1 TFLOPS )或 GTX 980 Ti ( 5.6 TFLOPS )都要高出一大截。

GeForce GTX 10 系列提速技术全面睇GeForc

GPU Boost 进化至第三代,可自动提升至更贴近理论最高时脉。

技术提升 1:首度搭载 GDDR5X 记忆体

GTX 1080 的亮点是首度搭载 GDDR5X 记忆体( 1070/1060 为 GDDR5),配合新设计的 GPU 内部及基板 IO 线路,成功将运作时脉提升至 10Gbps ,比主流 GDDR5 的 7Gbps 高出四成以上,因此 GTX 1080 的理论频宽高达 320GB/s 。

GeForce GTX 10 系列提速技术全面睇GeForc

Delta Color 压缩技术进化至第四代,新增 4:1 及 8:1 两级更高的压缩比例。

与此同时, Pascal 架构的 Delta Color 记忆体压缩技术进一步强化,新增 4:1 及 8:1 压缩支援,节省要传输的材质。 NVIDIA 指出,受惠于 GDDR5X 带来的 1.4X 频宽,以及新压缩技术的 1.2X 效率, Pascal 的有效频宽足足是 Maxwell 的 1.7X 。

GeForce GTX 10 系列提速技术全面睇GeForc

GeForce GTX 10 系列提速技术全面睇GeForc GeForce GTX 10 系列提速技术全面睇GeForc

以 Project Cars 游戏为例,洋红色代表画面中可被压缩的部分,可见 Pascal 可以压缩画面绝大部分内容。

技术提升 2:全面提升运算效率

Pascal 架构的 GTX 1080 加入多方面的新技术,务求全面提升效能。首先是 Async Compute 方面的优化,现今 GPU 除了应付游戏之外,亦要身兼音效处理、Physics,以至 GPGPU 等不同类型的运算工作,而且不同运算工作往往需要同时处理,Pascal 引入 DynamicLoad Balancing,有效调配 GPU 资源,避免闲置资源影响效率。

GeForce GTX 10 系列提速技术全面睇GeForc

动态调配 GPU 运算资源处理 Graphics 或 Compute 工作,避免闲置而影响效率。

此外,Pascal 更将 Graphics Preemption 优化到 Pixel Level,例如渲染一个三角形材质时,渲染工作可以在当前的像素即时中止,将有关 SM 单元转移到其他运算工作,厂方称切换过程可于 100μs 之内完成。在运算工作中,Pascal 可支援 Thread Level之Compute Preemption,运行 CUDA 程式时甚至可精细到 Instruction Level,亦即是指令码的程度,全面提升运算效率。

GeForce GTX 10 系列提速技术全面睇GeForc

NVIDIA 官方数字称 GTX 1080 受益于製程及架构,游戏效能是 GTX 980 的 1.7X,VR 效能更达到 2.7X。

技术提升 3:加入 HDR 支援

HDR 势将成为显示技术的下一个突破点,可望大幅提升可视色彩数目、色域、亮度以至对比度等,GTX 1080 的 HDR 支援已经相当全面,继承 Maxwell 本身对应之 12-bit 色彩、BT.2020 色域之外,更加入 HDR HEVC 影片之 4K@60Hz 解码(对应 10-bit 或 12-bit)及编码(对应 10-bit)支援,并且对应 HDMI 2.0b 与 DP 1.4 两大支援 HDR 之输出介面。

NVIDIA 表示正与游戏开发商积极合作,提供适合 HDR 之 API 及驱动程式支援,期望更多游戏支援 HDR,即将加入支援的作品包括 Rise of the Tomb Raider、The Witness、Obduction、Paragon、Lawbreakers 等。

GeForce GTX 10 系列提速技术全面睇GeForc

虽然 HDR 在电脑应用仍在初步阶段,Pascal 已率先加入全面支援。

技术提升 4:硬体解码、编码引擎再升级

GTX 1080 的硬体解码、编码引擎进一步升级。先是解码方面, H.264 格式可支援至 4K@120Hz 、 最高 240Mbps 之影片, HEVC 与 VP9 同样支援至 4K@120Hz 、最高 320Mbps 影片, HEVC 更率先对应 8K@30Hz 解像度,数字上超前目前摄影装备之水平。编码方面, H.264 与 HEVC 两种格式均支援两组 4K@60Hz ,上文提到的 HDR 支援就不再重複了。显示输出方面, Maxwell 已对应 5K ( 5,120×3,200 )输出, Pascal 更提升至 7,680×4,320 水平, 需要用到两组 DP 1.3 介面才可达成。

GeForce GTX 10 系列提速技术全面睇GeForc

GTX 980(Maxwell)与 GTX 1080(Pascal)的解码、编码支援比较表。

技术提升 5:Ansel 游戏拍摄神器

NVIDIA 今次亦带来全新的 Ansel 游戏撷取工具,将游戏由撷图提升至拍摄的层次,皆因 Ansel 可以将游戏暂停,让用家自由移动视角(例如改变高度、方向等),以 Free Camera 拍摄游戏画面,更支援 360 度全景相片、加入各式滤镜以至 EXR 曝光等玩法。Ansel 的另一绝技是 Super Resolution,可以拍摄出屏幕解像度的 32 倍的相片,方法是将屏幕分割成多个範围并进行快速撷取,然后再运用 CUDA 进行 Stitching 合併成超高解像度的单一相片, 製作品最高解像度达 4.5Gigapixel,档案大小高达 1.5GB!

GeForce GTX 10 系列提速技术全面睇GeForc

画面左方是 Ansel 的 Overlay控制介面,用家可自由控制拍摄角度、解像度及特效。

技术提升 6:全面优化 VR

Pascal PolyMorph Engine 升级至第四代,主打是新增的 Simultaneous Multi-Projection 引擎。这个同步多重投影功能的原理,是使用单一 Geometry Stream 进行多个视角的运算,最多支援 16 个预设的视角。由于该引擎设于 TPC 内及整个 SM 之前,可以将原本多次的渲染工作,变成只需单一运算流程即可完成,大幅提升效率。

GeForce GTX 10 系列提速技术全面睇GeForc

Simultaneous Multi-Projection 可以大幅节省运算资源,以 Oculus Rift 为例,要处理的像素由 4.2MP 大降至 2.8MP。

此功能更对应 Single Pass Stereo,顾名思义是同时支援两个独立的主视点(Projection Centers),一次过完成运算。将上述技术应用在 VR 装置中,就可以运算出 VR 左右画面的不同轴向,在单一一次运算中完成左右两个画面的渲染工作,从而节省运算资源。

GeForce GTX 10 系列提速技术全面睇GeForc

图为 VR 的模拟投影方式示意图,原本需要进行左右画面两次渲染,配合 Single Pass Stereo 就可以一次过完成,节省一半运算资源。

Lens Matched Shading 则是模拟出 VR 镜片的光学弧度及变形情况,亦即是用家实际所见到的画面範围,才渲染出实际可见的画面,大幅减少要处理的像素数目。再结合原有之 Multi-Resolution 技术,即是以较高解像度渲染画面中央焦点部分、周围背景则以较低解像度渲染,Pascal 的 VR 效能得以大幅提升。

GeForce GTX 10 系列提速技术全面睇GeForcGeForce GTX 10 系列提速技术全面睇GeForc

由这个 VR Demo 可见,启用 Simultaneous Multi-Projection 后,FPS 即时由 50-60FPS 大增至90-100FPS。

上一篇: 下一篇: