1引言&規格&外觀
引言
硬件圈有兩個春晚,一個是蘋果發布會,另一個就是NVIDIA的顯卡發布會,前不久RTX4090的強勁性能給大家留下了深刻的印象,首發上市也是一搶而空,而次旗艦RTX4080歷盡波折也終于來了。全新AdaLovelace架構以及換用TSMC4N工藝讓這一代RTX4080顯卡性能獲得飛躍,各家AIC廠商也紛紛推出自家重量級的RTX4080顯卡。
想必現在很多玩家迫切的想知道RTX4080顯卡表現如何,筆者也在第一時間拿到了七彩虹旗下的高端顯卡——iGameGeForceRTX4080 16GB VulcanOC,玩家更喜歡稱之為“火神”,iGam旗下的雙雄之一,那它的性能究竟表現如何,讓我們接著往下看。
*下方“iGameGeForceRTX4080 16GB VulcanOC”將簡稱為“iGame GeForce RTX 4080 火神”
規格對比
在開始之前,先了解一下本次的主角RTX4080,其采用的是AD103-300核心,TSMC4N工藝制造,芯片面積為379平方毫米,晶體管密度達到了459億,晶體管數量相比較于上一代產品提升非常明顯,近乎翻倍,而這一代的核心還進一步提升了頻率,因此能帶來更好的性能表現。
其他參數方面,RTX4080RTX4080標配9728個CUDA,128個第三代RTCores,512個第四代TensorCores,并且用上了16GB的GDDR6X顯存,大顯存配合性能上的提升更可以為游戲以及創作者帶來更好的使用體驗。
而目前RTX4080顯卡配備的AD103-300核心并不是完整的AD103核心,完整的AD103核心應該包括7個GPC(圖形處理集群)、40個TPC(紋理處理集群)、80個SM(流式多處理器)以及一個帶有8個32Bit顯存控制器的256Bit顯存帶寬。因此筆者猜測,RTX4080或許不是AD103核心下的終極產物,后續應該還會推出完整AD103核心的RTX4080Ti。
再看看下方的RTX4080的核心結構圖,和完整版本的AD103核心對比起來就很容易看出差別,RTX4080核心代號為AD103-300,其擁有4個完整規格的GPC(圖形處理集群,每個內建6個TPC),與3個非完整的GPC(兩個內建5個TPC,一個內建4個TPC),共組成38個TPC,SM單元則剩下76個,顯存位寬還是完整的256Bit。
但是RTX4080上的AD103-300核心在編解碼器上砍了一刀,不得不說老黃的刀法精準,編解碼器數量直接砍半,與RTX4090同等規格,僅保留了兩個NVENC編碼器和一個NVDEC解碼器,因此完整版的AD103核心應該會有更快的視頻編解碼速度,不過之前測試過RTX4090,編解碼速度相比上一代有著近乎翻倍的提升,想必RTX4080也有不錯的表現。
外觀賞析:七彩虹iGame GeFore RTX 4080 16GB Vulcan OC
作為七彩虹旗下的旗艦產品,七彩虹iGame GeForce RTX 4080 火神的外包裝甚至比一些RTX4090的還要大,正面印有iGame的Logo以及GeForceRTX4080字樣,包裝盒的正面是疾馳而來的iGame GeForce RTX 4080 火神,設計相當有特色。
包裝背部則是這一代顯卡用到的技術,如:智屏、全新設計的散熱系統、iGame控制中心等。
打開包裝,引入眼簾的正是七彩虹的新主張——“我游自在”的游玩體驗新境界。
顯卡全部附件包括一個可拆卸的智屏以及底座、新的燈光組件、4*8Pin轉16Pin延長線、燈光同步線、顯卡支撐以及用于拆解顯卡的配套螺絲刀。
外觀上,七彩虹iGame GeForce RTX 4080 火神主打后賽博時代,造型極具賽博朋克風,棱角分明的線條搭上硬朗的金屬框架,從內而外都透露著未來科技感。
七彩虹iGame GeForce RTX 4080 火神的散熱系統經過重新設計,配備了新一代的旋渦(Vortex)散熱系統,正面是三個104mm散熱風扇,被錆鐵色金屬外骨骼牢牢框住。其采用的“聚風鐮環”扇葉能幫助風量進一步集中,有利于帶出熱量。
顯卡頂部印有GEFORCERTX字樣,底下則是一整排的出風口,橫跨整個顯卡頂部和底部,加速熱量排出。
顯卡背板設計也很帶感,金屬一體背板加持,進一步加強顯卡強度,金屬拉絲工藝加上亮面的iGameLogo與正面的賽博朋克風不謀而合。
在背板末端還留出了鏤空散熱窗口,使用了“真空冰片”技術的導流型鰭片,導流型鰭片擁有更大的間隙,更利于風流進入,加速內部氣流循環。
供電用的是全新的12VHPW供電接口,通過一根12VHPW的電源線就可達到供電需求,如果用戶使用的是ATX2.0標準的電源,也可以使用附贈的4*8Pin轉16Pin延長線來進行使用。
底部為顯卡金手指,接口為標準的PCIe4.0x16,在使用前一定要在主板打開ResizableBAR功能,這張顯卡的性能才能完全釋放。
不同于RTX4090動輒3.5槽的厚度,七彩虹iGame GeForce RTX 4080 火神的實際厚度僅有3槽,并且配備了三個DP1.4a和一個HDMI2.1a,用這張卡帶8K顯示器也是一點問題沒有。
顯卡自帶兩個不同的BIOS,其中一個主頻與RTX4080FE看齊,為2505MHz,TURBO版BIOS主頻默認可以來到2640MHz,實際測試中約在2800MHz左右。
除了配置上的豪華,性能提升的亮眼,這一代七彩虹iGame GeForce RTX 4080 火神在外觀和交互上也標新立異,引入了全新的智屏,為玩家帶來了更多的可玩性。
雖然在之前的VulcanOC系列顯卡上,七彩虹早就配備了側邊屏幕,不過七彩虹iGame GeForce RTX 4080 火神上的這塊智屏是經過全面升級的,采用的是可拆卸可替換的設計,并且進行了分辨率的提升。這一塊屏幕的分辨率由上一代產品的480*128PX提升至800*216PX,顯示的內容可以更加細膩,更加具有視覺沖擊力。
智屏支持在顯卡上橫向放置,也可使用豎直放置。在七彩虹的控制中心iGameCenter中,可以對這塊屏幕進行細致的自定義。支持顯示CPU/GPU工作情況,也可以顯示時間等內容,除此之外,這一屏幕也支持放置靜態的圖片、放置GIF圖片進行顯示。
另外七彩虹iGame GeForce RTX 4080 火神上配備的智屏也支持通過外置延長線和底座單獨擺放,成為“桌面美學”的一部分。
如果不喜歡方方正正的智屏,七彩虹也貼心的準備了另一塊RGB燈光組件,同樣采用磁吸設計,放在顯卡頂部后即可見到各式各樣的燈效。不過有一點,這個燈控組件不兼容底座。
總的來說,七彩虹iGame GeForce RTX 4080 火神上的智屏給千篇一律的顯卡設計帶來了不一樣的玩法,不過七彩虹或許可以考慮進一步升級智屏,使其可以顯示歌詞或者增加觸屏操作等功能,讓這塊智屏更懂交互,更具可玩性。
2七彩虹iGame RTX 4080 Vulcan OC顯卡拆解
顯卡拆解:七彩虹iGame GeFore RTX 4080 16GB Vulcan OC
精致的外表下是扎實的堆料設計,卸下背板上的螺絲,斷開風扇與智屏的接針后即可分離PCB與碩大的散熱器。
拆下后可以看到七彩虹iGame GeForce RTX 4080 火神除了采用金屬背板來對顯卡PCB進行支持以外,還加入了金屬中框,可以對于PCB進行更強的支撐,并且具備有輔助散熱的效果。
再卸下金屬中框上的螺絲即可完全分離PCB,PCB采用的是類公版的方案,越肩設計,比一般的顯卡都要再高一些,不過PCB上的接口、供電、核心、顯存,以及輔助供電位置都相當的合理且規正,有大廠出品的質感。
PCB的背板相比正面更為簡潔,元器件更少,核心背部電容位置使用了兩個POSCAP(導電聚合物鉭電容),電氣性能更強一些。
PCB正中央的AD103-300-A1核心便是此次的主角,采用TSMC4N工藝制造,擁有9728個CUDA核心,在游戲性能上可以達到RTX3080Ti的兩倍,甚至部分場景下還能超越上代卡皇RTX3090Ti。
核心四周是8顆GDDR6X顯存,顆粒來自美光,型號是型號為2PU47D8BZF,單顆顯存容量2GB,8顆組成16GB,顯存位寬為256Bit,速度達到了21Gbps。
七彩虹iGame GeForce RTX 4080 火神采用22+4相供電配置,其中核心供電為22相,顯存供電為4相,供電位置被安排在PCB的兩側,這個供電規格比部分RTX4090還要豪華了。
每相供電都采用了獨立的DrMos芯片,封裝型號為BLN3,實際應為AOS的AOZ5311NQI-03,持續輸出電流為55A。
供電控制芯片采用了三顆,分布在PCB的正反面,分別是:uP9512U、uP9521R,以及uS5650Q。其中uP9512與uP9521共同管理核心供電,可以做精細化的供電管理,而uS5650Q則是主要負責顯存供電部分。
PCB的正反面各有一顆BIOS控制芯片,分別控制Normal模式和Turbo模式,型號為IS25WP016。
在PCB的右上角可以看到全新的12VHPWR供電接口,相比以往的8Pin接口,占用的地方要少很多,附近是兩顆封閉電感用于保證RTX4080的供電穩定。
豪華的堆料自然要豪華的散熱加持才能發揮全部戰力,接下來看看七彩虹iGame GeForce RTX 4080 火神上全新的旋渦(Vortex)散熱裝置。這代旋渦(Vortex)散熱裝置可以分為三個部分,分別是散熱風扇、散熱器以及散熱金屬中框。
這一代的七彩虹iGame GeForce RTX 4080 火神的散熱器本體相當龐大,不僅能夠給GPU散熱,還為顯存、電感以及MOS管等進行散熱。
在顯存和供電部分都配上了高系數的導熱墊輔助散熱,GPU核心也抹上了厚厚的硅脂,顯存位置更是緊貼真空腔均熱板,超高的散熱效能助力這一代顯卡強勁的性能釋放。
散熱器本體為兩段式散熱模塊,應用導流型鰭片,該設計最早用于高單價的服務器中,如今用于顯卡上,為玩家提供更優的導熱效果,并且采用彎角造型,進一步增大了鰭片與空氣的接觸面積。
散熱器底下是9根8mm“回流焊”工藝熱管,貫穿整個散熱器,顯然這是為超頻而準備的。
散熱器內部用的還是真空冰片技術,超扁平的密閉腔體內充冷凝液,吸收熱量后通過相變原理散發熱量,真空密閉腔體與熱管及鰭片合為整體,散熱效能突飛猛進。如此規格的散熱系統前所未見,配合金屬背板上的鏤空設計,壓這顆AD-103核心綽綽有余。
散熱器上還有三個104mm的大直徑風扇作為主動散熱,直接固定在散熱器上,與導流型鰭片直觸,能夠更好的排出內部熱量。
升級的“聚風鐮環”扇葉和雙滾珠軸承為旋渦散熱的關鍵,既保證了風量的充足又兼顧了風扇的壽命。
3測試平臺&理論/游戲性能測試
測試平臺介紹
七彩虹iGame GeForce RTX 4080 火神無論是供電、散熱還是個性化設計都達到了旗艦級的水準,顯然很對發燒玩家的胃口,接下來就進入大家最為關注的實戰測試部分吧!
測試前先介紹一下本次的測試平臺,CPU使用的是目前的旗艦——Inteli9-13900K處理器,主板為華碩Z790HERO,搭配金士頓的64GBDDR5-6000高規格內存,確保這張顯卡能夠釋放全部性能。
七彩虹iGame GeForce RTX 4080 火神有著強勁的性能,配它的顯示器自然也不能弱,用的依舊是天花板級別的AGONPD32M保時捷聯名款,4K@144Hz的高刷,更有4080加持,通殺市面上的游戲。
測試前,首先用GPU-Z對顯卡的運行狀態以規格參數進行再次的檢查,避免因為運行狀態及參數不正確而導致測試成績不正確。同時也能通過GPU-Z所呈現的數據來看看七彩虹iGame GeForce RTX 4080 火神顯卡更為詳細的規格參數。
從圖上可以看到這張七彩虹iGame GeForce RTX 4080 火神顯卡擁有9728個CUDA,Boost頻率在TurboBIOS下就達到了2640MHz,相比公版的2505MHz有一定的提升。另外我們也全程開啟主板的ResizableBAR功能,確保顯卡性能滿血釋放。
理論性能測試
國際慣例,先跑一遍3DMark測試,從理論性能來看,七彩虹iGame GeForce RTX 4080 火神有著比上代RTX3080Ti更為出色的性能表現,整體性能是后者的1.3倍以上。尤其是在光線追蹤以及DLSS項目上,七彩虹iGame GeForce RTX 4080 火神提升最為明顯,基本能達到上代顯卡的1.4倍以上。
而在注重游戲的TimeSpy和FireStrike測試中,七彩虹iGame GeForce RTX 4080 火神也有不俗的表現,雖然沒有實現翻倍的性能提升,但性能至少是RTX3080Ti的1.4倍,只能說這次AdaLovelace架構與TSMC4N工藝的配合著實給我們帶來了更多的驚喜。
而來到算力方面,我們使用AIDA64GPGPU進行測試,雖然RTX4080的顯存位寬不及RTX3080Ti,但其算力絲毫不弱,顯存復制能力是RTX3080Ti的2.6倍之多,算力也有近1.4倍的提升,還好現在以太坊已經合并了,不然這顯卡又會是空氣卡了。
游戲性能測試
看完了理論性能測試,RTX4080的提升著實讓人眼前一亮,那這張核彈級的顯卡在游戲中究竟表現如何呢,我們選取了多款游戲進行實測。
在1080P分辨率下,由于顯卡壓力不大,所以常規的游戲性能提升其實不算明顯,不過開啟DLSS后,游戲性能小幅提升,像跑分界的活化石《古墓麗影:暗影》,七彩虹iGame GeForce RTX 4080 火神開啟DLSS后,幀數達到了309。
2K分辨率下,七彩虹iGame GeForce RTX 4080 火神逐漸與前代拉開差距,市面上的大部分3A游戲都能穩定120FPS以上運行,部分游戲甚至奔著200+FPS而去。
七彩虹iGame GeForce RTX 4080 火神在4K分辨率下也同樣游刃有余,超高畫質下依舊可以流暢運行絕大部分的游戲,像顯卡殺手《賽博朋克2077》,這張顯卡能夠在超級光追的畫質下跑出接近80幀的成績,而RTX3080Ti甚至沒有60FPS。部分游戲還可以飆到140FPS左右,4K144Hz電競不再是夢。
即使分辨率上到8K,七彩虹iGame GeForce RTX 4080 火神也絲毫不虛,性能是前代的1.4倍,開啟DLSS后依舊能夠將大部分游戲跑到60FPS以上的水準,像一些優化較好的游戲,例如《極限競速:地平線5》甚至能有70FPS左右的幀率,8K在墨西哥的賽道上狂飆看風景,這在之前可是想都不敢想。
另外值得一提的是七彩虹的控制中心iGameCenter中配有游戲監控功能,能夠開啟監控游戲性能,給玩家更直觀的數據,方便及時調整顯卡狀態,以獲得更強勁的性能輸出。
并且已有30多款游戲支持記錄游戲日志功能,能夠更詳細的了解游戲運行狀態。
4DLSS 3性能測試
DLSS 3性能測試
老黃在發布會上帶來了DLSS3技術,這個技術相比DLSS2新增了幀生成和NVIDIAReflex,在RTX40系列顯卡上能實現成倍提升性能,幀數進一步提升的同時,還不會影響畫質和響應速度,有了這項技術,4K144甚至8K60不再是夢。
并且DLSS3游戲支持發展迅速,截至11月15日,已有10款可玩的DLSS3游戲發布。
《瘟疫傳說:安魂曲》(APlagueTale:Requiem)
《光明記憶:無限》(BrightMemory:Infinite)
《毀滅全人類2:重新探測》(DestroyAllHumans!2-Reprobed)
《暗影火炬城》(F.I.S.T.:ForgedinShadowTorch)
F1?22
《逆水寒》(Justice)
《生死輪回》(Loopmancer)
《漫威蜘蛛俠:重制版》(Marvel’sSpider-ManRemastered)
《微軟模擬飛行》(MicrosoftFlightSimulator)
《超級人類》(SUPERPEOPLE)
另外像WRCGenerations,《極品飛車:不羈》(NeedforSpeedUnbound)以及《戰錘40K:暗潮》(Warhammer40,000:Darktide)也即將發布,圣誕節前玩家就可暢玩這些DLSS3游戲。想要了解更多DLSS3的信息可以關注下面的鏈接(北京時間11月15日22:00上線)。
https://www.nvidia.com/en-us/geforce/news/more-november-2022-rtx-dlss-game-updates
3DMarkDLSS3性能測試
講完DLSS3的進展,下面就該上實測了,在3DMark的DLSS3測試中,七彩虹iGame GeForce RTX 4080 火神開啟DLSS3后性能提升十分明顯,3DMARKDLSS3開4K測試,能夠跑到147FPS,可以說能夠完全滿足4K@144。甚至于在8K分辨率下也能滿足60FPS流暢運行,似乎已經可以期待下8K@120了。
《生死輪回》(Loopmancer)游戲實測
單看理論測試可不夠,在《生死輪回》游戲中我們也實測了DLSS2與DLSS3的游戲性能,在不開啟DLSS的情況下,七彩虹iGame GeForce RTX 4080 火神在4K分辨率下運行《生死輪回》僅有50FPS;開啟DLSS2后,游戲幀數可以去到122FPS,1%幀數也達到了74FPS,基本可以滿足4K60的游戲需求。
在開啟DLSS3之后,事情就變得有趣了,游戲性能肉眼可見的提升,幀數更是達到了143FPS,配上頂級的4K@144顯示器,例如我們測試中使用的AGONPD32M,玩此款游戲那是真爽了。
UnrealEngine5EnemiesDEMO
我們也測試了用最新UnrealEngine5引擎制作的EnemiesDEMO,Enemies是NVIDIA提供給媒體與各大KOL測試所用的DEMO,利用UnrealEngine5輕松制作了一個數字人類。這里大家可以直接對比下開啟和關閉DLSS3前后的畫面和FPS值,4K分辨率下七彩虹iGame GeForce RTX 4080 火神可達77AVG/661%FPS/55ms的水平,而關閉DLSS3后僅有22AVG/171%FPS/195ms,基本就是3.5倍的游戲流暢度提升。
2K分辨率與4K分辨率DLSS性能測試
DLSS3的性能測試我們這里做了兩個分辨率與十個項目,這里就不再單一的說了,筆者弄個匯總的表格給大家作參考之用吧。注意:DEMO里是沒幀生成開關的,所以30系列顯卡其實運行在DLSS2模式之下。
總的來說,七彩虹iGame GeForce RTX 4080 火神即使是開啟DLSS2,性能已經比前代的RTX3080Ti強出不少,如果是開啟DLSS3后,那幀數提升更為明顯,2K@180甚至4K@144都輕輕松松,只能說老黃給40系顯卡上DLSS3有一手,一下子就跟30系顯卡拉開了差距。
另外我們也用七彩虹iGame GeForce RTX 4080 火神測試了8KDLSS3游戲的性能表現,但是遇到了爆顯存的情況,主要表現為顯存占用達到了16GB,游戲幀數也較低。只能說老黃的刀法是真精準,目前只能等游戲廠商優化,如果能夠降低更少的顯存占用,那RTX4080體驗8K60是完全沒問題的。
5創作者能力測試
創作者性能測試
游戲性能的提升大家有目共睹,那這塊七彩虹iGame GeForce RTX 4080 火神用在內容創作上究竟如何,我們分為視頻內容生產力以及專業內容創作兩個部分進行測試。視頻生產力方面,先看PCMark10的測試結果,七彩虹iGame GeForce RTX 4080 火神在生產力與游戲兩個子項中提升會猛一些,領先RTX3080Ti約13%。
而在Adobe、DaVinci等軟件中,得益于全新的AV1編碼和RTX4080雙Buff加成后,性能均有所提升,如果你是一名想要追求更高效率的設計師、后期小哥等,不妨試試七彩虹iGame GeForce RTX 4080 火神,它能帶給你不一樣的創作體驗。
如果你是專注于渲染或工業領域的應用,RTX4080能給你帶來更大的驚喜,在SPEC工業軟件測試里,新架構、大顯存的加持下,性能是RTX3080Ti的1.3倍;而在Blender或OCtanebench渲染中,RTX4080的提升更猛,是前代的1.5倍之多,對于專業領域的用戶來說,升級這張七彩虹iGame GeForce RTX 4080 火神真是太有必要了,能提高不少工作效率。
而說到創作性能就不得不提RTX40系最大的升級——這一代的RTX4080提供了NVENC雙編碼器,既支持AV1編碼也支持AV1解碼,AV1相比H.265能夠以更低帶寬、更小文件提供更高質量的畫質,并且完全開放沒有任何授權費用,正陸續得到更多平臺、軟件的支持。
所以我們也對第8代NVENC雙編碼器進行測試,測試片源來自NVIDIA提供的8K片源與工程文件,七彩虹iGame GeForce RTX 4080 火神的導出速度堪比RTX4090,尤其是8K30規格的視頻用時甚至更短一些。而即便是相同的H.265格式,七彩虹iGame GeForce RTX 4080 火神的導出速度是前代RTX3080Ti的2.6倍。
在MAGICMASK工程文件的測試與ON1Resize的項目測試中也表明,七彩虹iGame GeForce RTX 4080 火神內置的第8代NVENC雙編碼器很強大,而且利用RTX40核心里的黑技術,可以讓渲染的時候更短,大大的加快效率。
我們再來看看H.265格式與AV1格式下的畫質區別,從肉眼來看,其實畫質幾乎完全一樣,這樣也意味著AV1可以用更小的空間占用量實現與H.265同等規格的畫質表現,總的來說,無論是導出速度、空間占用還是畫質表現,它都完勝H.265。
6超頻&功耗&總結
功耗與發熱
相信大家已經見識過RTX4090的功耗與散熱了,那采用同款散熱器的七彩虹iGame GeForce RTX 4080 火神在功耗與散熱上是否能帶來更多驚喜,我們利用Furmark軟件,來對這塊七彩虹iGame GeForce RTX 4080 火神的功耗和散熱表現進行測試。
在室溫25°的環境下,Furmark甜甜圈設定為1280x720分辨率。在烤機15分鐘后,TURBOBIOS下的顯卡占用率達到了100%,滿載功耗379.152W,顯卡運行頻率頂著2700MHz在跑,核心滿載溫度穩定在62.5℃,顯存滿載溫度為54℃,甚至比公版2505MHz下還要低上不少。
而在Normal模式下,這塊顯卡要凍感冒了,顯卡核心頻率為2445MHz,核心滿載溫度穩定在57.3℃,顯存滿載溫度為54℃,功耗也只有300W出頭,有了TSMC4N工藝的加持,相比上一代的RTX3080Ti,功耗溫度雙雙表現出色,并且風扇噪音明顯降低了不少,喜歡安靜的用戶不妨試試這個模式。
我們也橫向對比了一下上代顯卡與RTX 4090顯卡的功耗,從功耗來看,其實七彩虹IGame GeForce RTX 4080火神的功耗控制還是相當不錯的,最高才是300W還比RTX 3080 Ti少多了,而且性能更強了。
測試的時候其實我們同時利用HWINFO64在后臺進行功耗記錄,結果如上圖一樣,RTX 3080 Ti基本跑的是350W,而七彩虹iGame GeForce RTX 4080火神也就300W左右,部分應用軟件上甚至更低的功耗表現。所以說RTX 4080 16GB每瓦性能比是實打實的提升到了一個新高度。
超頻測試
因為這一張七彩虹iGame GeForce RTX 4080 火神的散熱規格本身也足夠強大,官方配套的iGameCenter控制軟件也自帶有非常方便的超頻設置,筆者自然是不能錯過這個絕佳的超頻機會。
雖然七彩虹iGame GeForce RTX 4080 火神在Turbo BIOS下的BOOST頻率已經到2640MHz了,但還有超頻空間,所以我們使用iGameCenter的超頻設置,對這張顯卡進行超頻,簡單小超一下后,測試時GPU核心頻率最高可以到2985MHz,此時跑3DMark的PortRoyal光追測試,顯卡得分18062,相比默認狀態下的17599有了小幅提升。
就差臨門一腳就沖上3000MHz了,那不得繼續超一下,所以我們繼續超頻,將顯卡的核心頻率超至2775MHz,超頻后3DMark的PortRoyal光追測試顯卡得分18158,GPU核心頻率直接來到了3015MHz,這在以前是想都不敢想的,已經接近部分CPU的頻率了。
筆者也在超頻狀態下,對七彩虹iGame GeForce RTX 4080 火神進行了烤機測試,核心頻率基本維持在2895MHz,顯存頻率為1400MHz,本以為超頻后溫度會大幅提升,但七彩虹的旋渦(Vortex)散熱裝置很給力,顯卡核心溫度穩定在59℃左右,不得不說這一張顯卡的散熱性能確實可以,超頻后的溫度表現也依然很優秀,此時的烤機功耗在429W左右。
評測總結
全新AdaLovelace架構的RTX40系顯卡無論是在游戲性能還是專業生產力上都帶來了質的飛躍,RTX4080的性能足以讓游戲玩家為之發狂,4K光追絲滑流暢;創作者也為其癡迷,大顯存、高性能為提升效率助力,可以說這一代RTX40系顯卡從里到位都是驚喜。
聊回本次的主角——七彩虹iGame GeForce RTX 4080 16GB Vulcan OC,對于追求極致游戲體驗的發燒玩家和追求頂級效率的設計師用戶來講,七彩虹iGame GeForce RTX 4080 16GB Vulcan OC毫無疑問是性能與性價比的最優選,在堆料方面有著超越公版的配置,用料豪華,散熱強勁,在超頻方面頗有潛力,輕輕松松3GHz,完美詮釋了旗艦級顯卡應有的水準。
在個性化上,這代七彩虹iGame GeForce RTX 4080 16GB Vulcan OC加入的智屏也讓顯卡有了更多的可玩性、交互性,這讓它在同質化嚴重的顯卡市場脫穎而出,畢竟各大非公顯卡的頻率、性能、散熱設計等日漸趨同,只有這種差異化設計才能俘獲玩家的芳心。
總的來說,七彩虹iGame GeForce RTX 4080 16GB Vulcan OC顯卡稱得上是給追求性價比與高性能用戶量身定做的完美之作,目前七彩虹iGame GeForce RTX 4080 16GB Vulcan OC已經上市,感興趣的玩家不要錯過,如果你想現在入手一張高端顯卡,它就是你一步到位的選擇。
另外11月16號晚10點,七彩虹將在京東、天貓、抖音、快手等電商平臺及線下授權零售經銷渠道正式以現貨發售或預售的形式同時上架多款iGame、戰斧GeForce RTX 4080顯卡包含 iGame GeForce RTX 4080 16GB Vulcan OC、 iGame GeForce RTX 4080 16GB Neptune OC、 iGame GeForce RTX 4080 16GB Advanced OC、iGame GeForce RTX 4080 16GB Ultra OC及戰斧GeForce RTX 4080 16GB 豪華版,感興趣的話可以去了解一下。
7ADA架構講解
Ada Lovelace架構講解
Turing、Ampere上兩代架構核心均以人物來命名,前者是計算機科學之父——艾倫·麥席森·圖靈;后者則是“電學中的牛頓”——安德烈·瑪麗·安培,電流的國際單位安培就是以其姓氏命名。那AdaLovelace定非凡人,度娘一下果然,這是 人稱“數字女王”的阿達·洛芙萊斯,編寫了歷史上首款電腦程序,是被世界公認的第一位計算機程序員,果真是一代比一代還要更牛。PS:她的父親是《唐璜》的作者,詩人拜倫喔。
從Turing架構開始,NVIDIA首次在顯卡中加入了加速光線追蹤的RTCore單元,以及面向AI推理的TensorCore單元,這革命性的創新使實時光線追蹤成為可能。而Ampere架構則是全面的架構改進,在加入新一代的二代RTCore和三代TensorCore基礎上,還有著更先進的SM單元設計,這樣顯卡工作效率那是翻倍的提升。而來到AdaLovelace架構,同時是以效率提升為大前提,自然是引入了最新的第三代RTCores與第四代TensorCores單元,同時加入眾多新穎的黑科技,從執行效率來說AdaLovelace架構是上代Ampere架構的2倍以上,甚至光線追蹤能力更是達到了恐怖的4倍性能。
全新的SM流式多處理器
AdaLovelace架構中最大的亮點之一:全新的SM流式多處理器,每個SM包含了128個CUDA核心、1個第三代的RTCores,4個第四代TensorCores(張量核心)、4個TextureUnits(紋理單元)、256KBRegisterFile(寄存器堆),以及128KBL1數據緩存/共享內存子系統,于是這一個全新的SM單元有著超過上一代2倍之的性能表現。
過去的Turing架構INT32計算單元與FP32數量是一致的,而兩者相加才組成了64個CUDA核心。但是Ampere架構開始,左側的計算單元實現了FP32+INT32的計算單元并發執行,也就是說CUDA核心數量翻倍到了128個。
再來看看AdaLovelace架構的SM,FP32/INT32的計算單元組合,同樣實現了每個SM內含128個CUDA的設計,看似提升不大,但是當你了解到GeForceRTX4080擁有76個SM,9728個CUDA核心,那你也就應該明白達82.6TFLOPS的著色器能力是如何實現的了,比上一代的RTX3090Ti顯卡的40TFLOPS,還真是提升了兩倍有多。
另外緩存方面AdaLovelace架構也進行了大規格的提升,首先每個SM單元中單獨配上了128KB的緩存,這樣RTX4080顯卡中就實現了97MBL1/共享內存。其次核心的二級緩存進行進行了重新的設計,并且完整AD103核心與RTX4080都是64MB二級緩存,相比RTX3080Ti可以說是質的飛躍。
技術講解:第三代RTCores與第四代TensorCores
以為剛才的CUDA數量與超大L2緩存就已經很猛了,實現上AdaLovelace架構最大的提升還是在第三代RTCores與第四代TensorCores身上。
第三代RTCores
RTCores用于光線追蹤加速,第三代RTCores的有效光線追蹤計算能力達到191TFLOPS,是上一代產品2.8倍。
在Ampere架構中,第二代RTCores支持邊界交叉測試(BoxInterctiontesting)和三角形交叉測試(TriangleInterctiontesting),用于加速BVH遍歷和執行射線三角交叉測試計算,雖然光線追蹤處理能力已經比初代的Turing架構核心更高效,但是隨著環境和物體的幾何復雜性持續增加,傳統的處理方式很難再以更高效率、正確反應出的現實世界中的光線,尤其是光的運動準確性。
所以在第三代RTCores增加了兩個重要硬件單元:OpacityMicromapEngine與DisplacedMicro-MeshesEngine引擎。OpacityMicromapEngine,主要是用于alpha通道的加速,可以將alpha測試幾何體的光線追蹤速度提高2倍。
在傳統光柵渲染中,開發人員使用一些Alpha通道的素材來實現更高效的畫面渲染,例如Alpha通道的葉子或火焰等復雜形狀的物體。但在光線追蹤時代,這傳統的做法會為光線追蹤帶為不少無效的計算,例如運動性的光線多次通過一塊葉子,光線每擊中一次葉子,都會調用一次著色器來確定如何處理相交,這時就會做成嚴重的執行成本與時間等待成本。
而OpacityMicromapEngine用于直接解析具有非不透明度光線交集的不透明度狀態
三角形。根據Alpha通道的不透明,透明與未知等三個不同的塊狀態進行處理:透明則直接忽略繼續找下一個,不透明塊則記錄并告之命中,而未知的則交給著色器來確定如何處理,這樣GPU很大部分都不需要進行著色器的調試處理,能夠實現更為高效的性能。
DisplacedMicro-MeshesEngine
如果說OpacityMicromapEngine加速的是面處理,那么DisplacedMicro-MeshesEngine就是幾何曲面細節的加速器。如上圖所示,在AdaLovelace架構中,通過1個基底三角形+位移地圖,就可以創建出一個高度詳細的幾何網格,所需要資源占用比二代RTCores更低,效率也更高。
通過NVIDIA給出的創建14:1珊瑚蟹例子來說事,這里我們需要需要1.7萬個微網格、160萬個微三角形,在AdaLovelace架構中BVH創建速度可加快7.6倍,存儲空間縮小8.1倍。DisplacedMicro-MeshesEngine起到了關鍵性的作用,其將一個幾何物體根據不同細節分成密度不一的微網絡處理,紅色密度超高,細節處理越為復雜。相應的低密度微網絡區域則可以釋放更多的資源與存儲空間,這樣DisplacedMicro-MeshesEngine就可以幫助BVH加速過程,減少構建時間和存儲成本。
同時AdaLovelace架構SM中新增了著色器執行重排序(ShaderExecutionReordering,SER),這是由于光線追蹤不再只有強光或者陰影渲染處理,未來將會更多的是在光線的運動性,這樣光線就會變得越來越復雜,想要第三代RTCores與第四代TensorCores有著更高的執行效率,那就得為他們來安排一位管家。而著色器執行重排序(SER)就是為了能夠即時重新安排著色器負載來提高執行效率,為光線追蹤提供2倍的加速,也能更好地利用GPU資源。不過目前仍未有實例,想實現這個功能,還得游戲與開發工具的支持才行。
第四代TensorCores
TensorCores是專門為執行張量/矩陣運算而設計的專用執行單元,這些運算是深度學習中使用的核心計算功能。第四代TensorCores新增FP8引擎,具有高達1.32petaflops的張量處理性能,超過上一代的5倍。
8DLSS 3技術講解&雙編碼器
技術講解:DLSS 3
或者說第四代TensorCores太硬核你不會知道是啥?提升意義在哪?但是TensorCores最經典的應用DLSS你肯定會知道,這一次AdaLovelace架構支持NVIDIA最新的DLSS3技術。
https://images.nvidia.cn/cn/youtube-replicates/r-hu006p23I.mp4
之前我們也聊過DLSS技術,其設計之初是為了彌補光線追蹤技術后的性能損失,具體的表現為開啟光線追蹤技術后游戲幀數大幅度的下降,甚至很難保證游戲流暢的運行。于是DLSS使用低分辨率內容作為輸入并運用AI技術輸出高分辨率幀,從而提升光線追蹤的性能。
在DLSS3中包含了三項技術:DLSS幀生成、DLSS超分辨率(也稱為DLSS2)和NVIDIAReflex。你可以理解為DLSS3是在DLSS2的基礎上,新增了DLSS幀生成技術;而后兩技術中,DLSS超分辨率只需要GeForceRTX顯卡都能使用上,NVIDIAReflex則是GeForce900系列以后的顯卡都用使用上。
想實現DLSS幀生成可不簡單,這需要配合上AdaLovelace架構的GeForceRTX40系列顯卡才行。DLSS幀生成技術原理是:利用AI技術生成更多幀,以此提升性能。DLSS會借助GeForceRTX40系列GPU所搭載的全新光流加速器分析連續幀和運動數據,進而創建其他高質量幀,同時不會影響圖像質量和響應速度。
從Ampere架構開始,NVIDIA顯卡就已經支持了光流加速器,而AdaLovelace架構的光流加速器升級到了第二代,其提供了高達300TeraOPS(TOPS),比安培架構的初代光流加速器(OpticalFlowAcceleration,OFA)快2倍以上。為了實現DLSS幀生成,OFA扮演了重要的角色,其配合上新的運行矢量分析算法在DLSS3技術框架內實現精確和高性能的幀生成能力。
另外,由于DLSS幀生成是在GPU上作為后處理執行的,那么即使在游戲受到CPU性能限制的時候,我們同樣能夠從中獲得更好的游戲性能提升。尤其是那種物理計算密集型的游戲或大型場景游戲,DLSS2均可以讓GeForceRTX40系列顯卡以高達兩倍于CPU可計算的性能來渲染游戲。
最后由于DLSS3是建立在DLSS2基礎之上的,游戲開發者可以在已支持DLSS2或NVIDIAStreamline的現有游戲中快速集成該功能,所以DLSS3已在游戲生態得到廣泛應用,目前已有超過35款游戲和應用即將支持該技術。
閱讀小亮點:NVIDIAReflex
NVIDIAReflex也是DLSS3其中的一環,它可以使GPU和CPU同步,確保最佳響應速度和低系統延遲。
想要實現端對端的最低延遲,你需要確保游戲、顯示器以及鼠標三者都同時支持并開啟了Reflex技術。
當GeForceRTX40系列顯卡和NVIDIAReflex搭配上后,直接達到1440p分辨率360FPS的體驗,這著實是性能有點強勁了。
在GTC2022大會時已經透露將會還有4款1440p分辨率的新型G-SYNC電競顯示器將要發布,包括采用mini-LED技術的AOCAG274QGM–AGONPROMiniLED、MSIMEG271QMiniLED和ViewSonicXG272G-2KMiniLED三款顯示器刷新率均為300Hz,而最猛的是ASUSROGSwift360HzPG27AQN,刷新率直接來到了360Hz。
但唯一一個問題就在于,部分顯示器廠商認為此類產品受眾人群較少,會降低此類顯示器的產能,甚至產品就已經被內部PASS掉,所以1440p360Hz是很美好,但現實也是相當的骨感。
技術講解:雙NIVDIA編碼器(NVENC)
GeForceRTX40系列顯卡還有一個全新的升級,那就是雙編碼器NVENC。第八代的NVENC雙編碼器不僅支持H.264與H.265,還支持開放式視頻編碼格式AV1。
而由于AV1是一種免版稅的視頻編碼格式,上游軟件廠商與下游戲的配套端都在大力推廣此編碼格式,我們也會看到越來越多的硬件與軟件支持AV1格式,包括剪映專業版、DaVinciResolve、以及AdobePremierePro較為流行的Voukoder插件均支持,且均可通過編碼預設使用雙編碼器,這樣我們等待視頻導出的時間縮短將近一半。
不單是視頻制作軟件,AV1格式也將會是主播、游戲直播UP主們的新寵兒,在保證畫面最高質量的情況下,AV1編碼器可將效率提高40%,同時顯卡的占用也更低。包括OBSStudio一一代軟件中也會增加AV1格式的支持。另外我們還能通過GeForceExperience和OBSStudio錄制高達8K60的內容,這樣我們做游戲錄制也會變得更為輕松。
包括我們之后測試時使用的游戲內錄視頻都是支持AV1格式,同時雙編碼器NVENC在資源占用和適配上做得越來越好。
本文發布于:2023-02-28 20:09:00,感謝您對本站的認可!
本文鏈接:http://www.newhan.cn/zhishi/a/167765808077128.html
版權聲明:本站內容均來自互聯網,僅供演示用,請勿用于商業和其他非法用途。如果侵犯了您的權益請與我們聯系,我們將在24小時內刪除。
本文word下載地址:qq飛車管家加成怎么弄(qq飛車管家加成是什么).doc
本文 PDF 下載地址:qq飛車管家加成怎么弄(qq飛車管家加成是什么).pdf
| 留言與評論(共有 0 條評論) |