Ketika NVIDIA meluncurkan kartu grafis GeForce RTX 4000 Series sebagai pengumuman besar dari siaran khusus GTC 2022 GeForce Beyond, segera jelas bahwa DLSS 3 memainkan peran penting dalam mencapai lompatan kinerja generasi yang belum pernah terjadi sebelumnya (2x-4x) yang diklaim oleh NVIDIA.
Hampir semua tolok ukur yang dibagikan oleh pabrikan menyertakan teknologi DLSS 3 baru, dan beberapa yang tidak menunjukkan peningkatan kinerja dibandingkan GeForce RTX 3000 Series yang lebih sesuai dengan apa yang kami harapkan dari generasi grafis baru kartu-kartu.
Sekarang GeForce RTX 4090, GPU unggulan (setidaknya hingga model Ti yang tak terhindarkan) dan juga yang pertama dari arsitektur Ada Lovelace baru yang diluncurkan, telah berada di tangan pengulas untuk sementara waktu, kami telah dapat memverifikasi seberapa banyak DLSS 3 meningkatkan kinerja. Namun, hal pertama yang pertama, mari kita lihat apa yang ada di balik kap mesin.
Kartu grafis GeForce RTX baru dilengkapi dengan Tensor Cores generasi keempat, yang mencakup 8-Bit Floating Point (FP8) Tensor Engine baru, meningkatkan throughput hingga 5X menjadi sekitar 1,32 Tensor-petaFLOPS pada RTX 4090.
Namun, dengan DLSS 3, NVIDIA mengambil satu langkah di luar DLSS Super Resolution. Sekarang ada autoencoder konvolusi Generasi Bingkai DLSS baru yang menghasilkan seluruh bingkai sendiri berdasarkan bidang aliran optik yang dihitung dengan Akselerator Aliran Optik.
Optical Flow Accelerators telah tersedia di GPU NVIDIA sejak arsitektur Turing. Namun, seperti yang dijelaskan sebelumnya oleh VP Applied Deep Learning Research Bryan Catanzaro, kartu grafis baru dilengkapi dengan versi OFA yang jauh lebih cepat dan lebih canggih, itulah sebabnya DLSS 3 saat ini menjadi eksklusif kartu grafis GeForce RTX 4000.
Bingkai yang dihasilkan berada di antara bingkai yang direkonstruksi dengan DLSS Super Resolution. Dengan demikian, NVIDIA mengklaim bahwa dalam setiap dua frame, hanya seperdelapan dari piksel yang ditampilkan ditampilkan secara normal, sementara sisanya direkonstruksi antara Super Resolution dan Frame Generation, memberikan peningkatan frame rate yang besar.
Untuk memperhitungkan peningkatan latensi yang disebabkan oleh Frame Generation, NVIDIA telah menyematkan teknologi Reflex penurun latensi untuk memastikan responsivitas tetap optimal.
Hassan kami telah dapat menguji GeForce RTX 4090 dengan semua game yang kompatibel dengan DLSS 3 yang dibagikan NVIDIA dengan pengulas. Dia memilih preset Kualitas (pada resolusi 4K, tentu saja) karena dia merasa bahwa kartu grafis baru sudah menjalankan sebagian besar game dengan cukup cepat sehingga tidak masuk akal untuk menurunkan resolusi rendering dasar dengan menurunkan preset DLSS.
Cyberpunk 2077
Pertama ada Cyberpunk 2077 dari CD Projekt RED, game terakhir yang menggunakan Red Engine internal studio sebelum beralih ke Unreal Engine 5. Perhatikan bahwa build Cyberpunk 2077 tidak menyertakan Mode Overdrive Ray Tracing yang akan datang, yang juga diumumkan selama siaran GeForce Beyond. Mode Overdrive akan menambahkan teknik penelusuran sinar yang canggih dan melelahkan seperti RTX Direct Illumination, pantulan resolusi penuh, dan beberapa pencahayaan tidak langsung yang terpental. NVIDIA memperkirakan itu akan mengurangi kinerja sekitar 51 FPS pada 4K dengan DLSS 3, meskipun mungkin juga dapat menyerap pukulan lebih baik daripada DLSS 2.
Namun, dengan game saat ini, DLSS 3 hanya meningkatkan FPS rata-rata sebesar 16,1% dan satu persentil frame rate sebesar 15,3% dibandingkan DLSS 2.
Tangkapan Layar DLSS 3 (Klik Untuk Memperbesar):
Tangkapan Layar Asli (Klik Untuk Memperbesar):
Kisah Wabah: Requiem
Selanjutnya, salah satu game pertama yang dirilis secara publik dengan dukungan DLSS 3, Asobo Studio’s A Plague Tale: Requiem (dijadwalkan minggu depan – nantikan ulasan kami segera). Didukung oleh Unreal Engine 4, A Plague Tale: Requiem menghadirkan teknologi terbaru yang dapat mendukung jumlah tikus yang jauh lebih tinggi dibandingkan dengan game aslinya, serta pencahayaan dinamis yang ditingkatkan. Versi final juga akan menyertakan beberapa bentuk ray tracing, tetapi versi yang diuji tidak.
Dalam hal ini, DLSS 3 memberikan peningkatan kinerja 29% dibandingkan DLSS 2 dalam FPS rata-rata dan peningkatan 39,1% dalam satu persentil frame rate. Dorongan kemungkinan akan lebih besar setelah ray tracing diaktifkan.
Tangkapan Layar DLSS 3 (Klik Untuk Memperbesar):
Tangkapan Layar Asli (Klik Untuk Memperbesar):
F1 2022
F1 22 dari Codemasters, yang ditenagai oleh EGO Engine 4.0, sejauh ini merupakan yang paling ringan dari semua game yang diuji, memberikan frame rate tertinggi bahkan dengan opsi ray tracing yang diaktifkan.
Dengan demikian, pada edisi tahun ini dari game Formula 1 berlisensi resmi, DLSS 3 hanya dapat lebih meningkatkan FPS rata-rata sebesar 20,5% dan FPS minimum sebesar 22,4%.
Tangkapan Layar DLSS 3 (Klik Untuk Memperbesar):
Tangkapan Layar Asli (Klik Untuk Memperbesar):
Simulator Penerbangan Microsoft
Kekuatan sebenarnya dari DLSS 3 dapat dilihat di Microsoft Flight Simulator. Sementara DLSS 2 tidak dapat meningkatkan permainan yang terikat CPU dengan cara apa pun yang berarti, komponen kunci dari versi baru DLSS 3, Frame Generation, benar-benar tidak bergantung pada hambatan CPU apa pun.
Dengan demikian, ada peningkatan besar-besaran 106% pada rata-rata FPS dan peningkatan yang lebih besar lagi sebesar 115% pada FPS minimum selama implementasi DLSS 2.
Tangkapan Layar DLSS 3 (Klik Untuk Memperbesar):
Tangkapan Layar Asli (Klik Untuk Memperbesar):
Demo Musuh Persatuan
Tes DLSS 3 terakhir yang disediakan oleh NVIDIA adalah demo teknologi Unity Engine Enemies yang cantik, awalnya dipamerkan di GDC 2022. Namun, dalam kasus ini, kami tidak dapat membuat perbandingan langsung dengan DLSS 2 karena tidak tersedia sebagai opsi dalam demo . Dibandingkan dengan rendering asli, DLSS 3 memberikan peningkatan FPS rata-rata 235% dan peningkatan 319% dalam satu persentil frame rate.
Tangkapan Layar DLSS 3 (Klik Untuk Memperbesar):
Tangkapan Layar Asli (Klik Untuk Memperbesar):
Ringkasan
Seperti yang dicatat NVIDIA selama presentasi teknologinya, DLSS 3 benar-benar dapat meningkatkan kinerja selama skenario terikat-CPU seperti Microsoft Flight Simulator serta dalam game ray-trace paling canggih. Dengan demikian, potensi sebenarnya akan dibuka dengan game besok.
Saat diuji dalam judul yang sudah berjalan pada kecepatan bingkai yang sangat tinggi, peningkatannya dibandingkan dengan DLSS 2 biasa lebih terbatas (setidaknya saat menggunakan prasetel Kualitas – saya rasa prasetel Kinerja dan Kinerja Ultra dapat memperlebar kesenjangan). Itu sebagian besar karena RTX 4090 adalah binatangnya sendiri, memberikan peningkatan kinerja yang substansial dibandingkan kartu teratas generasi sebelumnya bahkan saat menggunakan DLSS 2 atau rendering asli. Jika Anda pernah ingin bermain game di 4K, 144+FPS dengan semua pengaturan grafis diubah menjadi maksimal, RTX 4090 dan DLSS 3 dapat dengan mudah menghadirkannya.
Seperti yang pertama kali dicatat dalam praktik awal Digital Foundry dengan teknologi, komponen Frame Generation terkadang dapat memperkenalkan artefak. Namun, itu sangat sulit untuk diperhatikan selama gameplay biasa. Mungkin juga algoritme Pembuatan Bingkai akan ditingkatkan dari waktu ke waktu untuk mengurangi gangguan ini, seperti yang dilakukan NVIDIA dengan DLSS Super Resolution.
Last but not least, saya harus mengakui bahwa saya paling terkesan dengan pengukuran latency. Selama presentasi pers, para insinyur NVIDIA telah mengisyaratkan bahwa latensi terendah akan diperoleh dengan kombinasi DLSS 2 dan Reflex daripada DLSS 3 karena komponen Frame Generation-nya. Namun, data menunjukkan DLSS 3 menjadi yang teratas dalam semua kasus, terkadang dengan perbedaan yang berarti dibandingkan DLSS 2 + Reflex. Pengujian lebih lanjut akan diperlukan, tetapi sepertinya pemilik Seri RTX 4000 mungkin tidak memiliki alasan untuk mematikan Frame Generation.
Produk yang disebutkan dalam posting ini