Untuk GPU, Nvidia adalah pakar terkemuka. Berusaha dalam perniagaan sejak tahun 1993, Nvidia telah menghasilkan pelbagai GPU profesional dan pengguna berkualiti tinggi. Seni bina pemproses mereka yang terhormat berada di sebalik kejayaan produk mereka, terutamanya dari barisan utama mereka, GeForce. GPU Nvidia melampaui ruang permainan, memperluas kehadirannya dalam pembelajaran mendalam, AI (Kecerdasan Buatan), dan analisis dipercepat. Nvidia menyusup ke pasar pusat data sedekad yang lalu, bermula dengan cip Fermi. Pengulangan selanjutnya dibuat, dan syarikat terus mengeluarkan GPU yang memenuhi permintaan yang tidak puas hati untuk kelajuan pemprosesan yang lebih cepat di pusat data. GPU Nvidia telah berkembang selama bertahun-tahun, dan reka bentuk seni bina terutamanya mendorong evolusi.
Senibina Ampere Nvidia
Persaingan ketat di antara pengeluar GPU, tetapi Nvidia tidak menahan apa-apa untuk mengambil tempat teratas. Sebenarnya, Nvidia telah menguasai pasaran AI dalam dekad yang lalu. Pada tahun 2020, berita mengenai GPU 7nm pertama (8nm untuk bahagian pengguna) Nvidia dengan 54 bilion transistor yang dimampatkan dalam die kecil sedemikian membuat buzz. Berkod nama Ampere selepas ahli matematik Perancis André-Marie Ampère, Senibina pemproses Nvidia meningkatkan peningkatan besar berbanding pendahulunya, Turing dan Volta, menjanjikan lebih banyak fungsi, kecekapan yang lebih baik, dan prestasi yang lebih tinggi pada tahap kuasa yang lebih rendah. Ampere berada di belakang generasi kedua dari RPU RTX Nvidia, siri RTX 30, dan dikatakan dua kali lebih pantas daripada rakan seri RTX 20 mereka. Senibina Ampere juga merupakan kekuatan di sebalik GPU pusat data Nvidia A100.
Spesifikasi Ampere
Ampere adalah GPU 7nm / 8nm pertama Nvidia, penjejakan sinar pengguna generasi kedua, dan mempunyai teras tensor generasi ketiga. Ampere adalah seni bina yang mendasari GA100, GA102, dan GA104 GPU yang disematkan dalam GeForce RTX 3090, RTX 3080, RTX 3070, dan terbaru, RTX 3060. Nvidia juga dijadualkan untuk mengeluarkan RTX 3050 pada bulan-bulan berikutnya. Sementara itu, GPU GA100 perusahaan memberikan kuasa pengkomputeran 20x lebih banyak daripada GPU pusat data generasi sebelumnya. Berikut adalah gambaran keseluruhan GPU profesional dan pengguna berasaskan Nvidia Ampere [1]:
GPU | GA100 | GA102 | GA102 | GA104 |
---|---|---|---|---|
Kad grafik | Nvidia A100 | GeForce RTX 3090 | GeForce RTX 3080 | GeForce RTX 3070 |
Proses (nm) | TSMC N7 | Samsung 8N | Samsung 8N | Samsung 8N |
Transistor (bilion) | 54 | 28.3 | 28.3 | 17.4 |
Saiz Die (mm ^ 2) | 826 | 628.4 | 628.4 | 392.5 |
Konfigurasi GPC | 8 × 16 | 7 × 12 | 6 × 12 | 6 × 8 |
SM | 108 | 82 | 68 | 46 |
Coras CUDA | 6912 | 10496 | 8704 | 5888 |
Teras RT | Tiada | 82 | 68 | 46 |
Tensor Cores | 432 | 328 | 272 | 184 |
Jam Boost (MHz) | 1410 | 1700 | 1710 | 1730 |
Kelajuan VRAM (Gbps) | 2.43 | 19.5 (GDDR6X) | 19 (GDDR6X) | 14 (GDDR6) |
VRAM (GB) | 40 (48 maksimum) | 24 | 10 | 8 |
Lebar Bas | 5120 (maksimum 6144) | 384 | 320 | 256 |
ROP | 128 | 112 | 96 | 96 |
TMU | 864 | 656 | 544 | 368 |
GFLOPS FP32 | 19492 | 35686 | 29768 | 20372 |
RL TFLOPS | N / A | 69 | 58 | 40 |
Tensor TFLOPS FP16 (jarak dekat) | 312 (628) | 143 (285) | 119 (238) | 81 (163) |
Lebar jalur (GB / s) | 1555 | 936 | 760 | 448 |
TBP (watt) | 400 (250 PCIe) | 350 | 320 | 220 |
Nvidia A100
Nvidia A100 adalah GPU pertama yang menggunakan seni bina Ampere. Cip perusahaan disasarkan pada pusat data dan dirancang untuk tugas intensif GPU seperti pembelajaran mendalam dan AI. Dibina menggunakan proses 7nm TSMC, ia menempatkan sejumlah besar 54 bilion transistor. Ia telah mengungguli generasi sebelumnya GPU perusahaan dengan peningkatan prestasi 20x yang menampilkan 6,912 teras CUDA, 432 unit pemetaan tekstur, 160 ROP, teras Tensor generasi ketiga, dan VRAM 40GB dengan lebar jalur memori yang melebihi 1.6TB / saat. DGX A100 adalah sistem AI pertama di dunia dengan kelompok lapan A100 dan tanda harga yang besar $ 199,000.
GeForce RTX 30 Siri
Selain menguasai pasaran perusahaan, Nvidia selalu mempertimbangkan pengguna, terutama pemain dan pencipta. Senibina Ampere juga diadopsi dalam kad grafik pengguna Nvidia. Generasi kedua GeForce RTX membawa GPU berasaskan Ampere meningkatkan prestasi hingga dua kali ganda berbanding generasi sebelumnya.
Dalam kebanyakan aspek, Ampere mempunyai kekuatan pemprosesan Turing lebih dari dua kali ganda. Ini telah menggandakan prestasi shader Turing dengan dua kali ganda bilangan teras FP32 CUDA. Secara khusus, ia memiliki 30 Shader-TFLOPS, 2.7x lebih banyak daripada Turing yang hanya 11 Shader-TFLOPS. Begitu juga, Turing's Tensor Core mengukur 89 Tensor-TFLOPS, tetapi Ampere telah melipatgandakan kadar ini dengan 238 Tensor-TFLOPS. Tidak ketinggalan kadar Ray Tracing Core, iaitu 58 RT-TFLOPS, 1.7x lebih pantas daripada 34 RT-TFLOPS Turing, dan untuk menjadikan GPU berjalan lebih cepat, cip Ampere menghubungkan ke memori terpantas di dunia, Micron G6X.
Siri RTX 30 dibuat menggunakan Proses Custom Samsung 8N Nvidia dengan 28 bilion transistor untuk GA102 dan 17 bilion transistor untuk GA104. Kelas Titan RTX 3090 dikuasakan oleh GA102 GPU dan memberikan prestasi kad pengguna yang sangat hebat. Tidak seperti generasi sebelumnya, RTX 3090 terbuka untuk pihak ketiga untuk reka bentuk tersuai.
RTX 3080 juga menggunakan GPU GA102, memberikan prestasi RTX 2080 dua kali ganda dan kehebatan permainan 4K yang mengagumkan. RTX 3070, dikuasakan oleh GA104 GPU, setaraf dengan RTX 2080 Ti pada separuh harga. RTX 3060 yang baru dikeluarkan juga tidak pernah terkesan dengan prestasinya yang mengejutkan yang didorong oleh Ray Tracing Cores, Tensor Cores, multiprocessor streaming baru dan memori G6 berkelajuan tinggi.
Walaupun terdapat peningkatan prestasi yang besar, GPU RTX baru tidak terlalu berat. Kad grafik yang jauh lebih pantas dapat diakses dengan mudah ketika menggunakan harga. Kapal utama Nvidia GeForce, RTX 3080, bermula pada $ 699, RTX 3070 dijual pada $ 499, dan RTX 3060 mempunyai harga $ 329. RTX 3090 kelas atas berharga $ 1,499; masih sangat rendah memandangkan prestasi tahap Titannya.
Hanya beberapa bulan setelah dilancarkan, dilaporkan terdapat kekurangan kad grafik berasaskan Ampere, dan tidak menghairankan dengan prestasi Ampere yang menakjubkan dengan harga yang berpatutan. Bagi mereka yang mempertimbangkan peningkatan GPU, sekarang adalah masa terbaik untuk menggunakan GPU berasaskan Nvidia Ampere.
Sumber
[1] Walton, Jarred. “Nvidia RTX 30-Series Ampere Architecture Deep Dive: Semua yang Kita Tahu”. https: // www.barang pecah belah.com / features / nvidia-ampere-architecture-deep-dive. 13 Oktober 2020.