So sánh kiến trúc GPU Turning và Pascal trên card đồ hoạ NVIDIA
GPU (Graphics Processing Unit) là trái tim của card đồ họa và hoạt động của nó được xác định bởi kiến trúc của nó, được gọi là kiến trúc GPU. Mỗi họ card đồ họa có kiến trúc GPU riêng và mỗi họ hoặc series card đồ họa mới thường đi kèm với kiến trúc GPU tiên tiến và mạnh mẽ hơn.
Mỗi nhà sản xuất GPU thiết kế kiến trúc GPU của họ theo một cách riêng. NVIDIA là một tập đoàn đa quốc gia có trụ sở chính tại Santa Clara, California, được thành lập vào năm 1993, chuyên về sản xuất các bộ vi xử lý đồ họa (GPU) và công nghệ chipset cho các thiết bị điện tử có hỗ trợ hình ảnh. Hãng luôn đưa ra những sản phẩm mang tính đột phá. Cho tới nay, NVIDIA đã có những kiến trúc GPU là Fermi, Kepler, Pascal, Volta, Turing. Ở bài viết này, chúng tôi sẽ so sánh hai kiến trúc GPU hiện đại của Nvidia, đó là Pascal và Turing dựa trên thông số kỹ thuật, hiệu suất, cách sử dụng và ứng dụng của chúng trong ngành đồ họa.
1. Kiến trúc GPU Pascal
Pascal là một trong những kiến trúc GPU phổ biến nhất từ Nvidia và là kế vị của kiến trúc GPU Maxwell. Series card đồ họa GeForce 10 và series Quadro P được xây dựng trên kiến trúc GPU Pascal. GPU Pascal được xây dựng trên quy trình chế tạo 16nm / 14nm và sử dụng Cores CUDA làm đơn vị xử lý pixel chính của chúng và cho Rasterization. GeForce GTX 1050, GTX 1050 Ti và GT 1030 được xây dựng trên công nghệ FinFET 14nm trong khi các loại khác được xây dựng trên quy trình công nghệ 16nmm. Kiến trúc GPU Pascal mang lại những cải tiến đáng kể so với các kiến trúc cũ hơn về hiệu suất, mức tiêu thụ năng lượng (TDP) và sinh nhiệt.
Kiến trúc GPU Pascal hỗ trợ bộ nhớ GDDR5, GDDR5X và HBM2. Chỉ có card đồ họa máy trạm cao cấp hơn, Nvidia Quadro GP100 đi kèm với bộ nhớ HBM2 băng thông cao. Kiến trúc GPU Nvidia Pascal hỗ trợ DirectX 12, OpenGL 4.6, Vulkan, OpenCL, SLI (đối với thẻ GeForce cao cấp), NVLink (chỉ dành cho các GPU máy trạm hàng đầu), NVENC, G-Sync, GPU Boost 3.0, DisplayPort 1.4, HDMI 2.0b , CUDA Khả năng Tính toán 6.0 / 6.1 và VR Ready. GPU dựa trên Pascal cũng có thể được tìm thấy trong Notebook hoặc Laptop.
Nổi bật nhất tại thời điểm này cho các dòng NVIDIA Pascal là NVIDIA GTX 1080, hỗ trợ độ phân giải 4K, là card đồ họa đầu tiên hỗ trợ bộ nhớ GDDR5X – cho băng thông gấp đôi GDDR5, hỗ trợ đa màn hình, thiết lập kính VR và hỗ trợ màn hình chuẩn 4K ở một số Game.
2. Kiến trúc GPU Turing
Turing là sự kế thừa của kiến trúc GPU Volta. Đây là một trong những kiến trúc GPU tiên tiến nhất từng được tạo ra. GPU Turing được xây dựng trên quy trình sản xuất FinFET 12nm và hỗ trợ bộ nhớ GDDR6, hoạt động ở tốc độ rất cao, có thể đạt được băng thông cao hơn nhiều so với các bộ nhớ GDDR5X và GDDR5 trước đây. Kiến trúc GPU tiên tiến này đi kèm với các Core CUDA, Tensor và RT. Turing là kiến trúc GPU đầu tiên hỗ trợ Real Time Ray Tracing (Ray tracing thời gian thực) để tạo ra ánh sáng giống như thật, bóng tối, phản xạ, khúc xạ và các hiệu ứng ánh sáng tiên tiến khác. Ray tracing thời gian thực này được xử lý bởi Core RT và hiệu suất của nó được đánh giá trong một hệ đo lường mới gọi là Giga Rays trên mỗi giây.
Các core Tensor trong các GPU Turing được thiết kế đặc biệt cho Trí tuệ nhân tạo (AI) và Deep Learning để thực hiện các loại tính toán phức tạp khác nhau. Nó cũng được sử dụng cho một loại kỹ thuật gọi là Deep Learning Super-Sampling (DLSS) hoặc (Deep learning anti-aliasing) để làm mịn các cạnh răng cưa trong game và để khử nhiễu, chia độ phân giải và định lại thời gian video.
Các core CUDA được sử dụng cho các tác vụ xử lý dựa trên Pixel tiêu chuẩn hoặc Rasterization, nhưng trong Turing, chúng miêu tả kiến trúc đa xử lý trực tuyến (streaming multiprocessor – SM) mới hỗ trợ tới 16 nghìn tỷ phép tính điểm nổi song song với 16 nghìn tỷ phép tính số nguyên mỗi giây. Điều này giờ đây có thể cho phép các nhà phát triển tạo ra các mô phỏng phức tạp, chẳng hạn như các hạt hoặc động lực học chất lỏng để trực quan hóa khoa học, môi trường ảo và các hiệu ứng đặc biệt. Theo Nvidia, các GPU Turing cung cấp hiệu suất lên tới 6 lần so với các GPU dựa trên Pascal.
Có cả máy trạm workstation và card đồ họa chơi game dựa trên kiến trúc GPU Turing. Card đồ họa máy trạm Turing bao gồm Quadro RTX 8000, Quadro RTX 6000, Quadro RTX 5000. Và Card đồ họa chơi game bao gồm các dòng GeForce RTX 20 trong đó gồm có GeForce RTX 2080 Ti, RTX 2080, RTX 2070 và Nvidia TITAN RTX hùng mạnh. Turing hỗ trợ thiết lập đa GPU cho cả card đồ họa Quadro RTX và GeForce RTX bằng cách sử dụng NVLink để gấp đôi hoặc gấp ba hiệu suất tính toán của chúng. Card đồ họa GeForce RTX cũng hỗ trợ VirtualLink thông qua đầu nối USB Type-C để kết nối Tai nghe VR trên cổng USB Type-C cho trải nghiệm VR tuyệt vời. Mặt khác, GPU Quadro RTX có khả năng xử lý video 8K trong thời gian thực cho thấy sức mạnh của kiến trúc mới này.
Cập nhật: Card đồ họa Turing series GTX 16 không đi kèm với core RT và Tensor. Chúng bao gồm GTX 1660 Ti, GTX 1660.
3. So sánh kiến trúc GPU Pascal và Turing
Một so sánh nhanh và ngắn gọn về kiến trúc GPU Pascal và Turing từ Nvidia.
GPU Architecture -> | Pascal | Turing |
GPU Manufacturer | Nvidia | Nvidia |
Fabrication Process | 14nm / 16nm | 12nm |
CUDA Cores | Yes | Yes |
Tensor Cores | NA | Yes |
RT Cores | NA | Yes |
Memory support | DDR4, GDDR5, GDDR5X, HBM2 | GDDR6 |
VR Ready | Yes | Yes |
VirtualLink (USB Type-C) | NA | Yes |
Multi-GPU support | Yes (in high-end cards), SLI and NVLink | NVLink 2 / NVLink SLI |
Graphics Cards | GeForce 10 series, Nvidia Titan X, Nvidia Titan Xp, Quadro P series workstation graphics cards, Quadro GP100 | Quadro RTX 8000, Quadro RTX 6000, Quadro RTX 5000 / RTX series graphics cards |
Applications | Gaming, Workstation | Artificial Intelligence (AI), Workstation, Gaming |
Kết luận
Turing là sự kế thừa của công nghệ tiền nhiệm Pascal. Ngoài những khác biệt bên ngoài như cấu trúc của GPU, điểm khác biệt lớn nhất của Turing và Pascal là core xử lý TR cores và Tensor Cores, không thể phủ nhận thực tế rằng Turing là kiến trúc GPU tiên tiến nhất và đang dẫn đầu Pascal về mặt công nghệ. Turing là một kiến trúc GPU đa mục đích có thể thực hiện cả ba điều cùng một lúc, ví dụ: Xử lý pixel, Trí tuệ nhân tạo (AI) và Ray tracing thời gian thực, giúp chất lượng đồ họa của game trở nên sắc nét và chân thực. Pascal là một kiến trúc GPU rất lâu đời và thành công nhưng giờ đây nó đã thể hiện sự già cỗi của mình vì thiếu các chức năng tiên tiến của AI và Ray Tracing. Ngoài ra, Tensor Cores của Turing cũng hỗ trợ cho một kỹ thuật tiên tiến như Deep Learning Super-Sampling (DLSS) – giúp cho việc khử răng cưa, làm mịn ảnh, giữ cho độ phân giải của game đạt mức ổn định.
Hiện nay, iRender đã chính thức ra mắt dịch vụ cho thuê máy GPUđược cung cấp như 1 dịch vụ Iaas (Infrastructure As A Service). Hệ thống hạ tầng phục vụ nhu cầu thuê máy của chúng tôi gồm hơn 100 máy chủ và vẫn đang liên tục được mở rộng, với cấu hình từ 1 đến 12 card đồ họa GTX 1080 ti/ mỗi máy và 4 card RTX 2080 Ti/máy, được sử dụng để tăng tốc mọi tác vụ render GPU cho các file đồ họa 3D, gaming hay các tính toán nặng của bất kỳ ứng dụng nào cần tận dụng cấu hình từ phần cứng, đảm bảo hiệu suất nhanh chóng, đáng tin vậy và chất lượng cao mỗi phút giây các bạn sử dụng dịch vụ GPU Rental Service của iRender.
Nguồn: graphicscardhub.com; nvidia.com; thegioididong.com