Mới đây máy tính mình gặp vấn đề là đang dùng bình thường thì máy bỗng lag, kiểm tra thì thấy xung nhịp CPU bị bóp xuống còn chưa đến 1 GHz. Nguyên nhân không phải do phần cứng hay phần mềm, mà là chip quá nóng khi chạy 1 số ứng dụng, buộc hệ thống phải tự hạ xung để tránh quá nhiệt. Bởi vậy nên hiệu năng không chỉ đến từ cấu trúc chip hay tốc độ xử lý, mà còn phụ thuộc rất nhiều vào khả năng tản nhiệt.
Thời nay, hiệu năng của chip đôi khi không còn bị giới hạn bởi số transistor hay xung nhịp, mà bởi nhiệt độ. Khi công suất tỏa nhiệt của các GPU thế hệ mới vượt ngưỡng 1 kW mỗi con, việc kiểm soát nhiệt trở thành yếu tố quyết định. Loạt GPU của Huawei mạnh mẽ là thế, nhưng đang gặp khó khăn vì vấn đề tản nhiệt khiến hiệu năng không đạt kỳ vọng dù phần cứng cực kỳ ấn tượng.
Quay sang NVIDIA, họ mới đây đã phát triển GB200 – một module kết hợp độc đáo giữa hai GPU Blackwell và một CPU Grace. Bộ ba này được thiết kế hoạt động song song, chia sẻ cùng bộ nhớ và liên kết thông qua giao thức NVLink-C2C siêu nhanh. GPU Blackwell đảm nhiệm khối lượng tính toán khổng lồ trong AI và HPC, trong khi CPU Grace tối ưu cho truy xuất bộ nhớ và xử lý tuần tự. Sự kết hợp này cho phép hệ thống đạt hiệu suất trên hàng chục PFLOPS, nhưng cũng kéo theo công suất tản nhiệt khổng lồ tới 2.7 kW.
Để giải quyết khối năng lượng này, NVIDIA sử dụng hệ thống làm mát hybrid (Hybrid Cooling System) với tổng độ dày chỉ 7 mm (chuẩn 1U). Tấm làm mát được thiết kế hai tầng gồm:
- Lớp trên: bộ phân phối vi tia (micro-jet distributor) dẫn dòng chất làm mát chính xác vào vùng GPU và CPU có mật độ nhiệt cao.
- Lớp dưới: cấu trúc vi kênh (microchannel) kích thước chỉ 0.25 × 0.5 mm, kết hợp lớp graphene nano composite giúp tăng hệ số truyền nhiệt α.
Hệ thống được tối ưu cho lưu lượng chất làm mát 0.07 kg/s, chênh lệch nhiệt độ chất lỏng chỉ 5 °C, tổn thất áp suất ≤ 20 kPa, và đạt điện trở nhiệt ấn tượng R_th ≈ 0.012 °C/W.
Nói cách khác, NVIDIA đã thành công trong việc “nhốt” 2.7 kW công suất tỏa nhiệt vào một tấm lạnh mỏng dưới 7 mm, đảm bảo khả năng làm mát đồng đều, tiết kiệm năng lượng và duy trì hiệu năng cực đại cho hệ thống.

 
					
















