Instinct MI325X là bản kế nhiệm của MI300 ra mắt cuối năm 2023 song được tăng VRAM lên 256 GB HBM3e thay vì 192 GB HBM3 như phiên bản đời trước. Cách thức này tương tự chip AI H200 của Nvidia từ năm 2023 khi giữ nguyên khả năng tính toán nhưng tăng dung lượng bộ nhớ và băng thông.
Theo trang web về lĩnh vực công nghệ The Register, hướng đi của AMD được coi là hợp lý giữa lúc chip AI cần xử lý khối lượng công việc lớn. Bộ nhớ càng nhanh và càng nhiều, hiệu suất vận hành càng tốt.
So với Nvidia, AMD đã mang lại "làn gió mới" khi đưa nhiều bộ nhớ băng thông cao (HBM) hơn vào chip, đáp ứng nhu cầu của các nhà cung cấp đám mây muốn triển khai mô hình với quy mô nghìn tỷ tham số, như GPT-4o của OpenAI, trên ít nút xử lý hơn.
MI325X cung cấp mức tăng băng thông bộ nhớ 6 TB/giây, cao hơn so với 5,3 TB/giây trên MI300X. AMD cho biết trong thử nghiệm thực tế, MI325X sức mạnh cao hơn Nvidia H200 từ 20% đến 40% về hiệu suất suy luận đối với mô hình Llama 3.1 70B (70 tỷ tham số) và 405B (405 tỷ tham số) của Meta.
Theo AMD, Instinct MI325X sẽ được sản xuất hàng loạt trong quý IV/2024, tương thích với các hệ thống của những doanh nghiệp như Dell, Eviden, Gigabyte, Hewlett Packard Enterprise, Lenovo, Supermicro. Tuy vậy, AMD chưa công bố giá bán sản phẩm này. Ngoài MI325X, phiên bản MI355X sẽ được trình làng trong năm 2025.
AMD kỳ vọng MI325X sẽ có thể cạnh tranh với Nvidia. Hiện tại, Nvidia đang thống trị thị trường GPU AI. Tuy vậy, nếu các nhà phát triển và doanh nghiệp điện toán đám mây chọn chip của AMD thay thế thì vị thế của Nvidia sẽ không còn vững vàng như trước.
GPU, còn được gọi là đơn vị xử lý đồ họa chính, là một phần trung tâm của phần cứng hệ thống trên điện thoại thông minh. GPU giúp xử lý các yếu tố xuất hình ảnh trên màn hình điện thoại, từ đó giúp hình ảnh xuất ra rõ ràng và mượt mà hơn.
AMD đặt mục tiêu giành thị phần từ các doanh nghiệp đối thủ hay ít nhất chiếm thị phần không nhỏ ở thị trường dự kiến đạt 500 tỷ USD vào năm 2028. Theo Chủ tịch kiêm Giám đốc điều hành (CEO) của AMD, bà Lisa Su, nhu cầu về AI tiếp tục tăng và vượt xa dự kiến.
Với MI325X, AMD đang tăng tốc tiến độ trình làng sản phẩm mới hàng năm để cạnh tranh với Nvidia. Bà Lisa Su cho biết MI300X bắt đầu được chuyển giao cho khách hàng cuối năm 2023. Trong khi đó, theo dự kiến, AMD sẽ công bố chip MI350 trong năm 2025 và chip MI400 trong năm 2026.
Hồi tháng 7/2024, AMD cho biết doanh thu từ mảng trung tâm dữ liệu của công ty này trong quý II/2024 tăng hơn gấp đôi so với cùng kỳ năm 2023 lên 2,8 tỷ USD, với doanh thu từ chip AI chiếm khoảng 1 tỷ USD.
Việc trình làng thành công GPU mới nhất của AMD có thể thu hút sự quan tâm của giới đầu tư đang cân nhắc rót vốn vào các doanh nghiệp "phất lên" nhờ sự tăng trưởng mạnh của lĩnh vực AI. Kể từ đầu năm 2024 đến nay, giá cổ phiếu AMD đã tăng 20% trong khi giá cổ phiếu Nvidia tăng hơn 175%. Hầu hết chuyên gia trong ngành công nghiệp chip thế giới nhận định Nvidia hiện chiếm hơn 90% thị phần thế giới về chip AI dành cho trung tâm dữ liệu.
(Theo TTXVN/Bloomberg)