Nvidia khẳng định có thể giải quyết quá trình sản xuất chip, rút ngắn 40 lần với cuLitho

Tại GTC 2023, Nvidia đã công bố thư viện phần mềm cuLitho mới của mình để tăng tốc độ tắc nghẽn quan trọng trong quy trình sản xuất chất bán dẫn.

Thư viện mới tăng tốc độ in thạch bản tính toán, một kỹ thuật được sử dụng để tạo mặt nạ quang cho sản xuất chip.

Nvidia tuyên bố cách tiếp cận mới của họ cho phép 500 hệ thống DGX H100 sử dụng 4.000 GPU Hopper thực hiện khối lượng công việc tương đương với 40.000 máy chủ dựa trên CPU, nhưng thực hiện nhanh hơn 40 lần và tiêu thụ ít năng lượng hơn 9 lần. Nvidia tuyên bố điều này làm giảm khối lượng công việc in thạch bản tính toán để tạo mặt nạ ảnh từ vài tuần xuống còn 8 giờ.

CuLitho là gì?

CuLitho là một phần mở rộng của thư viện CUDA của NVIDIA được tối ưu hóa cho khối lượng công việc liên quan đến in thạch bản điện toán. Bao gồm các công cụ và thuật toán để tăng tốc GPU, cuLitho tuyên bố sẽ tăng tốc quá trình sản xuất chất bán dẫn theo thứ tự cường độ so với các phương pháp dựa trên CPU.

Cụ thể, NVIDIA đang tuyên bố tăng tốc độ in khắc ngược lên 40 lần với cuLitho, dẫn đến số lượng mặt nạ được tạo ra mỗi ngày nhiều hơn gấp 3 đến 5 lần so với mức có thể với các hệ thống CPU.

Nvidia khẳng định có thể giải quyết quá trình sản xuất chip, rút ngắn 40 lần với cuLitho - Ảnh 1.

Các nhà lãnh đạo sản xuất chip TSMC, ASML và Synopsys đều đã đăng ký sử dụng công nghệ mới, với Synopys đã tích hợp nó vào các công cụ thiết kế phần mềm của mình. Theo thời gian, Nvidia hy vọng phương pháp mới sẽ cho phép mật độ và năng suất chip cao hơn, quy tắc thiết kế tốt hơn và kỹ thuật in khắc do AI hỗ trợ.

Các nhà khoa học của Nvidia đã tạo ra các thuật toán mới cho phép quy trình in thạch bản tính toán ngày càng phức tạp thực thi song song trên các GPU, cho thấy tốc độ tăng gấp 40 lần khi sử dụng GPU Hopper. Các thuật toán mới được tích hợp vào một thư viện tăng tốc cuLitho mới có thể được tích hợp vào phần mềm của các nhà sản xuất mặt nạ (thường là xưởng đúc hoặc nhà thiết kế chip). Thư viện tăng tốc cuLitho cũng tương thích với GPU Ampere và Volta, mặc dù Hopper là giải pháp nhanh nhất.

Việc in các tính năng nhỏ trên chip bắt đầu bằng một khối thạch anh được gọi là mặt nạ ảnh. Thạch anh trong suốt này có hoa văn in chìm của thiết kế chip và hoạt động giống như một khuôn tô — chiếu ánh sáng qua mặt nạ khắc thiết kế lên tấm wafer, do đó tạo ra hàng tỷ bóng bán dẫn 3D và cấu trúc dây tạo nên một con chip hiện đại. 

Mỗi thiết kế chip yêu cầu nhiều lần tiếp xúc để xây dựng thiết kế của chip theo từng lớp. Do đó, số lượng mặt nạ quang được sử dụng trong quá trình sản xuất chip thay đổi tùy theo chip; nó thậm chí có thể vượt quá 100 mặt nạ. Chẳng hạn, Nvidia cho biết cần 89 mặt nạ để tạo ra H100 và Intel trích dẫn '50+' mặt nạ được sử dụng cho chip 14nm của họ.

Các kỹ thuật mới đã xuất hiện cho phép khắc các đặc điểm nhỏ hơn bước sóng của ánh sáng được sử dụng để tạo ra chúng. 

Tuy nhiên, sự co rút liên tục của các tính năng đã dẫn đến các vấn đề về nhiễu xạ, về cơ bản làm "mờ" thiết kế được in trên silicon. Lĩnh vực in thạch bản tính toán chống lại tác động của nhiễu xạ thông qua các phép toán phức tạp giúp tối ưu hóa bố cục mặt nạ. 

Nhiệm vụ này ngày càng trở nên chuyên sâu về điện toán khi các tính năng thậm chí còn thu hẹp hơn nữa, do đó cho phép có thêm hàng tỷ bóng bán dẫn trên mỗi thiết kế.

Nvidia khẳng định có thể giải quyết quá trình sản xuất chip, rút ngắn 40 lần với cuLitho - Ảnh 2.

Hỗ trợ quá trình in thạch bản diễn ra nhanh hơn từ thư viện mới.

Những vấn đề phức tạp này yêu cầu các cụm máy tính lớn, thường có số lượng hàng chục nghìn máy chủ (Nvidia trích dẫn 40.000), xử lý các con số song song trên CPU trong một khối lượng công việc có thể mất tới hàng tuần để xử lý một mặt nạ quang (lượng thời gian khác nhau dựa trên độ phức tạp của chip — Intel cho biết nhóm của họ phải mất năm ngày để tạo ra một mặt nạ duy nhất).

Nvidia cho rằng số lượng máy chủ cần thiết để thiết kế mặt nạ hiện đại đang tăng với tốc độ tương tự như Định luật Moore, do đó đẩy các yêu cầu máy chủ và lượng điện năng cần thiết để vận hành chúng vào lãnh thổ không bền vững. 

Trên thực tế, các yêu cầu điện toán đáng kinh ngạc đối với công nghệ mặt nạ mới, chẳng hạn như Công nghệ Inverse Lithography (ILT) sử dụng Mặt nạ đường cong nghịch đảo (ILM), đã cản trở việc áp dụng các kỹ thuật tiên tiến hơn này. Ngoài ra, EUV và ILT NA cao dự kiến sẽ tăng khối lượng xử lý dữ liệu cho khẩu trang lên gấp 10 lần trong những năm tới.

Việc áp dụng cuLitho của Nvidia sẽ giảm khối lượng công việc in thạch bản tính toán xuống còn tám giờ. Thư viện cuLitho có thể được tích hợp vào phần mềm in thạch bản tính toán sử dụng ILT (hình dạng đường cong) hoặc Chỉnh sửa tiệm cận quang học (OCP, sử dụng các kỹ thuật hình dạng 'Manhattan') và đã được tích hợp vào các công cụ của Synopsys. 

TSMC và ASML cũng đang áp dụng công nghệ này. Do tính nhạy cảm của các loại phần mềm này, các biện pháp kiểm soát xuất khẩu của Mỹ sẽ chi phối mọi hoạt động phân phối phần mềm này tới Trung Quốc và các khu vực khác chịu lệnh trừng phạt.

Intel từ lâu đã sử dụng các công cụ phần mềm độc quyền của riêng mình nhưng đang dần chuyển sang áp dụng các công cụ tiêu chuẩn ngành, đặc biệt là khi hãng bắt đầu triển khai các hoạt động đúc kết IDM 2.0 bên ngoài của riêng mình. 

Do đó, vẫn chưa biết liệu các nhà sản xuất lớn khác, như Intel và Samsung, có áp dụng phần mềm mới cho các công cụ nội bộ của riêng họ hay không. Bất chấp điều đó, sự hỗ trợ từ Synopsys, ASML và TSMC đảm bảo việc sử dụng rộng rãi thư viện cuLitho và các giải pháp dựa trên GPU của Nvidia với các nhà sản xuất chất bán dẫn hàng đầu trong những năm tới.

LAN ANH