Tất cả chuyên mục
Thứ Bảy, 02/11/2024 07:26 (GMT +7)
Tesla Dojo D1: Con chip rất mạnh chuyên dùng huấn luyện AI của Tesla
Thứ 2, 23/08/2021 | 10:51:28 [GMT +7] A A
Tesla vừa giới thiệu một con chip mà họ tự thiết kế chuyên dùng cho các server huấn luyện mô hình AI mang tên Dojo D1.
Con chip này được tối ưu cho các tác vụ trí tuệ nhân tạo, tương tự như những gì mà Google, Amazon, Intel, Baidu, NVIDIA đang làm, có điều Dojo D1 sinh ra là dành cho Tesla nên sẽ có hiệu quả cao hơn. Hiện D1 đang được dùng bởi siêu máy tính Dojo cũng của Tesla luôn. TSMC là đơn vị sản xuất D1 dựa trên dây chuyền 7nm, nó có 50 tỉ bóng bán dẫn với diện tích đế chip lên tới 645 mm vuông, rất to (vì dùng cho server chứ không phải xe hay thiết bị di động).
Tesla khoe con chip này có hiệu năng mạnh nhất là 362 TeraFLOPs với tác vụ tính toán FP16 hoặc 22,6 TeraFLOPs nếu là FP32. Để bạn dễ hình dung thì GPU NVIDIA A100 Ampere hiện chỉ chạy được 312 TeraFLOPs với tác vụ FP16.
Nhìn ở mức sâu hơn, con chip này cấu thành từ nhiều Functional Unit (FU), chúng được liên kết lại với nhau để tạo ra một con chip tổng thể. Mỗi FU chứa một CPU 64-bit với tập lệnh được tùy biến để thực hiện các tác vụ về tính toán ma trận cùng với bộ nhớ 1.25MB SRAM. Mỗi FU có sức mạnh 1 TeraFLOP FP16 hoặc 64 GigaFLOPs FP32, băng thông 512 GB/s theo bất kì hướng nào của mạng lưới. Tesla nói phần dây dẫn để kết nối các FU nếu bung thẳng ra thì có chiều dài tới 17,7km.
Những con chip D1 có thể được kết nối với nhau theo cấu hình 5 x 5, tức là trên 1 tấm “plate” có 25 con D1 cùng hoạt động, khi đó tổng sức mạnh của plate sẽ là 9PFLOPs, băng thông 36TBps và diện tích của nó lên tới 30x30x10cm.
Sau đó, Tesla lấy các plate này kết nối theo cấu hình 2 x 3 và để vào một cái khay, mỗi tủ có 2 khay như thế, tổng sức mạnh 100PFLOPs, băng thông 12TBps.
Công ty nào rồi cũng tới lúc phải tự làm chip cho mình, khi mà họ phát triển nhanh, muốn làm chuyện khác biệt mà những giải pháp chip khác trên thị trường không thể đáp ứng được.
Theo tinhte.vn
Liên kết website
Ý kiến ()