Флагманський графічний процесор NVIDIA GA100 не годиться для ігор

Флагманський графічний процесор NVIDIA GA100 не годиться для ігор

Представляючи прискорювач обчислень A100 в середині травня, NVIDIA підкреслювала, що поставки графічних процесорів GA100 з архітектурою Ampere вже почалися. Трохи пізніше була опублікована технічна документація, яка дозволяє з'ясувати деякі нюанси, що враховують особливості застосування новинки. Зокрема, для трасування променів GA100 не годиться, адже це є важливим атрибутом старших відеокарт NVIDIA.


У цій документації NVIDIA відкритим текстом говорить, що в повній конфігурації GA100 містить вісім обчислювальних кластерів, 8192 ядра CUDA, 512 тензорних ядер, шість склів пам'яті HBM2 з 6144-розрядною шиною. У складі прискорювачів обчислень NVIDIA A100 використовується злегка усічена версія графічного процесора GA100, яка володіє тільки сімома обчислювальними кластерами, 6912 ядрами CUDA, 432 тензорними ядрами і п'ятьма стеками HBM2 з 5120-розрядною шиною. Виявляється й інша особливість A100 - обсяг кеш-пам'яті другого рівня зменшено з 48 до 40 Мбайт.

Фізично всі «надлишкові» блоки присутні на кристалі, вони просто відключені. Навіть кількість склів пам'яті типу HBM2 виробництва Samsung залишилася незмінною - на підкладці розмістилися всі шість штук, але один з них не працює. Така компоновка пояснює, чому при наявності шести склів пам'яті її загальний обсяг обмежений 40 Гбайт. Кожен стек містить 8 Гбайт пам'яті, але тільки в повній конфігурації сукупний обсяг HBM2 може досягати 48 Гбайт. На ринок така версія GA100 поки не поставляється.

У кожному стеку HBM2 мікросхеми пам'яті розташовані у вісім ярусів. Пам'ять працює на частоті 1215 МГц, що в сукупності з наявністю 5120-розрядної шини забезпечує пропускну здатність 1555 Гбайт/с. Це більш ніж в 1,7 рази вище, ніж у Tesla V100 (Volta).

У складі графічного процесора GA100 немає так званих RT-ядер, які відповідають за прискорення відмальовки графіки методом трасування променів. Це говорить про те, що на ігровий ринок шлях GA100 замовлений. NVIDIA доведеться розробити окремі графічні процесори з архітектурою Ampere для застосування в ігровому сегменті. Частота графічного процесора GA100 в його нинішньому вигляді обмежена 1410 МГц. Обчислювальний модуль у виконанні SXM4 розрахований на TDP до 400 Вт, в серверному шасі він здатний охолоджуватися повітряною системою, але в порівнянні з попередниками в радіаторі довелося значно збільшити кількість теплових трубок.