«100% вина NVIDIA»: Дженсен Хуанг признал ошибку в дизайне Blackwell, TSMC помогла ее исправить
«100% вина NVIDIA»: Дженсен Хуанг признал ошибку в дизайне Blackwell, TSMC помогла ее исправить

«100% вина NVIDIA»: Дженсен Хуанг признал ошибку в дизайне Blackwell, TSMC помогла ее исправить

«100% вина NVIDIA»: Дженсен Хуанг признал ошибку в дизайне Blackwell, TSMC помогла ее исправить - Фото 1

Недостаток дизайна графического процессора NVIDIA Blackwell, повлекший за собой задержку поставки чипов ИИ, был исправлен. Усовершенствованные B100 / B200 вот-вот поступят в массовое производство.

Генеральный директор Дженсен Хуанг признал, что недостаток был полностью вызван NVIDIA, отрицал вину TSMC, о которой ходили слухи, и подчеркнул, что тайваньский производитель помог исправить ее вовремя.

«У нас был недостаток дизайна Blackwell, он был функциональным, но недостаток дизайна привел к низкому выходу. Это была 100% вина NVIDIA» это 100% вина NVIDIA.

Когда появились первые сообщения о недостатке дизайна, некоторые СМИ сообщили, что виновата TSMC, и предположили, что это может вызвать напряжение между NVIDIA и ее партнером. По словам Хуанга, это не так, и проблема возникла из-за собственных просчетов NVIDIA. Он отверг сообщения о напряженности между двумя компаниями как «фейковые новости».

«Для того, чтобы компьютер Blackwell работал, семь различных типов чипов были разработаны с нуля, и их нужно было одновременно запустить в производство.
….
То, что TSMC сделала, это помогла нам исправить эту проблему с выходом [рабочих чипов] и возобновить производство Blackwell невероятными темпами».

Графические процессорыNVIDIA Blackwell B100 и B200 соединяют два чиплета с помощью технологии упаковки CoWoS-L от TSMC, которая опирается на интерпозер RDL с локальными кремниевыми мостами (LSI). Размещение этих мостов является критическим. Однако предполагаемое несоответствие в свойствах теплового расширения между чиплетами GPU, мостами LSI, промежуточным блоком RDL и подложкой вызвало деформацию системы и сбой. NVIDIA была вынуждена модифицировать верхние металлические слои и неровности кремния GPU, чтобы улучшить производительность.

Для решения таких проблем обычно требуется около 10 степпингов, каждый занимает около трех месяцев. Поэтому поражает скорость, с которой NVIDIA и TSMC исправили GPU Blackwell. Исправленные графические процессоры Blackwell для искусственного интеллекта и суперкомпьютеров поступят в массовое производство в конце октября, а поставки должны начаться в начале следующего года.

Однако еще в начале этого года NVIDIA предупредила, что для удовлетворения спроса на ее графические процессоры Blackwell среди основных поставщиков облачных услуг, таких как AWS, Google и Microsoft, все равно приведет к поставке какого-то количества начальных низкопроизводительных процессоров в 2024 году.

Источники: Reuters, Tom’s Hardware

«100% вина NVIDIA»: Дженсен Хуанг признал ошибку в дизайне Blackwell, TSMC помогла ее исправить - Фото 2
Источник материала
loader