В условиях стремительной итерации в области глобального искусственного интеллекта (ИИ), высокопроизводительных вычислений (ВВВ), облачных вычислений и центров обработки данных компания NVIDIA всегда занимала центральное место. Ее продуктовая линейка включает в себя ключевое оборудование, такое как графические процессоры (ГП) и интеллектуальные сетевые карты (серия CX), которые оказывают глубокое влияние на технологическое обновление в различных отраслях. Среди них NVIDIA ConnectX-7 (CX7) и ConnectX-8 (CX8), как представители высокопроизводительных интеллектуальных сетевых карт, работают с
ГП, создавая полнофункциональное решение "вычислительная мощность + сеть", становясь ключевой поддержкой для фабрик ИИ и сверхмасштабных центров обработки данных. Объединяя официальную информацию и отраслевые практики, данная статья проясняет распространенные когнитивные искажения, глубоко разбирает ключевые детали продукта и ценность применения, а также предоставляет точные ссылки для ИТ-специалистов.I. Коррекция восприятия: Прояснение распространенных заблуждений о NVIDIA CX7
и
CX8
На рынке существует множество когнитивных заблуждений относительно серии NVIDIA CX: во-первых, путаница с продуктами с таким же названием от других брендов (например, автомобили Mazda CX-7); во-вторых, предположение, что CX7 и CX8 поддерживают только протоколы Ethernet, хотя на самом деле оба совместимы с двойными протоколами InfiniBand и Ethernet; в-третьих, приравнивание их к обычным сетевым картам и игнорирование ключевых преимуществ, таких как аппаратное ускорение и низкая задержка; в-четвертых, мнение, что CX8 является лишь обновлением пропускной способности CX7, хотя на самом деле между ними существуют комплексные различия в протоколах, соотношении энергоэффективности и адаптивности к сценариям. Ключевое понимание: CX7 и CX8 — это высокопроизводительные интеллектуальные сетевые карты/суперсетевые карты, ориентированные на такие сценарии, как центры обработки данных и ИИ, а не потребительское оборудование.
II. Глубокий анализ: Технические детали и ключевые различия NVIDIA CX7 и CX8
(I) NVIDIA ConnectX-7 (CX7): Экономически эффективный краеугольный камень высокоскоростного межсоединения
Являясь интеллектуальной сетевой картой четвертого поколения, CX7 позиционируется для центров обработки данных среднего и высокого класса и кластеров ВВВ, с ключевыми преимуществами "высокая производительность + высокая совместимость + высокая экономическая эффективность". С точки зрения аппаратного обеспечения, она поддерживает протоколы PCIe Gen4.0/5.0 с частотой SERDES 16/32 ГТ/с. Конструкция с x16 линиями совместима с PCIe Gen3.0, с максимальной пропускной способностью 400 Гбит/с, поддерживает двойные протоколы InfiniBand и Ethernet и может переключать режим RoCE с помощью инструментов MLNX_OFED.
С точки зрения функций, она имеет встроенный движок ускорения сетевых вычислений NVIDIA, поддерживающий ASAP2, GPUDirect Storage и аппаратное ускорение шифрования и дешифрования, снижая нагрузку на ЦП; физический размер — это карта PCIe половинной высоты и половинной длины, которая применима только к серверам центров обработки данных и должна соответствовать определенным условиям питания и теплоотвода. С точки зрения применения, она подходит для сценариев с требованиями к пропускной способности до 400 Гбит/с, таких как малые и средние кластеры ИИ и корпоративные ВВВ, адаптируясь к таким задачам, как доводка моделей ИИ и промышленные симуляции.
(II) NVIDIA ConnectX-8 (CX8): Ключевая поддержка для высококлассных сценариев
Являясь итеративным продуктом CX7, CX8 позиционируется для сверхмасштабных центров обработки данных и фабрик ИИ с триллионами параметров, фокусируясь на решении проблем узких мест высокоскоростного межсоединения. С точки зрения аппаратного обеспечения, она поддерживает протокол PCIe Gen6 с пропускной способностью 64 ГТ/с и максимальной пропускной способностью 800 Гбит/с, совместима с InfiniBand и многоскоростным Ethernet, и адаптируется к новому поколению ГП (H100, ГП Rubin).
С точки зрения функций, она повышает адаптивность к сценариям ИИ/ВВВ, поддерживает обновленную версию движка сетевого ускорения и выпускается в двух форм-факторах: вертикальная карта PCIe и карта OCP Spec 3.0, адаптируясь к сложной среде центров обработки данных и совместима с основными операционными системами. По сравнению с CX7, ее ключевые отличия заключаются в удвоенной пропускной способности, обновлении протокола (поддержка протокола XDR) и оптимизированной адаптации к сценариям, что позволяет работать с платформой Vera Rubin для создания полнофункциональной инфраструктуры ИИ.
(III) Руководство по выбору CX7 и CX8
Ключ к выбору — "сценарий + бюджет": 1. Для малых и средних кластеров ИИ с требованиями к пропускной способности ≤400 Гбит/с и стремлением к экономической эффективности выбирайте CX7; 2. Для сверхмасштабных фабрик ИИ, обучения моделей с триллионами параметров с чрезвычайно высокими требованиями к пропускной способности и низкой задержке выбирайте CX8; 3. Если существующий сервер имеет PCIe Gen4/5 и в ближайшем будущем нет планов по обновлению, выбирайте CX7; если планируется развертывание ГП нового поколения, выбирайте CX8 напрямую, чтобы избежать вторичных обновлений.
III. Совместные усилия: Отраслевая ценность ГП NVIDIA и серии CX
Ключевая конкурентоспособность NVIDIA — это полнофункциональное решение "ГП + серия CX + программная экосистема": ГП служат ядром вычислительной мощности, отвечающим за вычисления ИИ и симуляции ВВВ; CX7 и CX8 служат ядром сети, решая проблему узких мест передачи данных между несколькими узлами, и оба работают вместе, чтобы решить проблему "сильная вычислительная мощность, но медленная передача".
(I) ГП NVIDIA: Основной двигатель революции в области вычислительной мощности
ГП NVIDIA проникли из традиционного рендеринга графики во многие области, такие как ИИ и ВВВ, с ключевыми преимуществами в возможностях параллельных вычислений, разделяясь на потребительские (серия GeForce) и серверные (H100, ГП Rubin и т. д.). H100 поддерживает вычисления с точностью FP8, значительно ускоряя обучение ИИ; ГП Rubin работает с процессором Vera и CX8 для создания суперкомпьютера ИИ, со значительно улучшенной эффективностью обучения и энергоэффективностью вывода.
Ключом к сотрудничеству между ними является технология GPUDirect, которая обеспечивает прямую передачу данных между ГП и сетевыми картами, минуя передачу через ЦП, снижая задержку и сокращая цикл обучения больших моделей ИИ.
(II) Основные области применения полнофункционального решения
1. ИИ и ВВВ: CX8 работает с H100 и ГП Rubin для поддержки обучения моделей с триллионами параметров; CX7 и CX8 адаптируются к межсоединениям суперкомпьютеров с несколькими узлами, поддерживая такие задачи, как моделирование погоды и секвенирование генома; 2. Облачные вычисления: Поставщики облачных услуг развертывают серию CX и ГП для создания платформ эластичной вычислительной мощности, поддерживая такие услуги, как вывод ИИ и облачные игры; 3. Новые сценарии: В области космических вычислений серия CX интегрирована с ГП для запуска модуля Space-1, обеспечивая эффективную вычислительную мощность ИИ; в области ИИ-RAN они работают вместе, чтобы преобразовать базовые станции 5G в периферийные платформы ИИ; 4. Промышленность и автомобилестроение: Поддержка интеллектуального производства, промышленных симуляций, а также исследований и разработок и развертывания автономного вождения уровня L4.
IV. Отраслевые тенденции и рекомендации для специалистов
В будущем серия CX будет развиваться в сторону более высокой пропускной способности и более низкой задержки (например, CX9 может достигать 1,6 Тбит/с), а ГП будут усиливать возможности параллельных вычислений и соотношение энергоэффективности, а также будут глубоко интегрированы с ЦП и LPU.