Análisis del mercado del transceptor óptico 800G

¿Cuánta cuota de 800G DSP posee Marvell?

En el pasado, para PAM4 DSPS, es decir, un solo canal desde 50G, 56G hasta 100G, la participación de mercado de Marvell era de al menos 60-70%. Si se calcula por envíos, la cuota de mercado puede llegar al 80%.

Google primero exigió 800G solo porque Google ya había planeado actualizar su centro de datos, incluidos los cambios de 400G a 800G, hace dos años. Y el 800G de Google básicamente alcanzó el nivel de producción en masa a fines del año pasado, incluido el uso de chips de interruptores TH 5 de Broadcom, y los módulos ópticos están usando Marvel DSP Los chips DSP de Google se usan principalmente en transceptores ópticos 800G, sin importar si son usado en el pasado para 200G, 400G o ahora. Ahora los módulos 800G se utilizan principalmente en el programa de chip lnphi.

¿Cuál será la demanda de transceptores ópticos de 800G en 2024?

Según un algoritmo relativamente conservador, si la demanda es de 5 millones, es posible que Google necesite alcanzar una cantidad de al menos 2 o 3 millones. Si la demanda de IA continúa aumentando, la relación entre Google y NVIDIA debería ser de alrededor de 4:6, con Google ocupando 4 y los productos relacionados con NVIDIA ocupando 6. En cuanto a los productos relacionados con NVIDIA, Marvell actualmente no ha pronosticado la demanda según la orientación de empresas como Amazon, Meta o Microsoft, por lo que confían principalmente en NVIDIA para las predicciones.

El año que viene, debería haber un sistema grande llamado GH200, que integra GPU como A100 y H100 y también las conecta a través de conmutadores Mellanox. En el futuro, habrá nuevas proporciones en las ventas del A100, H100, el tiempo de producción del nuevo sistema DGX GH 200 y la situación general de las ventas. Actualmente, la tarjeta de red ConnectX-7 es de 400G, pero el próximo año estará disponible una tarjeta de red de 800G, ConnectX-8. Actualmente, A100 y H100 todavía usan algunos Módulos ópticos 400G, y algunos usan módulos 800G. Sin embargo, en el futuro, la tendencia puede ser hacia 800G, por lo que puede haber algunos algoritmos o predicciones diferentes para la demanda de estas piezas.

800G

¿Se puede desglosar la demanda de DSP este año y el próximo?

Los ingresos de Marvell para el año deberían rondar los 6 millones de dólares. El negocio relacionado con DSP debería rondar los 1.4-1.5 millones de dólares. Esto incluye módulos relacionados con 800G, 400G, 200G y 100G, así como otro tipo llamado DSP coherente. Este tipo de chip DSP se usa para aplicaciones que requieren una transmisión de cientos a miles de kilómetros, como entre centros de datos o para operadores de telecomunicaciones como Huawei. También hay un negocio de módulos personalizados para Microsoft, por lo que los ingresos totales para estas categorías deberían rondar los 1.4-1.5 millones de dólares. Si es solo PAM4 DSP, puede rondar los $700-800 millones.

¿Agregó AWS 600,000 400 fibras monomodo XNUMXG para centros de datos de IA o para módulos ópticos de larga distancia?

Este es un módulo DSP PAM4 antiguo porque, en el pasado, los principales proveedores de 400G de Google eran FiberMall y Cloud Light. La demanda de Google de 400G debería ser relativamente alta, con una demanda anual de alrededor de 2 millones de piezas. 400G de AWS es 400G DR4. La demanda de AWS será superior a la de Google, con más de 3 millones de piezas al año.

Después de que la demanda se ralentizara en la segunda mitad del año pasado, parte de la inversión de capital de estos grandes clientes de centros de datos de América del Norte se cancelaría o suspendería. Por lo tanto, en ese momento, la demanda de módulos DR400 de 4 G de Amazon disminuyó, lo que resultó en un mayor inventario de módulos DSP de 400 G. Recientemente, su participación en la categoría 400G puede haberse recuperado o la demanda de Amazon ha aumentado. La fuerza de atracción desde la segunda mitad del año pasado hasta la primera mitad de este año fue relativamente débil porque la situación de su inventario aún continúa. El nivel de inventario de Amazon en la categoría 400G en la segunda mitad del año puede disminuir.

Que es ta situación de los principales clientes de centros de datos como Google, Microsoft, Meta y Amazon?

En el pasado, Google usaba un entorno 400G y la arquitectura del centro de datos usaba 400G, que era un puerto eléctrico de 8×50 convertido a un puerto óptico de 8×50, que requería un chip DSP de 8 entradas y 8 salidas. El 400G de Amazon usa un puerto eléctrico de 8×50 que se convierte en un puerto óptico de 4×100 usando un chip DSP. Por lo tanto, el 400G que utilizan Google y Amazon utiliza diferentes tipos de chips. Comparando Microsoft y Meta, aún deberían usar principalmente 100G en su centro de datos. Inicialmente, Meta quería aumentar a 200G o 400G, pero actualmente la principal demanda está en el área de 200G. Escuché que tienen más de un millón de demandas por año. Microsoft planeó originalmente actualizar el centro de datos a 400G el año pasado, pero luego, debido a varias consideraciones internas y la desaceleración de la demanda del mercado, no comenzó el firmware ni el trabajo de actualización para 400G. Hay un dicho que puede actualizar a 400G en la segunda mitad de este año. Sin embargo, también hay un dicho que puede reconsiderar debido a factores de IA y puede ir a 800G. Básicamente, antes de que llegara la demanda relacionada con la IA de NVIDIA, Google fue el más rápido en el entorno numérico y fue el primero en avanzar hacia 800G, luego Amazon fue 400G, Meta fue 200G y Microsoft quería avanzar hacia 400G pero aún no ha comenzado a hacerlo. construir la infraestructura. Así que este es un plan para el centro de datos existente.

Ahora, gracias a la IA, Microsoft, Meta e incluso Amazon realizarán algunas actualizaciones aceleradas de los componentes del centro de datos. Parece que Amazon seguirá usando 400G. Si existe la necesidad de aplicaciones relacionadas con la IA que requieran 800G, se actualizarán a 800G, pero 400G sigue siendo su enfoque principal.

¿La mejora de la demanda es para distancias largas o cortas?

La distancia dentro del centro de datos se considera corta. La distancia entre el conmutador y el almacenamiento del servidor no suele ser superior a tres metros, y la mayoría de ellos utilizan la interfaz AOC. El módulo DR se utiliza entre Spine-Lea, principalmente fibra monomodo, normalmente entre 100 metros y 500 metros, y en ocasiones puede llegar a uno o dos kilómetros. Además, algunos centros de datos súper grandes también usarán módulos FR, que pueden alcanzar hasta uno o dos kilómetros de distancia. Por lo tanto, existen al menos estos tres módulos en el centro de datos: AOC, DR y FR.

red de espinas de hojas

¿Los servidores necesarios para la inferencia de IA utilizarán módulos 800G?

Creo que si es una inferencia, también puede haber una posibilidad de usar módulos 800G en el futuro. Pero la situación actual es que los servidores de IA generalmente usan tarjetas de red. La tarjeta de red de mayor velocidad de Mellanox, que fue adquirida por NVIDIA, también debería tener solo 400 G, y otros fabricantes de tarjetas de red de alta velocidad como Broadcom o Intel actualmente solo pueden alcanzar hasta Tarjetas de red 400G. Por lo tanto, los servidores de IA actualmente utilizan principalmente tarjetas de red de 400G, por lo que solo pueden conectarse a módulos de 400G. El próximo año, debería haber algunas tarjetas de red de 800G disponibles, y luego aumentará la posibilidad de usar transceptores ópticos de 800G. Además, también se debe considerar el método de cableado dentro de NVIDIA DGX GH200. La interfaz de conexión entre la CPU o la GPU en el interior está hecha de NVLink de cobre. Algunos de ellos también deben conectarse al conmutador Mellanox y actualmente utilizan principalmente módulos AOC de 400G o 800G. Si el sistema se limita al centro de datos en el futuro, la interfaz externa también puede usar módulos 800G.

¿Pueden los chips conmutadores de red de Marvell ingresar al sistema de NVIDIA?

Creo que es poco probable que los chips de interruptores de Marvell puedan ingresar al sistema de NVIDIA. Actualmente, en los centros de datos tradicionales, la principal cuota de mercado es la serie Tomahawk, Tomahawk 3, Tomahawk 4 y Tomahawk 5 de Broadcom. La mayoría de los centros de datos, como Google, utilizan chips TH 5 para sus conmutadores 800G. Marvel adquirió previamente una compañía llamada lnnovium, que tiene chips de conmutación de 12.8T o 400G. El principal cliente que los adoptó es Amazon. Después de que Marvel completara la adquisición, proporcionaron unos chips de conmutación de 400G a Amazon, que podría mantener unos ingresos de 100 millones al año. Marvel ahora está desarrollando un nuevo chip de interruptor 51.2T, que estará disponible a finales de año y quizás se produzca en masa el próximo año si todo sale bien. Este es un chip que compite con el nivel 5 de Tomahawk de Broadcom. Si no hay problemas importantes, Amazon debería poder tomar una cierta participación, y otras compañías pueden intentar tomar una participación de mercado de Broadcom.

Sin embargo, en el sistema NVIDIA DGXGH200, ni los chips de conmutación de Marvell ni los de Broadcom tienen ninguna posibilidad de entrar, porque es una solución total que integra la serie de chips de conmutación Spectrum de Mellanox con toda la arquitectura del sistema.

En cuanto al negocio de DSP, los ingresos de este año son de $1.4 a $1.5 millones, y $200 millones provienen de productos 800G. El negocio de Coherent DSP representa alrededor de $ 300 millones. Otra parte es el módulo personalizado para Microsoft, que utiliza el propio DSP de Marvell en su interior. Este módulo se cuenta como una unidad comercial separada porque tiene un precio más alto y un volumen más bajo que otros productos. El módulo personalizado se utiliza para conectarse con centros de datos a una distancia de hasta 80-100 kilómetros. Esta parte también puede contribuir con más de $ 200 millones en ingresos. Estas dos partes suman alrededor de $ 500- $ 600 millones en ingresos.

Podemos clasificar los productos DSP en tres grupos según sus funciones: DSP PAM4 se utilizan principalmente en centros de datos y tienen diferentes velocidades que van desde 100G hasta 800G; los módulos personalizados para Microsoft también se basan en PAM4 DSP, pero tienen un factor de forma y un escenario de aplicación diferentes; Los DSP coherentes se utilizan principalmente para la transmisión de larga distancia, como las redes de telecomunicaciones, y tienen velocidades de 100G a 400G.

Pronóstico de la situación en 2024

El próximo año, los ingresos de 400G PAM4 DSP pueden permanecer estables o disminuir ligeramente, porque el volumen de envío no tendrá un crecimiento significativo y Google cambiará a la demanda de 800G, lo que resultará en una desaceleración de la demanda de 400G. Por lo tanto, el transceptor óptico 800G es el principal impulsor del crecimiento, y si los ingresos de este año son de $200 millones, llegarán a $400 millones el próximo año. Otros negocios de DSP tendrán un ligero crecimiento, probablemente entre un 10-20%. El módulo personalizado para el negocio de Microsoft y Coherent DSP puede tener una tasa de crecimiento promedio de alrededor del 20%, equivalente a un aumento de $100-200 millones. Por lo tanto, si los ingresos totales de este año son de $1.4 millones, aumentarán $300-400 millones el próximo año, y los ingresos totales serán de $1.7-$1.8 millones.

pronóstico de ventas

Teniendo en cuenta la popularidad de las soluciones LPO en el futuro, ¿cómo cambiará la cuota de mercado en los próximos 2 o 3 años?

Actualmente, los reproductores DSP más pequeños son Credo y Maxlinear. Creo que en los próximos dos o tres años, Marvell seguirá siendo el principal proveedor de DSP y su participación se mantendrá en un nivel alto. El DSP de Broadcom básicamente no tiene grandes problemas, pero Google básicamente no lo usa, y Amazon, Microsoft y Meta no tienen una preferencia especial por sus productos. Google y Marvell tienen una cooperación muy estrecha y no se compartirá mucha información con Broadcom, por lo que, básicamente, el negocio de Marvell y Google será relativamente estable en los próximos años. Amazon, Microsoft y Meta comenzarán más tarde que Google. Hablan con Marvell sobre algunas especificaciones técnicas, pero confían más en estos fabricantes de módulos. Tienen una mejor comprensión del cronograma técnico o de producción, pero cuando se trata de la demanda, principalmente hablan con FiberMall o Coherent sobre el precio y la demanda de todo el módulo. Si FiberMall o el nuevo 400G o Transceptores ópticos 800G utilizan la solución DSP de Marvell, tendrán dificultades para cambiar a otros DSP. Entonces, la prioridad de FiberMall y Coherent está definitivamente por encima de Marvell. Creo que es muy difícil que Maxlinear y Credo lo hagan mejor que Broadcom o Marvell porque tienen muy pocos recursos propios. Credo cooperó con Microsoft en AEC anteriormente, pero Microsoft realmente no adoptó la solución de Credo, lo que resultó en una fuerte disminución de los ingresos de Credo en el primer trimestre. En ese momento, el precio de las acciones cayó de casi $20 a $8-$10. Recientemente, han aumentado lentamente, porque escucharon que están discutiendo algunas nuevas soluciones AEC con Meta y Amazon. Si tienen algunas oportunidades, aún pueden inclinarse hacia módulos ópticos no tradicionales. Es posible que algunos clientes quieran hacer soluciones que no sean de Marvel y busquen más fuentes secundarias como respaldo.

¿Cuántos ingresos puede proporcionar un proyecto ASIC?

En términos generales, puede alcanzar una escala de varios millones de dólares. También hay proyectos más grandes que pueden durar de 3 a 5 años y los ingresos pueden superar los 100 millones de dólares. ¿Es la razón principal por la que TSMC ve un crecimiento muy rápido del volumen de salida de cinta de chip ASIC el próximo año porque algunos proyectos no alcanzaron la etapa de producción en masa este año, pero alcanzarán la etapa de producción en masa el próximo año? Sí, eso es parte de la razón. Otra parte de la razón es que en el pasado había menos chips grandes para IA. En los últimos años, más clientes fabricaron chips para tarjetas de red o SSD, etc., que no eran tan grandes o complejos y no necesitaban utilizar la tecnología de empaquetado CoWoS. El próximo año, habrá más negocios para chips de gama alta relacionados con IA y se utilizará relativamente más tecnología de empaquetado de CoWoS.

¿Cuál es el margen bruto del negocio ASIC?

Escuché que esta parte tiene un margen bruto más bajo, que es más bajo que el margen bruto promedio de Marvell, que está aproximadamente entre el 60 % y el 65 %. Para calcular el margen bruto de ASIC, debemos considerar cuánta mano de obra se utiliza, cuántos años lleva y otros factores. En realidad, la estructura de costos de los chips ASIC también es clara para los clientes. El margen bruto de ASIC es de alrededor del 50%.

Entre los 40 proyectos de este año y los 50 proyectos del próximo año, ¿cuántos están relacionados con la IA?

Probablemente no más de 5. La fabricación de chips personalizados, al igual que el desarrollo interno de chips de Marvell, a veces lleva mucho tiempo. A veces, los clientes también cambian las especificaciones o algunos módulos, y los clientes desarrollan algunas tecnologías centrales, por lo que ambas partes tienen que cooperar entre sí, pero el tiempo de desarrollo del chip se extenderá a 1-2 años.

¿Cómo ve el crecimiento de Enterprise Networking, Auto el próximo año?

Los ingresos de Enterprise rondan los mil millones de dólares, y una cuarta parte debería ser de 1 a 300 millones de dólares. En principio, todo el mercado no tiene mucho margen de crecimiento, pero puede ser ligeramente mejor, superior al nivel medio. Esto se debe a que Broadcom no invirtió demasiado en esta área y, por lo general, cobran precios más altos, por lo que algunos clientes elegirán Marvell. En el negocio empresarial, la solución de Marvell está básicamente a la par con la solución de Broadcom y, a veces, los clientes no quieren ceder este negocio a Broadcom. Enterprise también es un negocio de crecimiento estable, pero la tasa de crecimiento es relativamente baja. Actualmente, Auto representa una proporción relativamente baja de los ingresos de la empresa, pero el crecimiento es bueno. La mayoría de los principales fabricantes de automóviles también utilizan la solución de Marvell, que consiste en proporcionar chips de conmutación Ethernet para automóviles. En este campo, Marvell lo hace mejor que Broadcom y Realtek de Taiwán. Aunque la situación general sigue siendo buena en el futuro, debido a la recesión en la industria automotriz desde el año pasado hasta este año, los fabricantes de automóviles pueden comenzar a eliminar algunos productos en los próximos uno o dos años. Es posible que algunos fabricantes de automóviles no generen ningún negocio de ingresos en el futuro.

A la larga, ¿crees que LPO será algo de lo que Marvell deba preocuparse?

Creo que no tendrá un gran impacto en el mercado en los próximos dos o tres años. El principio de LPO es eliminar el DSP. Marvell tiene productos de DSP, Driver y TIA, por lo que Marvell también tiene una solución para eliminar el DSP. Marvell también ha realizado muchas pruebas experimentales en el pasado para evaluar la dificultad técnica y el potencial de mercado de LPO. Marvell también utilizará su propia tecnología para comparar el rendimiento y los pros y los contras de LPO. Lo que he aprendido hasta ahora es que no hay muchos fabricantes que puedan demostrar soluciones LPO, hay más cosas teóricas en la literatura y hay menos cosas sobre objetos físicos y pruebas. Había una situación similar antes de la era 400G. Antes de 400G, se usaban principalmente soluciones analógicas, y luego entró en la era de Marvell o PAM4 DSP de Broadcom. Así que creo que llevará algún tiempo que LPO madure y se estabilice. Todavía quedan muchos retos técnicos por superar, tanto a nivel teórico como físico, y además considerando la coordinación y compatibilidad entre diferentes fabricantes, no creo que sea tan rápido decir que se puede hacer.

Deja un comentario

Ir al Inicio