CerebrasPuce IAIPONvidiaSemi-conducteur

IPO de Cerebras à 5,55 milliards de dollars : la guerre des puces IA entre dans la deuxième manche

Kael Zhang 18 mai 2026

Cerebras Systems est entrée en Bourse au Nasdaq le 14 mai, au prix d’émission de 185 dollars. Dès l’ouverture, le cours a explosé à 385 dollars, pour clôturer à 311 dollars – soit une capitalisation boursière d’environ 66 milliards de dollars.

C’est la plus grande introduction en bourse technologique de 2026, et peut-être le premier signal d’une reconfiguration du marché des puces pour l’IA.

Du blocage à l’euphorie : un marathon boursier de 18 mois

Cerebras avait déposé ses documents S-1 dès octobre 2024, mais s’est rapidement retrouvée enlisée.

L’obstacle central venait de l’examen du CFIUS : son plus gros client, G42 d’Abu Dhabi, représentait alors 87 % de ses revenus. L’examen par le Committee on Foreign Investment in the United States des risques pour la sécurité nationale a bloqué le projet de cotation pendant plus d’un an.

Les données financières de 2025 ont changé le récit.

Chiffre d’affaires : 510 millions de dollars, en hausse de 76 % en glissement annuel
Bénéfice net : 237,8 millions de dollars, alors que l’année précédente la perte approchait les 500 millions
Structure clients : d’un client unique à une diversification vers G42, MBZUAI, OpenAI et AWS

L’attitude des investisseurs a fait volte-face. La fourchette de prix est passée de 115–125 dollars initiaux à 150–160 dollars, puis à 185 dollars finalement. La demande a dépassé l’offre de plus de vingt fois.

La Wafer-Scale Engine : le pari technologique de Cerebras

La différence fondamentale de Cerebras réside dans l’architecture WSE (Wafer-Scale Engine).

Dans les grappes GPU traditionnelles, des milliers de puces indépendantes sont connectées via NVLink ou InfiniBand. Le transport de données entre puces engendre latence et pertes énergétiques. Cerebras, quant à elle, transforme un wafer de silicium entier en une seule puce, intégrant des billions de transistors et des dizaines de gigaoctets de SRAM sur puce sur une seule surface.

Cela signifie que les poids du modèle et les valeurs d’activation n’ont plus besoin d’être transférés d’une puce à l’autre – contournant ainsi le mur de mémoire et les goulots d’étranglement réseau des grappes GPU distribuées.

Les chiffres donnés par Andrew Feldman, CEO de Cerebras, dans une interview à Yahoo Finance :

« Nous avons construit une puce de la taille d’une assiette. Elle est 58 fois plus grande que toute puce précédente. En IA, plus la puce est grande, plus le traitement est rapide. Nous sommes plus de 15 fois plus rapides que nos concurrents. »

Pourquoi Cerebras choisit d’affronter Nvidia sur le marché de l’inférence

Nvidia domine le marché de l’entraînement des modèles d’IA, mais Cerebras choisit de pénétrer par l’inférence.

L’inférence est le processus de calcul continu lorsqu’un modèle répond à une requête utilisateur. À mesure que les applications d’IA passent du laboratoire à la production, la demande en puissance de calcul d’inférence croît de façon exponentielle. Les assistants de codage, les agents IA et les scénarios d’interaction en temps réel imposent des exigences particulièrement strictes en matière de latence.

Cerebras et Groq misent toutes deux sur cette direction. L’offre d’acquisition de Groq par Nvidia pour 20 milliards de dollars a, en quelque sorte, validé la valeur marchande des architectures non-GPU.

La liste de clients de Cerebras confirme ce positionnement : OpenAI utilise son matériel pour les charges d’inférence, AWS propose un accès cloud. L’inférence est le dernier kilomètre de la commercialisation de l’IA. Celui qui le maîtrise contrôle le flux de trésorerie continu.

Ce que signifie une capitalisation de 66 milliards de dollars

Au prix d’émission de 185 dollars, la valorisation pleinement diluée de Cerebras était de 56,4 milliards de dollars. Le cours de clôture du premier jour de cotation correspond à une capitalisation proche de 66 milliards.

Points de comparaison :

IPO d’Arm en 2023 : 4,9 milliards de dollars levés, performance post-introduction solide
Acquisition de Groq par Nvidia pour 20 milliards de dollars : établit un benchmark pour la valorisation des start-up de puces IA
Participations des fondateurs : le CEO Andrew Feldman détient environ 1,9 milliard de dollars d’actions, le CTO Sean Lie environ 1 milliard

La réussite de l’IPO de Cerebras envoie un signal clair au marché : le secteur des puces pour l’IA n’admet pas qu’une seule solution, celle de Nvidia. Les entreprises à architecture alternative comme D-Matrix, Tenstorrent, SambaNova et Rebellions pourraient connaître une réévaluation.

Mais la trajectoire du cours le premier jour de cotation – ouverture à 385 dollars, clôture à 311 dollars, puis une baisse de 10 % le lendemain à 279 dollars – montre aussi que l’enthousiasme pour le récit du « challenger de Nvidia » mêle excitation et prudence.

Trois choses que les investisseurs doivent voir clairement

La concentration client reste une ombre

G42 reste actionnaire majoritaire et client important. Si la structure des revenus s’est diversifiée, le lien entre capitaux du Moyen-Orient et risques géopolitiques ne disparaît pas.
L’écosystème logiciel détermine le plafond du matériel

Cerebras développe sa propre pile de compilation CSoft, qui compile les modèles PyTorch vers son architecture propriétaire. Quelle que soit la puissance du matériel, si les coûts de migration pour les développeurs sont trop élevés, la part de marché restera limitée.
La guerre des prix sur le marché de l’inférence n’a pas encore commencé

Blackwell de Nvidia, la série MI d’AMD, ainsi que les puces propriétaires TPU/Ascend se disputent toutes les parts de l’inférence. L’architecture wafer-scale de Cerebras offre des avantages de latence sur certaines charges, mais le TCO (coût total de possession) et les capacités de déploiement à grande échelle restent à prouver.

Impact concret pour les développeurs

Si vous construisez actuellement une application d’IA, voici les changements apportés par l’IPO de Cerebras :

Plus d’options de calcul : les fournisseurs de cloud pourraient intégrer davantage d’options d’inférence non-Nvidia, intensifiant la concurrence par les prix
Les applications sensibles à la latence en profitent : les conversations en temps réel, la complétion de code, les boucles d’agents pourraient bénéficier d’API à latence réduite
Ne vous engagez pas trop tôt : l’infrastructure d’inférence évolue rapidement ; maintenir une flexibilité architecturale est plus judicieux qu’un verrouillage précoce sur un fournisseur

Sources : TechCrunch 2026-05-14 ; Yahoo Finance 2026-05-15 ; EETimes 2026-05-17 ; IndexBox 2026-05-17