OpenAI und Broadcom bringen Jalapeño-Chip für LLM-Inferenz im großen Maßstab auf den Markt.

OpenAI und Broadcom haben Jalapeño angekündigt, einen neuen Chip, der speziell für das Inferencing großer Sprachmodelle in Rechenzentren entwickelt wurde. Der ASIC wurde innerhalb von neun Monaten von Grund auf neu entwickelt, basierend auf Erkenntnissen der OpenAI-Forscher und unter Berücksichtigung der Produkt-Roadmap des Unternehmens.

Broadcom erklärt, dass Jalapeño stärker auf die aktuellen Anforderungen großer Sprachmodelle spezialisiert ist als bestehende Inferenz-Hardware. OpenAI behauptet, dass erste Tests zeigen, dass der Chip eine deutlich bessere Leistung pro Watt liefert als aktuelle Lösungen, obwohl detaillierte technische Ergebnisse in den kommenden Monaten veröffentlicht werden.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare