Deutsch
Zeit: 2025/11/7
Durchsuchen: 26
Alphabet, die Muttergesellschaft von Google, gab am 6. November bekannt, dass ihr selbst entwickelter Inferenzchip für künstliche Intelligenz der siebten Generation, TPU Ironwood, in den kommenden Wochen vollständig für Unternehmen und Entwickler verfügbar sein wird.Der Chip wurde erstmals im April dieses Jahres vorgestellt und ist nach den Tests nun in die schrittweise Bereitstellungsphase eingetreten.Google gab an, dass Ironwood speziell für KI-Inferenzaufgaben entwickelt wurde und die Inferenz großer Sprachmodelle, komplexe generative KI und Echtzeit-Inferenz mit hohem Durchsatz unterstützt.
Laut Amin Vahdat, Head of AI and Infrastructure bei Google Cloud, und Mark Lohmeyer, Head of Computing Platforms, liefert Ironwood die zehnfache Spitzenleistung seines Vorgängers TPU v5p.In Inferenzszenarien übertrifft seine Einzelchip-Leistungseffizienz die von TPU v6e (Trillium) um mehr als das Vierfache, was ihn zum „bisher leistungsstärksten und energieeffizientesten benutzerdefinierten Chip“ von Google macht.Darüber hinaus unterstützt Ironwood die Verbindung von bis zu 9.216 Chips zu Superpod-Clustern, was den Datendurchsatz und die Inferenzgeschwindigkeit erheblich steigert und Unternehmen dabei hilft, Bandbreiten- und Latenzengpässe bei großen Modellinferenzen zu überwinden.
In praktischen Anwendungen plant das große KI-Modellunternehmen Anthropic den Einsatz von bis zu einer Million Ironwood-TPUs, um die Inferenzanforderungen seiner Modelle der nächsten Generation zu unterstützen.Anthropic wird derzeit durch Investitionen von Google und Amazon unterstützt und gilt als wichtiger Partner, der die greifbaren Ergebnisse der Chip-Strategie von Google demonstriert.
Gleichzeitig kündigte Google die Erweiterung seiner hauseigenen Arm-basierten CPU-Produktlinie Axion an und führte mehrere neue Instanzen ein, die auf den Cloud-Computing-Markt abzielen.Unter diesen befindet sich die virtuelle N4A-Maschine in der Vorschauphase, wobei Google behauptet, sie biete das doppelte Preis-Leistungs-Verhältnis im Vergleich zu entsprechenden virtuellen x86-Maschinen.Ein weiteres Angebot, der Bare-Metal-Server C4A, wird bald in die Vorschau gehen und ist in erster Linie für spezielle Szenarien wie Android-Entwicklung, Automobilsysteme, streng lizenzierte Software, Tests mit hoher Dichte und komplexe Simulationen konzipiert.
2025/11/7
2025/10/28
2025/10/24
2025/10/15
2025/09/26
2025/09/19
2025/09/12
2025/09/3
2025/08/27
2025/08/22