Deutsch
Zeit: 2026/06/25
Durchsuchen: 74

Der Apple M1 Ultra ist ein Hochleistungs-System-on-a-Chip, das von Apple für professionelle Desktop-Computer entwickelt wurde. Er kombiniert zwei M1 Max-Chips mit Hilfe der UltraFusion-Technologie, was es ihnen ermöglicht, als ein einheitlicher Prozessor zu fungieren.
Dieses Design verleiht dem M1 Ultra mehr CPU-Kerne, GPU-Kerne, Speicherkapazität, Speicherbandbreite und KI-Verarbeitungsressourcen als dem M1 Max. Er wurde für anspruchsvolle Arbeitslasten wie Video-Editing, 3D-Rendering, Software-Entwicklung, wissenschaftliches Rechnen und maschinelles Lernen entwickelt.
Viele Jahre lang haben Halbleiterunternehmen die Prozessorleistung verbessert, indem sie die Chips größer gemacht und mehr Transistoren auf einem einzelnen Siliziumstück, bekannt als monolithischer Chip, hinzugefügt haben. Mit dem Fortschritt der Fertigungstechnologie ermöglichte dieser Ansatz, dass Prozessoren mehr CPU-Kerne, größere Caches, mehr Grafikressourcen und zusätzliche spezialisierte Verarbeitungseinheiten enthalten konnten.
Das kontinuierliche Vergrößern der Chipgröße bringt jedoch mehrere Herausforderungen mit sich:
• Geringere Fertigungsrendite – Größere Chips enthalten eher Fehler, da selbst ein winziger Makel auf dem Silizium-Wafer den gesamten Chip unbrauchbar machen kann.
• Höhere Produktionskosten – Mit zunehmender Chipgröße können aus jedem Wafer weniger Chips produziert werden, und geringere Ausbeuten erhöhen die Herstellungskosten weiter.
• Höhere Stromanforderungen – Mehr Transistoren benötigen mehr elektrische Energie, was die Energieversorgung über den Chip zunehmend komplex macht.
• Mehr Wärmeerzeugung – Größere und dichtere Chips erzeugen mehr Wärme und schaffen zusätzliche Herausforderungen bei Kühlung und thermischem Management.
• Physikalische Skalierungsgrenzen – Die Fertigungstechnologien für Halbleiter stoßen auf praktische Grenzen, die es zunehmend schwierig machen, die Größen monolithischer Chips weiter zu erhöhen.
Um diese Herausforderungen zu überwinden, bewegen sich viele Chiphersteller in Richtung Multi-Dies oder chiplet-basierte Architekturen. Anstatt einen extrem großen Chip zu bauen, werden mehrere kleinere Chips mithilfe von Hochgeschwindigkeits-Interconnect-Technologien verbunden und als ein einzelner Prozessor verpackt. Dieser Ansatz verbessert die Fertigungseffizienz, senkt die Kosten, erhöht die Designflexibilität und ermöglicht eine Leistungssteigerung über die praktischen Grenzen eines einzelnen monolithischen Chips hinaus.
Anstatt einen massiven Chip zu erstellen, hat Apple zwei M1 Max-Dies mit UltraFusion verbunden, um eine höhere Leistung effizienter zu erreichen.

Das Bild zeigt den Apple M1 Ultra, der aus zwei M1 Max-Dies besteht. Die linke und rechte Seite sind die beiden Chips, während der breite zentrale Bereich zeigt, wo UltraFusion sie verbindet.
UltraFusion ermöglicht es den beiden Chips, als ein Prozessor anstelle von zwei separaten Chips zu arbeiten. Es verwendet mehr als 10.000 Signalverbindungen und liefert bis zu 2,5 TB/s Bandbreite. Dies ermöglicht es, dass Daten schnell zwischen der CPU, GPU, Speicherkontrollern und anderen Teilen des Chips bewegt werden.
Da die Verbindung sehr schnell und mit geringer Verzögerung ist, können die beiden Chips fast wie ein großes Stück Silizium kommunizieren. Dies hilft Apple, die Leistung zu steigern, ohne einen extrem großen Chip herzustellen.
UltraFusion ist auch einfach für Software. macOS und Apps sehen den M1 Ultra als einen Prozessor, sodass die meisten Software seine zusätzliche Leistung ohne größere Änderungen nutzen kann.
Der M1 Ultra zeigt, wie fortschrittliche Halbleiterverpackungen jetzt Teil der Prozessorleistung sind, nicht nur des Schutzes des Chips. In der Vergangenheit schützte die Verpackung hauptsächlich den Siliziumchip und verband ihn mit der Leiterplatte. Heute hilft die Verpackung auch mehreren Chips, schnell innerhalb eines Prozessorpakets zu kommunizieren.

Obwohl Apple nicht jedes technische Detail von UltraFusion geteilt hat, wird es häufig zusammen mit fortschrittlichen Verpackungskonzepten wie Silizium-Interposern, 2.5D-Verpackung, TSMC InFO_LSI und Interconnect-Ansätzen ähnlich wie Intel EMIB diskutiert. Das Bild zeigt EMIB als ein Beispiel für diese Idee. Es verwendet eine kleine Siliziumbrücke im Verpackungsubstrat, um zwei separate Chips mit hochdichten, hochbandbreiten Signalpfaden zu verbinden.
Das bedeutet nicht, dass das Bild Apple UltraFusion direkt zeigt. Stattdessen hilft es, das gleiche allgemeine Verpackungsziel zu erklären: separate Siliziumchips zu verbinden, damit Daten mit hoher Bandbreite, geringer Verzögerung und starker Signalqualität zwischen ihnen bewegt werden können. Diese Verpackungsmethoden ermöglichen es CPU-Kernen, GPU-Kernen, Speichersystemen und anderen Verarbeitungseinheiten auf verschiedenen Chips, effizient zusammenzuarbeiten.
Der Hauptvorteil besteht darin, dass Chip-Hersteller leistungsstarke Multi-Chip-Prozessoren bauen können, die sich verhalten wie ein großer Chip. Der M1 Ultra ist ein praktisches Beispiel für diese Richtung, nutzt fortschrittliche Verpackung und Chip-zu-Chip-Kommunikation, um hohe Leistung zu liefern, ohne auf einen extrem großen monolithischen Chip angewiesen zu sein.
Das obige Bild zeigt die Hauptfunktionsblöcke im Apple M1 Ultra Prozessor. Anstatt nur eine traditionelle CPU zu sein, ist der M1 Ultra ein komplettes System-on-Chip (SoC), das mehrere spezialisierte Verarbeitungseinheiten in einem einzigen Paket integriert. Jeder Block ist für eine bestimmte Art von Arbeitslast konzipiert, sodass der Chip hohe Leistung bei gleichzeitiger Energieeffizienz liefern kann.

Der CPU-Block enthält 20 Verarbeitungskerne, bestehend aus 16 Hochleistungskernen und 4 hocheffizienten Kernen. Die Leistungskerne übernehmen anspruchsvolle Aufgaben wie Softwarekompilierung, Video-Rendering, wissenschaftliche Berechnungen und professionelle Anwendungen. Die Effizienzkerne verwalten Hintergrundprozesse und weniger anspruchsvolle Arbeitslasten, während sie weniger Energie verbrauchen. Diese hybride Architektur ermöglicht es dem Prozessor, Leistung und Energieeffizienz je nach Arbeitslast auszubalancieren.
Die GPU ist der größte Block in der M1 Ultra Architektur und enthält bis zu 64 Grafikverarbeitungskerne. Im Gegensatz zur CPU, die für sequenzielle Operationen optimiert ist, ist die GPU für hochgradig parallele Verarbeitung ausgelegt. Sie beschleunigt Grafik-Rendering, visuelle Effekte, 3D-Modellierung, Spiele, Videobearbeitung und maschinelles Lernen. Die große Anzahl an Ausführungseinheiten ermöglicht es, Tausende von Berechnungen gleichzeitig durchzuführen, was die Leistung in grafikintensiven Anwendungen erheblich verbessert.
Die Neural Engine ist ein dedizierter Beschleuniger für künstliche Intelligenz, der sich in der Nähe des GPU-Bereichs befindet. Sie enthält 32 spezialisierte Kerne, die speziell für maschinelles Lernen entwickelt wurden. Aufgaben wie Bilderkennung, Sprachverarbeitung, natürliche Sprachverarbeitung und KI-Inferenz können viel schneller und effizienter ausgeführt werden als auf einer universellen CPU. Durch die Auslagerung von KI-Arbeitslasten auf dedizierte Hardware verbessert das System sowohl Leistung als auch Energieeffizienz.
Die Media Engine ist ein spezialisierter Hardwareblock, der für Video-Encoding und -Decoding konzipiert ist. Anstatt sich auf die CPU oder GPU zu verlassen, um Video-Streams zu verarbeiten, kümmern sich dedizierte Schaltkreise um Formate wie H.264, HEVC, ProRes und ProRes RAW. Dies reduziert den Verarbeitungsaufwand erheblich und ermöglicht es professioneller Videobearbeitungssoftware, mit hochauflösenden Inhalten reibungsloser zu arbeiten. Der M1 Ultra beinhaltet mehrere Encoder- und Decoder-Einheiten, die die gleichzeitige Verarbeitung mehrerer hochwertiger Video-Streams ermöglichen.
Obwohl nicht spezifisch in dem Bild bezeichnet, enthält der M1 Ultra Speichercontroller, die alle Verarbeitungsblöcke mit Apples einheitlicher Speicherarchitektur verbinden. Im Gegensatz zu traditionellen Systemen, die CPU-Speicher und GPU-Speicher trennen, ermöglicht der M1 Ultra CPU, GPU, Neural Engine und Media Engine den Zugriff auf denselben Speicherpool. Dies reduziert die Daten Duplizierung, verringert die Latenz und verbessert die Gesamtsystemeffizienz beim Umgang mit großen Datensätzen und professionellen Arbeitslasten.
Der Hauptvorteil der M1 Ultra Architektur besteht darin, dass alle wichtigen Rechenressourcen innerhalb eines einzigen Chip-Pakets integriert sind. Die CPU übernimmt allgemeine Berechnungen, die GPU beschleunigt Grafik- und Parallelverarbeitung, die Neural Engine führt KI-Aufgaben aus, und die Media Engine verwaltet Videolasten. Kombiniert mit einheitlichem Speicher und UltraFusion-Technologie arbeiten diese Komponenten zusammen, um eine Workstation-Leistung für die Inhaltsproduktion, Softwareentwicklung, Ingenieurwesen, wissenschaftliches Rechnen und maschinelles Lernen zu erzielen.
Der M1 Ultra bietet mehrere wichtige Vorteile für professionelles Rechnen.
Der M1 Ultra bewegt Daten schnell zwischen CPU, GPU, Speichercontrollern und spezialisierten Engines. UltraFusion hilft, Verzögerungen zu reduzieren, indem die beiden Chip-Die und internen Blöcke effizient während starker Arbeitslasten zusammenarbeiten.
Der M1 Ultra liefert eine hohe Leistung bei effizientem Energieverbrauch. Seine optimierte Architektur und dedizierte Hardware-Engines helfen, die Wärme zu reduzieren und machen ihn geeignet für lange professionelle Arbeitslasten, ohne extreme Kühlung zu benötigen.
Da Apple sowohl die Hardware als auch macOS kontrolliert, arbeitet der M1 Ultra reibungslos mit Systemsoftware und professionellen Anwendungen. macOS sieht ihn als einen Prozessor, sodass die meisten Apps seine Ressourcen ohne größere Änderungen nutzen können.
Der M1 Ultra ist für anspruchsvolle Aufgaben wie Videobearbeitung, 3D-Rendering, Softwareentwicklung, maschinelles Lernen und wissenschaftliches Rechnen konzipiert. Seine CPU, GPU, Neural Engine, Media Engine und einheitlicher Speicher arbeiten zusammen, um Geschwindigkeit und Effizienz zu verbessern.
| Merkmal |
Apple M1 Max |
Apple M1 Ultra |
| Architektur |
Einzelner M1 Max Die |
Zwei M1 Max Dies verbunden durch UltraFusion |
| CPU-Kerne |
Bis zu 10 Kerne |
Bis zu 20 Kerne |
| Leistungs-Kerne |
8 |
16 |
| Effizienz-Kerne |
2 |
4 |
| GPU-Kerne |
Bis zu 32 Kerne |
Bis zu 64 Kerne |
| Neural Engine |
16 Kerne |
32 Kerne |
| Media Engines |
1 Media Engine Set |
2 Media Engine Sets |
| Video Decodierungs-Engines |
1 |
2 |
| Video Codierungs-Engines |
2 |
4 |
| ProRes Encode/Decode Engines |
2 |
4 |
| Einheitliche Speicherkapazität |
Bis zu 64 GB |
Bis zu 128 GB |
| Speicherbandbreite |
400 GB/s |
800 GB/s |
| Transistoranzahl |
57 Milliarden |
114 Milliarden |
| Interconnect-Technologie |
Nicht erforderlich |
UltraFusion (2.5 TB/s Bandbreite) |
| Zielsysteme |
Hochleistungs Laptops und Desktops |
Professionelle Desktop-Arbeitsstationen |
Wie oben erwähnt, verwendet der M1 Ultra ein hochintegriertes Design, bei dem wichtige Rechenkomponenten innerhalb eines einzigen Chip-Pakets zusammenarbeiten. Dies unterscheidet sich von vielen traditionellen Desktop-Systemen, die normalerweise auf separate Komponenten wie CPU, GPU, RAM und Chipsatz angewiesen sind. Aufgrund dieses Designs kann der M1 Ultra Daten effizienter zwischen seinen Verarbeitungsblöcken bewegen. Sein einheitlicher Speicher hilft auch, unnötige Datenkopien zwischen CPU und GPUzu reduzieren, was Geschwindigkeit und Energieeffizienz bei professionellen Arbeitslasten verbessert.
Traditionelle Desktop-Prozessoren haben immer noch Vorteile. Sie bieten normalerweise bessere Upgrade-Optionen, da CPU, GPU, Speicher und Speicherung oft separat ersetzt werden können. Im Vergleich dazu konzentriert sich der M1 Ultra mehr auf Systemeffizienz, kompakte Integration und starke Leistung pro Watt.
Ein größerer monolithischer Chip wird teurer und schwieriger herzustellen, da Defekte wahrscheinlicher auftreten. Durch die Verbindung von zwei kleineren M1 Max-Die mit UltraFusion hat Apple die Leistung erhöht und gleichzeitig die Effizienz und Skalierbarkeit der Herstellung verbessert.
Herkömmliche Multi-CPU-Systeme erfordern oft Software zur Verwaltung separater Prozessoren. UltraFusion ermöglicht es, dass die beiden Dies als ein einzelner Prozessor erscheinen, wodurch die Softwarekomplexität verringert und die Kommunikation zwischen den Rechenressourcen beschleunigt wird.
Eine hohe Die-to-Die-Bandbreite ermöglicht es, große Datenmengen schnell zwischen den Verarbeitungsblöcken zu bewegen. Dies hilft, Kommunikationsengpässe zu vermeiden und verbessert die Leistung bei Arbeitslasten wie Videobearbeitung, 3D-Rendering und KI-Verarbeitung.
Der einheitliche Speicher ermöglicht es der CPU, GPU und anderen Verarbeitungseinheiten, auf denselben Speicherpool zuzugreifen. Dies reduziert die Datenverdopplung, verringert die Latenz und verbessert die Leistung bei der Arbeit mit großen Datensätzen.
Fortgeschrittenes Packaging ist nicht mehr nur ein physisches Gehäuse für den Chip. Es bietet hochdichte Verbindungen zwischen den Dies, die helfen, hohe Bandbreiten, geringe Latenzen und eine effiziente Kommunikation innerhalb komplexer Prozessoren aufrechtzuerhalten.
Niedrige Latenz verringert die Zeit, die benötigt wird, damit Daten zwischen den Dies reisen. Dies ermöglicht es verschiedenen Verarbeitungseinheiten, effizienter zu koordinieren, und hilft dem Prozessor, sich mehr wie ein einzelner integrierter Chip zu verhalten.
Der Prozessor kombiniert Hochleistungs-CPU- und GPU-Kerne mit spezialisierter Hardware wie dem Neural Engine und Media Engine. Diese dedizierten Beschleuniger führen spezifische Aufgaben effizienter aus als universelle Verarbeitungskerne.
CAP CER 1000PF 2.5KV NP0 2225
CAP TANT 6.8UF 10% 16V 1206
IC DSP MULTICORE 561CSP
IC PWR SWITCH N-CHAN 1:1 8MSOP
LRS18C8G SHARP
TC74HC4052AF TOSHIBA
MT5112BD-AOSL MEDNTEK
SUNPLLU BGA
MB90F488BPFV-G-SPE1 FUJITSU
ICS83026AMI IDT
SKYWORKS BGA
HY62256ALJ-55 HY
MICRSOFT TQFP144




