Computer Grundlagen
Der Mikroprozessor

KomponentenWorkspace

Der Vergleich zeigt, wie ein Pentium-4-Chip seine Daten hin- und herschiebt und wie ein Athlon von AMD dabei vorgeht.

Central Processing Unit

Computer Grundlagen

Der Mikroprozessor, aus dem die CPU (Central Processing Unit, Zentraleinheit) besteht, ist Gehirn, Nachrichtenzentrale, Dompteur und Direktor des Computers. Alle anderen Komponenten RAM, Laufwerke, Monitor und so weiter sind nur dazu da, um die Lücke zwischen Ihnen und dem Prozessor zu schließen, indem sie die Daten in Empfang nehmen und sie zur Bearbeitung an den Prozessor weiterleiten; anschließend werden die Rechenergebnisse dargestellt. Die CPU ist dabei nicht der einzige Mikroprozessor im PC: Koprozessoren auf Grafikkarten, 3D-Beschleuniger und Soundkarten jonglieren mit Bild- und Tondaten, um die CPU zumindest teilweise zu entlasten. Hinzu kommen Spezialprozessoren, die besondere Aufgaben durchführen, damit die Daten in die CPU gelangen beziehungsweise dort wieder herauskommen wie etwa der in Ihrer Tastatur, der die Signale verwaltet, welche bei einem Tastendruck entstehen.

Der Systembus des Athlon arbeitet mit einer quellsynchronen Taktung, mit der sich extrem hohe Geschwindigkeiten erzielen lassen.


Intel, AMD und Cyrix

Computer Grundlagen

Intel ist nicht das einzige Unternehmen, das PC-Prozessoren herstellt. Sowohl AMD (Advanced Micro Devices) als auch Cyrix bieten Chips an, die die Funktion der Intel-Prozessoren zu niedrigeren Kosten emulieren sollen. Der aktuelle Prozessorstandard ist der Pentium-Chip von Intel, wobei das neueste Mitglied der Familie der Pentium 4 ist. Dank der Tatsache, dass der Speichercache mit den Mikroprozessorschaltungen kombiniert wurde, ist die Zeit, die der Pentium mit dem Warten auf Daten verbringt, auf ein Minimum reduziert worden. Deswegen kann der Prozessor auch Geschwindigkeiten von 3,6 GHz und mehr unterstützen.

Die kombinierten Chips benötigen für ihre über 55 Millionen Transistoren nur ein paar Quadratzentimeter. Alle Operationen des Pentium werden durchgeführt, indem mit bestimmten Signalen unterschiedliche Kombinationen von Schaltern ein- und ausgeschaltet werden. Bei Computern werden Transistoren zur Darstellung von Nullen und Einsen verwendet den beiden Ziffern, aus denen das binäre Zahlensystem besteht. Diese Nullen und Einsen bezeichnet man in der Regel als Bits. Verschiedene Gruppen von Transistoren bilden die Subkomponenten des Pentium-Prozessors ebenso wie die Subkomponenten in Koprozessoren, Speicherbausteinen und anderen Formen digitalen Siliziums.

Die Pipline, das heißt der Pfad, über den der Chip Anweisungen verarbeitet, wurde beim Pentium 4 von fünf bis zehn auf 20 Stufen erhöht.


Unterschiede beim Prozessor

Computer Grundlagen

Die Unterschiede zwischen den Mitgliedern der Pentium-Familie sind eher quantitativer Natur, als dass sie auf grundlegenden Konstruktionsänderungen basierten. Pentium-Prozessoren gibt es für jede noch so kleine Marktnische, vom einfachen Billigsystem bis hin zum Netzwerkserver. Der Unterschied liegt meistens in der Größe des integrierten Caches.

Am unteren Ende der Skala sind die Celeron-Prozessoren mit ihrem beschränkten internen Cache-Speicher. Sie bieten die Funktionalität der Pentium-Architektur, nur mit geringerer Geschwindigkeit. Am oberen Ende hingegen finden wir den Pentium Xeon mit 2 MByte Cache, bei dem die Daten zwischen Cache und Prozessor mit voller statt wie bei anderen Pentium-Prozessoren halber Prozessorgeschwindigkeit ausgetauscht werden. Der Xeon wurde für Aufgaben entwickelt, bei denen jedes Quäntchen Geschwindigkeit zählt, also etwa für Netzwerkserver und Highend-Workstations, die für 3D-Grafikdesign und andere komplexe Berechnungen eingesetzt werden.

Die neuesten Verbesserungen bei den Pentium-Prozessoren zielen auf die Optimierung der Chipleistung bei Multimedia, 3D-Berechnungen, Medien-Streaming im Internet und Spracherkennung. Der Vergleich rechts zeigt, wie der Pentium-4-Chip und der Athlon von AMD arbeiten.


Der Intel Pentium 4

Computer Grundlagen

Obwohl er in mancher Hinsicht den anderen Pentium-Chips ähnelt, ist der Pentium 4 eine vollständige Neuentwicklung. Mit seinen 42 Millionen Transistoren verwendet er eine von Intel so bezeichnete Netburst-Mikroarchitektur, um Daten schneller durch den Chip zu bewegen und eine Untätigkeit des Chips zu umgehen, wenn dieser auf Anweisungen oder Daten wartet.

Trace-Cache

Bis zu 12 KByte der meistverwendeten Mikrooperationen sind im Execution-Trace-Cache (oder kurz Trace-Cache) gespeichert, um eine zeitaufwendige redundante Dekodierung ein und derselben Anweisung zu vermeiden.

Fetch/Decode-Einheit

Auch der P4 hat eine Fetch/Decode-Einheit, um die jeweils nächste Anweisung aus dem L2-Cache abzurufen. und in kleinere Elemente zu unterteilen, die der Prozessor schneller verarbeiten kann.

Der Cache

Der Cache liefert bis zu drei Mikrooperationen pro Taktzyklus an den Ausführungskern. Der Kern enthält zwei ALUs, die doppelt so schnell wie der Rest des Prozessors laufen.

SIMD-Anweisungen

Beim Pentium 4 ist die Anzahl der SIMD-Anweisungen (Simple Instruction, Multiple Data) auf 144 erhöht worden. Viele der Anweisungen sind Streaming-SIMD-Anweisungen, die für das Streaming von Musik und Filmen über das Internet verwendet werden.

Sprungvorhersage
Jedes Mal, wenn im Anweisungsfluss ein Sprung von einem digitalen Pfad zu einem anderen erfolgt, behält der Branch Target Buffer einen Vermerk zu den Ergebnissen. Auf der Basis dieser Aufzeichnungen sagt der Puffer die Richtung voraus, die ein neuer Sprung nehmen wird, und der Prozessor berechnet das Ergebnis. Ist die Voraussage zutreffend, dann kann der P4 zu den Anweisungen des Sprungs wechseln.


AMD Athlon

Computer Grundlagen

Zwar gleicht der AMD Athlon (oder K7) dem Pentium 3 äußerlich sehr, aber er ist nicht kompatibel mit dem Sockel 370, der für die P3-Prozessoren verwendet wird. Mit seinen 37 Millionen Transistoren und einem internen L2-Cache mit 256 bis 512 KByte ist der Athlon der erste Prozessor, der für den Pentium eine Konkurrenz darstellt.

L1-Cache

Der Athlon bietet einen 128 KByte großen L1-Cache, der in einen 64 KByte großen Anweisungscache und einen ebenso großen Datencache aufgeteilt ist.

Fetch/Decode-Einheit

Wie der Pentium verwendet auch der Athlon eine Fetch/Decode-Einheit zum Abrufen der jeweils nächsten Anweisung aus dem Anweisungscache und der Einspeisung in die x86-Anweisungsdekoder.

x86-Anweisungsdekoder

Der Athlon verfügt über drei x86-Anweisungsdekoder. Sie übersetzen die hiesigen Dekoder die Anweisungen in 1 bis 15 Byte große Makrooperationen (Macro Ops); auf diese Weise kann der Prozessor größere Mengen von Anweisungen auf einmal verarbeiten.

Instruction Control Unit

Nach der Übersetzung in Makrooperationen werden diese von den Dekodern an die ICU (Instruction Control Unit, Anweisungssteuereinheit) übergeben. Die ICU agiert als ROB (Reorder Buffer, Rückordnungspuffer), der die Ausführung und Entsorgung aller Makrooperationen verwaltet.

Ausführungspipelines

Die Makrooperationen werden nun auf neun getrennte Ausführungspipelines geschaltet: je drei für ganzzahlige Berechnungen, Adressberechnungen und die Ausführung von MMX-3DNow-Anweisungen und Fließkommaberechnungen.

3DNow-Technologie

Die erweiterte 3DNow-Technologie verdoppelt die Anzahl der im Vorgängermodel, dem AMD K6-Prozessor, verwendeten Multimediaanweisungen annähernd und optimiert auf diese Weise die Leistung für Spiele, Multimediaanwendungen und Spracherkennung.