AMD Bulldozer K15, Sammelthread & Info Thread |
Willkommen, Gast ( Anmelden | Registrierung )
AMD Bulldozer K15, Sammelthread & Info Thread |
3 May 2010, 08:49
Beitrag
#1
|
|
ELECTRONIC-MUSIC-FAN Gruppe: Members Beiträge: 2.428 Mitglied seit: 27-February 03 Mitglieds-Nr.: 967 |
AMD Bulldozer K15
(IMG:http://www.abload.de/img/bdlx5y.jpg) -Der schnellste Single/Multi-Thread-Prozessor der Geschichte- AMD wird 2011 eine ganz neue Prozessorarchitektur erstmals seit K7 Zeiten auf den Markt werfen. Diese hört auf den Namen "Bulldozer" und wird wohl der größte Schritt seit vielen vielen Jahren werden. Bulldozer wird der eigentliche Phenom werden, denn die beiden Vorgänger waren nicht das, was sie für AMD sein sollten, auch wenn sich Version II des Phenom trotzdem gut machte. Bulldozer soll AMD wieder an die Spitze bringen mit einer deutlich veränderten neuen Architektur. AMD nennt seine Architektur Bulldozer (15. Familie) Was ist Bulldozer und wie ist er aufgebaut? Bulldozer ist ein Prozessor, der mit 8 Kernen im Desktop-Markt bestückt werden wird, im Serverbereich mit 16 Kernen. Intern kommen mehrere Module zum Einsatz, die je 2 reale Prozessorkerne besitzen. Diese 2 Prozessorkerne haben jeweils 4 Pipelines, die Hälfte davon für ALUs. AMD kann die Anzahl der Kerne einfacher gestalten. Braucht es 8 Kerne, so werden 4 solcher Module zusammengekoppelt und der Prozessor meldet sich dann als Achtkernprozessor. Und jeder einzelne Kern auf einem Modul hat intern 2 weitere Kerne, die es dem Kern erlauben, mehr als einen Thread zu nutzen, ähnlich wie Intels SMT, nur mit dem Unterschied, dass jeder Bulldozer Kern jeden Thread mit eigens reservierter Hardware verarbeiten darf und so die Verarbeitung schneller ausführen kann. SMT von Intel kann nur mit gemeinsamer Hardware Threads verarbeiten. Bei AMD heißt die Technik CMT und soll 180 % Leistung gegenüber 120% Intel SMT haben. (IMG:http://www.abload.de/img/1kxit.jpg) (IMG:http://www.abload.de/img/8c9bg.jpg) Jeder der 2 Kerne eines Moduls, hat einen eigenen L1 Cache sowie einen eigenen Scheduler. Der L2 Cache ist aber getrennt, sprich beide Kerne teilen sich hier einen gemeinsamen L2 Cache. Beim AMD K10 hatte noch jeder Kern einen eigenen L2 Cache. Jedes der einzelnen Module hat dafür nur eine eigene 128-Bit-FPU für Gleitkommazahlenberechnungen. Ebenfalls mit dabei ist natürlich der L3 Cache. Hier nutzen alle Module zusammen (egal wie viele) einen gemeinsamen L3 Cache, der recht hoch ausfallen dürfte. Durch diesen neuen internen Aufbau ist ein Bulldozer, einem Phenom II mit seinen "nur" drei Integer-Pipelines und einer FP-Pipeline pro Kern überlegen. Bei einem 8 Kern Prozessor mit 4 Modulen pro 2 Kerne würden also 8x L1 Cache vorkommen (jeder Kern hat ein eigenes L1 Cache), 4x L2 Cache (pro Modul ein L2 Cache), 1x L3 Cache für alle Modulen und 4x FPUs Unit (pro Modul eine FPU). (IMG:http://www.abload.de/img/31aq3.jpg) (IMG:http://www.abload.de/img/4j994.jpg) Bulldozer wird von AMD speziell für Multithreading entwickelt. Durch den Aufbau mit 2 Kernen pro Modul will AMD sehr hohe Multithreadleistung erzielen. Mehrere Threads sollen effektiver auf mehrere Kerne verteilt werden und so schneller bearbeitet werden. Es wird interessant zu sehen sein, wie AMD das umsetzt und wie schnell die Kerne sind. AMD nennt das "Better Multithreaded Integer- Performance". (IMG:http://www.abload.de/img/57zrx.jpg) (IMG:http://www.abload.de/img/69z9j.jpg) AVX Eine FPU pro Modul, die sich beide Kerne teilen müssen ist 256Bit breit, beherrscht Intels AVX Instruktionssatz und kann sich bei kürzeren Befehlen in 2x128Bit splitten (und damit dann 2 128-Bittige Befehle gleichzeitig ausführen). Diese FPU ist als FMAC (Fused Multiply Accumulate) ausgelegt und kann daher eine Multiplikation und eine Addition in einem Rutsch ausführen. Des weiteren wird spekuliert dass sie um die Effizienz zu erhöhen, auch direkt als 1 Multiplizierer & 1 Addierer arbeiten kann. SSE5 Die erweiterung SSE5 wurde wegen Intels AVX aufgegeben und teillweise in FMA4 intregiert, dann hat AMD AVX & FMA4 mit SSE5 inhalten. Fertigung Bulldozer wird im 32nm Prozess bei Globalfoundries produziert, das TapeOut von Bulldozer soll gegen ende 2009 stattgefunden haben. Der Prozessor wird ein DDR3-1866 Speichercontroller besitzen und AM3 Support bieten, man braucht kein neues Board. Desktop (Zamebzi) Für den Desktop Markt kommt Zambezi mit 8 Kernen die aus 4 Modulen bestehen und Socket AM3 Support bieten. Server (Interlagos) Für den Server Markt kommt Valencia/Interlagos mit 12/16 Kernen die aus 8 Modulen bestehen und Socket C32 & G34 Support bieten. (IMG:http://www.abload.de/img/7waax.jpg) Quelle: http://www.hardwareluxx.de/community/14493908-post1.html |
|
|
22 Feb 2011, 15:58
Beitrag
#2
|
|
ELECTRONIC-MUSIC-FAN Gruppe: Members Beiträge: 2.428 Mitglied seit: 27-February 03 Mitglieds-Nr.: 967 |
erste infos
ZITAT Bulldozer mit 3,5 GHz, Power mit 5,2 GHz, China mit Octocore In San Francisco stellt die Prozessorbranche derzeit auf der International Solid-State Circuits Conference ihre neuen Produkte vor. Am Gigahertzrennen beteiligt sich nur noch IBM, andere Unternehmen setzen auf neue Architekturen oder mehr Kerne. "Wir machen den letzten High-End-Prozessor, bei dem noch die Frequenzen nach oben getrieben werden", sagte ein IBM-Entwickler der EEtimes. Das Unternehmen hatte zuvor auf der ISSCC eine neue Version seines Power z196 vorgestellt. Der Prozessor mit Power-7-Architektur kommt auf 5,2 GHz statt 4,1 GHz wie zu Anfang - dafür hat auch eines der CPU-Module mit acht Kernen eine Leistungsaufnahme von 260 Watt. Bis zu sechs können in einem System verbaut werden Auf vergleichsweise geringe 1,05 GHz kommt der Godson-3B der staatlichen chinesischen Forschungseinrichtungen ICT und CAS. Er besteht jedoch schon aus acht Kernen und wird bei ST Micro mit 65-Nanometer-Technik hergestellt. Der Prozessor, der auf einer inzwischen lizenzierten MIPS-Architektur basiert, soll noch 2011 in einem neuen chinesischen Supercomputer eingesetzt werden. Schon jetzt hat China den schnellsten Supercomputer der Welt. Das System Tianhe-1A besteht aus Xeon-Prozessoren und Nvidia-GPUs. Langfristig will sich China aber von westlichen Zulieferern unabhängig machen. In zwei Jahren rechnen die Godson-Entwickler laut der EEtimes mit einem Petaflops-Rechner mit landeseigenen Prozessoren. Der nächste Schritt soll in rund zwei Jahren der Godson-3C mit 2 GHz, 16 Kernen und 28-Nanometer-Fertigung sein. Kleiner Kern bei Bulldozer Mit PC-üblichen Taktfrequenzen soll AMDs nächste Architektur Bulldozer arbeiten. Wie das Unternehmen nun auf der ISSCC bestätigt hat, sollen die Kerne 3,5 GHz erreichen. Ob dabei schon die erweiterten Turbo-Core-Funktionen von Bulldozer eingerechnet sind, ist jedoch nicht bekannt. Der EEtimes zufolge soll ein einzelner Bulldozer-Kern 30,9 Quadratmillimeter groß sein und bei 0,8 bis 1,3 Volt arbeiten. Die Leistungsaufnahme soll nicht über der bisheriger Prozessoren liegen, von höchstens 125 Watt für Desktop-CPUs ist also wohl auszugehen. Von AMD selbst gibt es bereits einige weitere Details zu Bulldozer. So soll der bei Bulldozer bis zu 8 MByte große L3-Cache recht sparsam sein, AMD nennt dafür eine Funktion namens "Column-Select Aliasing". Wie sie genau funktioniert, darf der Chiphersteller vor dem Vortrag nicht sagen, das ist eine der strengen Regeln der ISSCC. Daher sind auch die Präsentationen selbst noch nicht veröffentlicht worden. Eine Ausnahme macht hier stets Intel, welche diesmal die Folien zum nächsten Itanium 'Poulson' kurz nach dem Vortrag zur Verfügung stellten. LINK: ISSCC: Bulldozer mit 3,5 GHz, Power mit 5,2 GHz, China mit Octocore - Golem.de ZITAT AMD Bulldozer: Takt und Performance-Zahlen auf der ISSCC Auf der International Solid-State Circurits Conference hat AMD weitere Daten zur kommenden Bulldozer Architektur bekannt gegeben. Demnach steigt, wie EETimes berichtet, auch die Takt-Leistung eines Bulldozer-Kerns linear mit der Kernspannung, die zwischen 0,8 und 1,3 Volt liegen wird. Angepeilt ist eine Taktrate von 3,5 GHz innerhalb des gleichen Budgets an Energie- sowie Verlustleistung, wie sie auch bisherige Kerne von AMD aufweisen. Ein ganzer Zambesi-Prozessor wird also wieder mit bis zu 125 Watt TDP spezifiziert sein. Es ist hinsichtlich der Nennung dieser Energie-Budgets sehr wahrscheinlich, dass mit dem Begriff "Kern" in diesem Fall von einem Bulldozer-Modul die Rede ist. Bereits im letzen Sommer gab AMD bekannt, dass ein Bulldozer-Modul aus Energie- und Platzgründen aus zwei - vergleichweise weniger komplex konstruierten - Integer-Einheiten besteht, denen eine gemeinsame (shared) Floating-Point-Einheit zur Seite steht. In einem davon unabhängig zu betrachtenden Paper beschreibt AMD einerseits den 40-Entry Unified Out-of Order Scheduler, der bis zu vier Instruktionen pro Takt verteilen kann. Andererseits geht das Unternehmen darin näher auf die Performance der Integer-Units ein, die trotz Komplexitätsreduktion auch dank des Schedulers bis zu 90 Prozent der Performance bisheriger AMD-Kerne bereitstellen können sollen. Ohne Frage sind diese Leistungsdaten, so sie denn auch außerhalb von Laborbedingungen zutreffen, geradezu unglaublich gewaltig. Allerdings wurde bereits vor einer Woche - und somit noch vor dem Beginn der ISSCC - ein 3DMark Vantage CPU-Testergebnis bei RumorPedia.net geleakt, das einen nicht näher spezifizierten AMD Zambesi Prozessor mit 3,5 GHz etwa gleichauf mit einer Intel Core i7 2600K CPU mit 4,0 GHz zeigt. Verknüpft mit den neuen Informationen von der ISSCC scheint dieser Testwert nun nicht mehr ganz so abwegig. LINK: AMD Bulldozer: Takt und Performance-Zahlen auf der ISSCC Der Beitrag wurde von Roman001 bearbeitet: 22 Feb 2011, 22:12 |
|
|
Vereinfachte Darstellung | Aktuelles Datum: 24. November 2024 - 03:52 |
Copyright 2001 - 2014 technoboard.at
|
Die
Texte geben die Meinung der Autoren und nicht unbedingt die des technoboard.at
Teams wieder.
Alle fraglichen Inhalte werden auf Anfrage und alle gegen die BoardRegeln verstossenden Einträge automatisch entfernt (sobald sie bemerkt werden). Kontakt: [email protected] |