|
ISSN 1213-0818 22.05.2003 09:11 |
Architektura Opteronu Obr. 5 - Opteron seshora a zespodu převzato z Tom's Hardware Dále je vidět, že celá spodní strana je zaplněna piny, kterých byste s trochou trpělivosti napočítali rovných 940. Tomu odpovídá i nový typ patice nazývaný oficiálně "AMD Socket 940". Končí tedy éra jedné z nejdéle přežívajících patic mezi procesory, Socketu A (nebo-li Socket 462), který používala celá škála řešení od AMD. V desktopové verzi ho pak nahradí Socket 754 pro Athlon 64. Uchycení chladiče zůstává stejné, v případě Athlonu 64 ovšem bude existovat podobný systém jako u Pentia 4. Obr. 6 - Nová patice Socket 940 převzato z Tom's Hardware Opteron je první procesor AMD, který je vyráběn 0,13mikronovým procesem s technologií SOI (Silicon On Insulator). Stejně jako všechny moderní procesory této společnosti ho produkuje drážďanská Fab 30, stále ovšem na 200mm křemíkových plátech (Intel využívá 300mm). Velikost čipu procesoru Opteron je 193 mm2, z čehož přes 50% zabírá L2 cache. Teoreticky lze z každého plátu získat 148 čipů, při 60% výtěžnosti (která je navíc velmi nadsazená) je to kolem 89 čipů. Pro porovnání - z jednoho plátu získá AMD 153 Bartonů nebo 186 T-Bredů. Není divu, že Opterony jsou relativně drahé. Interní mikroarchitektura AMD Opteron je postaven na jádře SledgeHammer, které je velmi podobné některým Athlonům XP/MP, v několika faktorech se ovšem liší. Nejdříve se podívejme na samotné rozložení tranzistorů v jádře: Obr. 7 - Detail jádra Opteronu Celkově obsahuje procesor 105,9 milionu tranzistorů a co rozhodně na první pohled upoutá je obrovská cache. Ještě jsme se o ní nezmiňovali, ale vězte, že její velikost je 1MB. Druhou změnou je relativně rozsáhlý integrovaný paměťový řadič, který se nachází vedle samotné funkční jednotky. Ta se ovšem příliš neodlišuje od procesorů AMD K7, protože na první pohled se zdá rozložení částí totožné. Vidíte, že vynecháme-li L1 a L2 cache, paměťový řadič a rozhraní DDR sběrnice a HyperTransportu, tak samotné funkční jádro zaujímá velmi malou část čipu. Zde jsou bloková schémata procesoru Opteron, která byla průběžně zveřejňována na různých akcích. První slide de facto odpovídá detailu jádra, který je o pár řádků výše - velká L2 cache, instrukční a datová cache o velikosti 64kB přistupující k jádru a kontrolery pro duální paměť DDR a sběrnici HyperTransport. Více o těchto součástech níže. Na obrázku je také zmiňována L2 cache o velikosti "až 1MB". Nakonec to dopadlo tak, že pro všechny série Opteronů bude cache sjednocená o velikosti 1MB. Tato vyrovnávací paměť je 16-way asociativní a její zpoždění je 8 cyklů. Další schéma již odhaluje procesorovou pipeline podrobněji, komentáře k ní naleznete v následujícím rozboru. Integrovaný paměťový řadič Opteron tedy ve svém jádře obsahuje integrovaný paměťový řadič. Co to znamená? Většina současných procesorů přistupuje k hlavní paměti přes NorthBridge, což je jedna součást čipové sady umístěná na základní desce. Spojení mezi procesorem a NorthBridge musí být realizováno pomocí sběrnic, které zpomalují tok dat a zvyšují zpoždění (latenci). Protože má ale Opteron řadič pamětí přímo v jádře, snižuje se tak latence a přístup je výrazně rychlejší, údajně až o 20%. Pro přístup do paměti má Opteron k dispozici dva 72-bitové kanály s podporou pamětí DDR SDRAM na frekvenci 200MHz, 266MHz a 333MHz. Znamená to, že nejvyšší propustnost je 5,4GB/s, což je sice méně než u desktopových čipsetů nForce2 či Canterwood, ale propustnost roste s počtem procesorů. Každý procesor dokáže adresovat až 8GB paměti. Menší nevýhodou tohoto systému je zafixovaná podpora určitého typu pamětí. V serverové oblasti sice není situace tak žhavá, ale přesto je omezení na DDR333 nevýhodné. Další generace Opteronů by již mohla přijít i s podporou DDR-II, ale těžko říci, jak se tyto paměti prosadí a zda-li se dostanou také do serverů. Pipeline podrobněji Na počátku rozboru procesorové pipeline Opteronu se nejdříve podíváme na její schéma, tentokrát trochu odlišné od předchozího: Instrukční i datová cache procesoru jsou shodné velikosti 64K, jsou 2-way asociativní a velikost řádku je 64 bytů. Jejich zpoždění je stejně jako u Athlonu 2 cykly, ale kromě toho se od generace K7 odlišuje v dalších parametrech (nepočítáme-li větší cache, HyperTransport a integrovaný řadič pamětí). Je to například rozsáhlejší TLB (Translation Look-Aside Buffer) pro L2 cache, který zvládá 512 vstupů a také o něco zvětšený TLB pro L1 cache, jenž nyní činí 40 vstupů. Vyrovnávací paměť první i druhé úrovně samozřejmě podporuje ECC. Opteron má také oproti Athlonu delší pipeline, která čítá 12 celočíselných a 17 floating-point stupňů. Prodloužení bylo nutné z důvodu použití sběrnice HyperTransport a v budoucnu dovolí lepší škálovatelnost. SledgeHammer také zvládá rychleji násobení celých čísel a provádění SSE instrukcí. Mimo to byla vylepšena i předpověď větvení kódu (Branch Prediction). Podle AMD je sice nutné prodloužit kód asi o 10%, ale počet statických instrukcí klesl o 10% a počet dynamických asi o 5%. Efektivita 64-bitového kódu také omezuje počet load/store instrukcí až o 20%. Opteron nepodporuje simultánní multithreading (SMT), ale pouze chip-level multithreading (CMT) podporující dvouprocesorovou architekturu. Schéma funkce je vidět na následujícím obrázku: Celkové uvolňované teplo Opteronu je cca 89W a potřebné napájení se pohybuje kolem 1,55V. To by bylo k pipeline Opteronu přibližně vše a na další straně se můžete podívat podrobněji na popis sběrnice HyperTransport a také způsoby zapojení Opteronu do systému.
|
|