AMD K7 ATHLON PROFESSIONAL-THUNDERBIRD
Je lepší? Není lepší? Je lepší? Není lepší? Kdo to ví?
Až dosud byly procesory Athlon vybaveny 512kB paměti L2 cache pracující většinou na frekvenci kolem 350MHz. Od 600 a 700MHz Athlonů se používá 1/2 dělič frekvence, cache tak běží na 300 resp. 350MHz. Je tu ovšem omezení: jedná se o externí paměť realizovanou SRAM chipy, které těžko mohou spolehlivě fungovat na frekvencích výrazně vyšších než 400MHz. Co se ale stane, když bude jádro procesoru taktováno na 750 nebo 800MHz? Při 750MHz jádru a dělení 1/2 by cache běžela na 375MHz, což je pro používané SRAMy příliš. Výsledkem je, že tyto chipy dělí frekvenci jádra koeficientem 2/5 a cache běží jen na 40% frekvence procesoru.
V AMD to teda vyřešili způsobem, který je hoden kojenci. Tím zapříčinili, že úsilí o dosažení co nejvyšší rychlosti procesoru je degradováno vlastně stále pomalejší pamětí cache, která snižuje výkonnost celého systému. U 1GHz Athlonu by při použití dělícího faktoru 1/3 běžela L2 cache na frekvenci pouhých 333MHz. Považovali byste takový 1GHz procesor opravdu za výkonný?
Tak co má pod kapotou? :
Thundebirt je dělanej od 700 do 1.2 GHz, zatím. Vyroben 0.18um CMOS. Pouzdro PGA s 462 vývody do soketu A nebo Card Module do Slotu A, 37 Mil. tranzistorů při 256kB L2 cache. Jeho L1 cache má 64kB (plus 24kB předekodovací cache) pro instrukce, 64kB pro Data dvoucestná, L2 Cache 128kB nebo 256kB 16-ti cestná přímo na čipu. Jeho přednosti: 3 třícestný paralelní vícenásobný vektorový dekodéry (ROPSy a Makroperace pro Integer a ROPSy pro FPU), 72 záznamů v instrukční kontrolní jednotce, 3 IEU a 3 AGU jednotky jako ALU, 2048 položek u dynamický předpovědi skoků, plně zřetězený třícestný FPU s 2x MMX Extended a 3DNOW! Enhanced + 5 (DSP instrukce pro MP3, internet, ADSL a Dolby Digital zvuk) instrukcí Athlon DLL, to jsou tři nezávislý 15-ti stupňový pipeliny každá s jednim portem, 3 superskalární out-of-order pipelined jednotky pro výpočet adres, 3 superskalární out-of-order pipelined (10-ti stupňový pipeliny) integer jednotky . Dynamic execute, FSTORE, 2 64-bit LOAD/STORE porty, větvení instrukcí do 4096 větví s 95% přesností, částečnej SSE , spekulativní provádění out of order, stupeň asociativity je 2 , 6 vrstev metalizace. Navíc podporuje Lightning Data Transport. Systémová sběrnice obsahuje 13-bitovej undirectional request channel, 13-bitovej undirectional probe channel a 72-bitovej bidirekční kanál s 8-bitovym ECC. System managment zajištěn přes ACPI z operačního systému. Jedná se o high-end verzi Duronu. Podporuje multiprocesing. Thunderbird komunikuje na FSB 200 a 266 MHz (DDR). Max. teplota jádra je 90°C.Procesory Thundebirt podporuji DDR(duble data rate) paměti. Základní desky pro tyto druhy pamětí by se měli objevit v prvním čtvrtletí roku 2001.
To je Thunderbird.
Nové jádro Thunderbird firmy AMD integruje 256kB paměti L2 cache běžící na plné rychlosti procesoru. Přesunutí cache z PCB přímo na chip umožnilo taktovat tuto paměť stejně jako jádro procesoru - u 1GHz Athlonu běží L2 cache na frekvenci 1GHz. Cache je sice značně menší, ale její rychlost úctyhodně vzrostla. Vedle zvýšení rychlosti přináší Thunderbird ještě další modifikace paměti cache.
V první řadě, přístup k datům v paměti L2 cache trvá mnohem kratší dobu (přístupovou dobu nebo-li latenci). Podle AMD bude L2 latence procesoru Thunderbird 11 cyklů. U Athlonu s poloviční frekvencí to pro srovnání bylo 21 cyklů. To nás přivádí k otázce zdržení spojeného s pamětí L1 cache - skutečná latence L2 cache nám pak vychází 8 resp. 18 cyklů. Nedá se nic dělat, přístup k L2 cache paměti bez tří cyklů, které spotřebuje přístup k paměti L1 cache není možný.
Všechny dosud vyrobené Athlony jsou vybaveny 3 cyklovou 128kB velkou L1 cache pamětí harwardského typu, která se skládá ze dvou samostatných 64kB pamětí cache: jednou instrukční (I-CACHE) a jednou datovou (D-CACHE). Tato L1 cache je podstatně větší než L1 cache procesorů Pentium III (32kB) nebo K6 (64kB). Dívejte se na to tak, že pokud je možné získat data z L1 cache, pak k tomu potřebujeme jen 3 cykly. Jinak je třeba číst z L2 cache, což nás bude v případě procesoru Thunderbird stát dalších 8 cyklů (18 cyklů u dosavadních "klasických" Athlonů). Proto se AMD snaží zvětšováním paměti L1 cache zvýšit i pravděpodobnost, že software požadovaná data najde hned v L1.
V situaci, kdy požadovaná dat nejsou v L1 cache nalezena, je u klasických Athlonů navíc pravděpodobné, že procesor bude v L2 cache paměti znovu prohledávat stejná data jako v L1 cache. Jádro K7/K75 totiž používá takzvanou inkluzivní cache, u které jsou data z L1 cache paměti zároveň uložena i v L2 cache. A tak 128kB L1 + 512kB L2 = 512kB celkem. Zajímavá matematika ...
Thunderbird tuto matematickou anomálii řeší použitím exkluzivní paměti cache. Data uložená v L1 zde nejsou duplicitně zapisována i do L2 a tak 128kB L1 + 256kB L2 = 384kB celkem. Zatím, co přidání 256kB on-die cache paměti vedlo ke zvětšení chipu ze 102 na 120mm2, zvětšení celkové efektivní cache paměti o 128kB díky použití exkluzivního typu je v tomto ohledu zcela "zdarma".
Rychlost přístupu k paměti cache je částečně pohlcena další změnou, kterou je zvýšení asociativy cache paměti ze 2 na 16. Jednoduše řečeno - nemůžete zaručit, že to, co je v L1 nebude v L2, dokud nevíte, co už v L1 je.
Závěr: tak co bude?
Jsou tu i jiná hodnotící kritéria,
např. ekonomická. Vedle toho, že vzrostla plocha chipu, zase společnosti AMD
zmizely starosti s externími pamětmi SRAM. Dalším přínosem je DDR SDRAM chipset AMD-760, který přinesl další zlepšení výkonnostních a
funkčních parametrů systémů založených na procesorech Thunderbird.
zdroj:amd.doupe.cz