CPU/ AMD si prepara all'attacco del Pentium 4

CPU/ AMD si prepara all'attacco del Pentium 4

AMD è pronta al lancio della prossima generazione di Athlon. I megahertz di un processore relativamente semplice, rinnovato, potrebbero insidiare, su tutti i fronti, il sofisticato Pentium 4
AMD è pronta al lancio della prossima generazione di Athlon. I megahertz di un processore relativamente semplice, rinnovato, potrebbero insidiare, su tutti i fronti, il sofisticato Pentium 4


Fra la fine di quest?anno e i primi tre mesi del prossimo apparirà la nuova famiglia di Athlon che fronteggerà le nuove CPU di Intel.
Nato fin dall?inizio con l?obiettivo di superare il GHz, Athlon è stata l?ultima possibilità per AMD, ma anche per gli acquirenti, di impedire che Intel tornasse a monopolizzare il mercato dei microprocessori. Il Gigahertz è stato più che altro un obbiettivo di marketing, che ha avuto una notevole eco anche al di fuori del settore degli addetti al lavori. Intel non si aspettava una corsa così veloce verso le alte frequenze e la vecchia architettura P6 (nata con il Pentium Pro) ha presto mostrato i suoi limiti?.

Con la generazione precedente di K6-2 e K6-III AMD aveva compensato la bassa efficienza della FPU introducendo un? unità 3D-now! veramente sofisticata e in grado di pareggiare i conti, se utilizzata con software appositamente ottimizzato, con i Pentium di fascia bassa e i Celeron. Tuttavia l?appena tiepida risposta del mercato non ha permesso un adeguato supporto a tale tecnologia. Per questo, l?obbiettivo del Gigahertz era di fondamentale importanza. Ma non si trattava solo di fumo, l?arrosto è rappresentato da una FPU finalmente all?altezza, anzi superiore a quelle finora prodotte da Intel.

La necessità di essere pronti sul mercato ha in realtà costretto AMD ad alcuni compromessi nella definizione del processore, in modo da ridurre i tempi di sviluppo. Nonostante disponesse già delle tecnologie necessarie (K6-III) la cache di secondo livello è stata posta esternamente al nucleo del processore. Questo ha ridotto i costi, sia per la maggiore semplicità che porta a scarti inferiori, sia per le dimensioni minori del die di silicio che permettono volumi di produzione più elevati. Ma in questo modo la cache L2, con il modello di Athlon ad 1 GHz, poteva correre solo a 333 MHz, costituendo così un collo di bottiglia. Anche il processo produttivo è iniziato con gli ormai tradizionali 0,25 micron.

Ma forse la parte che più di tutte indica la fretta del produttore è l?implementazione di una predizione di salto (branch prediction) molto semplice e addirittura nettamente inferiore a quella del K6. Solo 2048 indirizzi, ottenuti secondo il semplice algoritmo a due bit di Smith, contro gli 8196 indirizzi organizzati dall?avanzato algoritmo GAs a due livelli del K6. L?aumento delle frequenze rendeva impossibile portare la stessa organizzazione del flusso di dati e così, a fronte di una efficienza inferiore, AMD ha posto una coda di esecuzione relativamente breve, che minimizza i tempi di ripristino nel caso in cui i dati e le istruzioni da elaborare non siano già presenti nella cache L1, che del resto ha dimensioni superiori alla concorrenza. La lentezza della cache L2 è stata risolta con la generazione attuale di Thunderbird e Duron, nei quali, anche se di dimensione dimezzata, lavora a piena frequenza.
Un?architettura semplice, in grado di raggiungere frequenze elevate come i 1.200 MHz attuali che si contrappone alla struttura, in teoria più efficiente, dei Pentium III Coppermine, la cui architettura, a queste frequenze, sembra ormai però agli estremi limiti. Ma con il nuovo Pentium 4 le carte sono destinate a rimescolarsi.


Con il nuovo Pentium 4 Intel si è finalmente fatta carico di progettare un nuovo core per un processore a 32 bit e ha scelto, ancora una volta, la via più complessa. Unità aritmetiche che lavorano internamente a frequenza doppia, e quindi la possibilità di elaborare fino a 4 istruzioni per ciclo di clock nominale, nei casi migliori. Per tenere sempre impiegate unità così veloci Intel ha costruito un sistema di branch prediction ancora più efficiente in grado di ?preparare? ben 126 istruzioni e ha implementato una coda di esecuzione di almeno 20 livelli. Questo porta ad alcuni inconvenienti. La circuiteria per la predizione di salto acquista ulteriore importanza, aumentando di dimensione, e con essa la dimensione del core.
La stessa complessità porta a una mole di trasferimenti di dati e istruzioni fra una parte e l?altra del processore. Inoltre l?eventuale predizione sbagliata porta a dei rallentamenti notevoli.

AMD ha deciso per la prossima generazione di processori di seguire la politica dei piccoli passi. Già di moderna progettazione il gioiello Athlon necessitava solo di un affinamento delle proprie caratteristiche. E? atteso un miglioramento della tecnica di branch prediction con il contemporaneo allungamento della coda di esecuzione dagli attuali 10 passi ad almeno 12 livelli, mantenendo comunque una sostanziale differenza rispetto ad Intel. I
l potenziamento delle istruzioni 3Dnow!, l?ottimizzazione di tutta l?architettura con una sensibile riduzione del consumo energetico e quindi del calore prodotto e l?aumento della cache di 2° livello, sono le principali migliorie attese fra la fine dell?anno e i primi mesi del 2001 che dovrebbero portare Athlon verso quelle che sono le sue reali potenzialità.

Se la seconda generazione di Athlon si è biforcata in due famiglie di CPU, Thunderbird e Duron, la terza generazione si dividerà in tre: Mustang per i server, Palomino per i desktop e Morgan il mercato low-end.
La principale differenza fra queste versioni riguarda la dimensione della cache L2, sempre operante a piena frequenza.

Mustang ne adotta un quantitativo da 1 a 4 MB. Si contrappone all?attuale Xeon di Intel rispetto al quale raddoppia sia la cache che la frequenza di clock, inizialmente di 1,4 GHz, e sarà il primo processore a sfruttare, con i chipset opportuni, il nuovo Front Side Bus a doppio fronte da 266 MHz. Ovviamente è implementato il supporto multiprocessore con una architettura in grado, teoricamente, di affiancare un numero illlimitato di processori.

Palomino adotterà 512 KB di cache L2 contro gli attuali 256 KB e avrà frequenze iniziali probabilmente di 1,5 GHz sempre con FSB a 266 MHz.

Morgan ricalcherà invece l?attuale configurazione del Duron. Ricevendo il nuovo core, mantiene la cache L2 a 128 KB e il FSB a 200 MHz, questo forse anche per incrementare il divario rispetto ai modelli superiori.

AMD ha già introdotto le interconnessioni al rame nei propri processori e conta di passare a un processo produttivo di soli 0,13 micron a partire dal terzo trimestre del 2001.

Conclusioni

AMD ha dimostrato di avere in casa un?ottimo progetto (l?Atlhon) con il quale attaccare decisamente Intel. In realtà fino ad ora questo processore non ha avuto la possibilità di spingersi realmente verso i propri limiti come forse questa nuova evoluzione gli consentirà.
La realtà è che Intel ha trovato pane per i suoi denti, con un concorrente che per la prima volta non ne segue semplicemente la strada già battuta, ma capace di tracciarne di alternative, magari più semplici, ma altrettanto efficaci.
L?appoggio a una tecnologia valida e relativamente economica come le memorie DDR potrebbe portare AMD verso quote di mercato rilevanti, ed ovviamente a scapito della mastodontica e macchinosa Intel.

Raffaele Galli

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
29 ott 2000
Link copiato negli appunti