AMD FX-8150: finalmente 8-core per desktop

AMD FX-8150: finalmente 8-core per desktop

AMD toglie oggi i veli alle CPU Zambezi: nelle intenzioni dell'azienda segneranno il punto di svolta. Ma Bulldozer sarà in grado di spianare la concorrenza?
AMD toglie oggi i veli alle CPU Zambezi: nelle intenzioni dell'azienda segneranno il punto di svolta. Ma Bulldozer sarà in grado di spianare la concorrenza?

Finalmente! Quella frase, il rispetto dei tempi per le CPU AMD, che ormai rischiava di diventare un ossimoro per oggi è dimenticata, cancellata. Come fosse una sposa nel giorno del suo matrimonio, oggi dalle parti di Sunnyvale si fa festa per annunciare Bulldozer, nella sua incarnazione desktop .

Le prime CPU basate su questa interessante architettura, della quale si è molto parlato negli ultimi tempi con anticipazioni , indiscrezioni ed overclock da record , debuttano oggi sotto il nome commerciale di FX-Series , un marchio che ritorna da un glorioso passato per indicare la strada che AMD seguirà nel prossimo futuro per i suoi processori x86. Dalle soluzioni attuali si parte immediatamente per una nuova avventura che affonderà le sue radici sempre sull’architettura Bulldozer alla quale saranno apportati continui miglioramenti e dalla quale nasceranno ogni anno nuovi modelli, sperando che AMD riesca a mantenere le sue promesse sulle tempistiche.


Bulldozer oggi e fra qualche anno

Ma fermiamoci a quello che è l’evento odierno: quattro sono i modelli dai quali AMD ha appena tolto i veli. Con essi vengono introdotti per la prima volta processori x86 a 8-core per sistemi desktop che supportano in maniera nativa memorie DDR3-1866 ed un esteso set di istruzioni comprendente anche quelle AES ed AVX con FMA4 e XOP. Queste CPU sono inoltre completamente sbloccate per la gioia di tutti gli overclockers e, come i modelli Phenom II che si propongono di sostituire, oltre ai core x86 integrano un controller delle memorie ed il bus Hypertranport ma nessun core grafico, come invece accade per le APU A-series e per le CPU rivali Intel Sandy Bridge.


Il kit di prova per Bulldozer

Le CPU FX (note anche con il nome in codice di Zambezi ), sono anche le prime di AMD per sistemi desktop ad essere realizzate con processo produttivo a 32nm , presso le fonderie di Globalfoundries . Assieme ad esse AMD ufficializza i chipset della serie 9 anche se le schede madri che li utilizzano sono ormai disponibili sul mercato da alcuni mesi.

E, a proposito di piattaforme, AMD continua a tener fede alla sua politica garantista sugli aggiornamenti: le CPU Zambezi utilizzano il socket AM3+, compatibile all’indietro con il socket AM3 utilizzato dalle CPU Phenom II. Questo significa che una scheda madre di nuova generazione può ospitare una CPU di vecchia generazione; il fatto di poter installare una CPU FX su una vecchia scheda madre socket AM3, invece, è da verificare caso per caso e sicuramente si dovrà rinunciare a qualche feature, come il Turbo Core.

Prima di parlare delle nuove CPU e delle loro caratteristiche è necessario comprendere alcuni concetti chiave dell’architettura Bulldozer . Con questo nome AMD indica l’architettura del singolo core – o meglio del singolo modulo come vedremo in seguito – sul quale sono basati i nuovi processori e che costituirà la base anche di quelli che l’azienda immetterà in commercio nei prossimi anni.


Architettura dual-core tradizionale

Una tipica architettura multi-core x86 prevede core completamente separati ed indipendenti che dispongono tutti delle risorse necessarie in maniera esclusiva e di almeno una cache di primo ed una di secondo livello. In generale è presente anche una cache di terzo livello condivisa fra tutti i core e utile ad evitare che le comunicazioni intercore debbano transitare per un percorso al di fuori della CPU stessa. La soluzione appare ottimale per quel che concerne le prestazioni (tutti i blocchi restano ad uso esclusivo del thread che sta utilizzando il core), evitando così qualunque problema di concorrenza e condivisione delle risorse. Ma si tratta davvero di una soluzione efficiente?


Modulo dual-core dell’architettura Bulldozer

Nella realizzazione dell’architettura Bulldozer, AMD ha avuto un’idea a nostro avviso eccellente: capire quali sono i blocchi maggiormente utilizzati dalle tipiche applicazioni x86 e trovare un modo per ottimizzare l’hardware sottostante. Gli ingegneri dell’azienda hanno dunque creato un blocco di base, indicato come modulo , comprendente due core x86 : le unità per il recupero e la decodifica delle istruzioni e la cache L2 sono risorse condivise così come la FPU la quale però diventa più complessa rispetto a quella che sarebbe stata disponibile all’interno del singolo core. Le ALU e le cache L1 restano invece unità distinte capaci di elaborare due thread in maniera completamente indipendente.


Specifiche tecniche

Gli obiettivi sono due: rispondere alle richieste di picco circa la banda dati fra core avanzate dalle attuali applicazioni e massimizzare l’uso del silicio. A tal proposito AMD dichiara di aver impiegato circa 2 miliardi di transistor per realizzare una CPU Zambezi a 8 core spalmati su una superficie di 315 millimetri quadrati. Non ci è possibile, purtroppo, sapere quanti transistor sono stati imppiegati per ogni singolo core x86, dato non comunicato da AMD e molto difficile da ricavare (Zambezi integra diversi elementi di contorno oltre ai 4 moduli a doppio core). Il produttore parla comunque di un risparmio del 20% passando da un’architettura tradizionale a Bulldozer.

Certo è che guardando ai 2 miliardi di transistor tutta questa ottimizzazione non la si nota . Partendo dalla CPU rivale Sandy Bridge dotata di 4 core fisici ed escludendo le parti che non sono "core x86", come il controller delle memorie, il core grafico, la cache di terzo livello ed il controller PCI Express, il numero di transistor che ci troviamo di fronte potrebbe essere pari, almeno come ordine di grandezza, a 700 milioni (1,16 miliardi meno il 40% circa). Possiamo perciò ipotizzare che una fantomatica CPU Sandy Bridge a 8 core possa necessitare di circa 1,16 miliardi + 700 milioni di transistor per un totale di 1,8 – 1,9 miliardi. La soluzione di AMD, nonostante le ottimizzazioni, prevede almeno 100 milioni di transistor in più e non dispone nemmeno del core grafico integrato.

Dunque per che cosa sono stati utilizzati tutti i transistor "in avanzo"?


Diagramma a blocchi del die di Zambezi

Guardando le caratteristiche delle CPU Zambezi ed il diagramma a blocchi del relativo die, si intuisce immediatamente dove AMD ha speso il bonus accumulato nella progettazione del singolo modulo Bulldozer. A differenza di altri processori la cache L2 a disposizione di ogni modulo è pari a ben 2MB il che corrisponde ad 1MB per ogni core. Sandy Bridge ne prevede appena 256KB mentre Thuban e Deneb arrivano a 512KB.

L’architettura delle cache di Bulldozer è stata completamente rivista anche sotto altri aspetti. L’utilizzo di una gerarchia a 3 livelli non è certo una novità, usata sinora sia da Intel che da AMD stessa. Ma con Bulldozer c’è qualcosa in più su cui ragionare.

La cache L1 , che AMD ha sempre suddiviso al 50% fra dati e istruzioni, questa volta prevede due parti completamente separate. 16 KB di cache L1 per i dati (4-vie set associativa) sono stati messi a disposizione di ogni core unitamente ad una TLB da 32 voci in grado di eseguire due operazioni di load su operandi a 128-bit per ciclo ed una operazione di store sempre su operandi a 128-bit per ciclo.

La cache L1 istruzioni è invece unificata per i due core che fanno parte del singolo modulo Bulldozer: questa scelta è chiaramente dettata dall’architettura che prevede il recupero delle istruzioni a livello di modulo. Per ognuno di essi AMD ha integrato 64KB di cache L1 istruzioni.


Diagramma a blocchi del modulo Bulldozer

La cache L2 è anch’essa disponibile a livello di  modulo e dunque condivisa fra i due core. In questo caso AMD ha scelto una cache da 2 MB set associativa a 16-vie con una TLB di secondo livello in grado di supportare fino a 1024 entry per servire sia le richieste dati che quelle istruzioni.

Infine la cache L3 (64-vie set associativa), condivisa fra tutti i moduli di Bulldozer, che si concretizza in 8 MB di memoria (qualunque sia il modello di CPU fra quelli attualmente annunciati). La cache L3 è stata inserita da AMD fra gli elementi che fanno parte del Northbridge assieme al doppio controller delle memorie DDR3 a 72-bit ed ai quattro link HyperTransport full-duplex da 16-bit.


Diagramma a blocchi di Zambezi

Vista la presenza di due distinti livelli per le unità di calcolo, modulo e core, AMD è stata costretta a riprogettare anche l’unità di front-end , responsabile della gestione della pipeline. Nell’allocazione dei thread, il front-end di Bulldozer tiene conto sia dei moduli che dei core individuali attraverso feature come quelle di decoupled predict (buffer delle istruzioni che permettono di disaccoppiare il fetch delle stesse dalla pipeline di esecuzione) e pipeline di  fetch con i target buffer di branch alimentati dalla coda di previsione (permettono il prefetch delle istruzioni direttamente da quelle previste dal modulo di prediction).

Questi meccanismi permettono ad un modulo Bulldozer di decodificare fino a 4 istruzioni per ciclo di clock contro le 3 delle CPU AMD Phenom II. In aggiunta, l’utilizzo di un physical register file (PRF) per memorizzare i risultati delle istruzioni eseguite aiuta a ridurre il traffico e la replicazione dei dati (una sola copia del dato al quale fare riferimento invece di copiare il dato ovunque esso serva) abbassando di conseguenza anche i consumi (la stessa tecnica è stata adottata anche da Intel nelle CPU Sandy Bridge ).


Il frontend di Bulldozer

Oltre al sistema di cache ed al front-end, un’importante modifica è stata apportata alla FPU (Floating Point Unit) , che rappresenta uno dei principali motivi per cui AMD ha fuso assieme due core all’interno di un modulo Bulldozer. Di questi aspetti abbiamo già ampiamente discusso nel precedente articolo " AMD e quel core e mezzo di Bulldozder ", ma crediamo sia bene riprenderne i tratti salienti per completezza di esposizione.

L’unità per il calcolo dei numeri in virgola mobile di Bulldozer può contare su uno scheduler indipendente e sue due FMAC a 128-bit. Vista nel suo complesso, all’interno del singolo modulo troviamo una sola di queste unità. Questa scelta comporta due vantaggi: da una parte si riduce la complessità del modulo e dall’altra si garantisce la presenza di un’unità floating point più potente che permette di gestire sia le istruzioni dei tradizionali set, come quelli SSE, sia le nuove istruzioni che fanno parte del set AVX (a 128-bit o a 256-bit). Con istruzioni a 256-bit Bulldozer utilizza entrambi gli FMAC per eseguirla. Ogni unità FP è in grado di eseguire due istruzioni a 128-bit oppure un’istruzione a 256-bit per ciclo di clock.

Durante la progettazione di Bulldozer AMD ha tenuto conto del supporto ai nuovi set di istruzioni ed il risultato è visibile nella tabella seguente.


Il supporto alle nuove istruzioni

Nuova generazione di processori implica una nuova tecnologia Turbo. Ora che quest’idea ha preso piede, tanto da essere utilizzata non solo nelle CPU di ultima generazione ma anche nelle VGA di fascia alta, AMD non poteva esimersi dal migliorarla.


Tecnologia Turbo Core in Bulldozer

Le CPU basate su architettura Bulldozer prevedono tre diverse modalità per il Turbo:

  • Base : la CPU funziona alla sua frequenza nominale e, in queste condizioni, solitamente resta al di sotto del massimo TDP consentito dalla piattaforma.
  • All Core Turbo (nuova modalità): tutti i core della CPU vengono portati a funzionare ad una frequenza più elevata di quella di base tutti  per tutto il periodo di tempo in cui il TDP resta al di sotto del suo valore massimo.
  • Max Turbo (stessa modalità dei Phenom II X6): quando non tutti i core sono utilizzati la frequenza di quelli che restano attivi viene aumentata ancor di più in quanto i consumi sono ulteriormente ridotti.

Grazie alla nuova modalità All Core Turbo, AMD prende maggiormente in considerazione i casi di applicazioni fortemente threaded.

Gli stati che portano all’attivazione delle modalità All Core Turbo (Turbo P1) oppure Max Turbo (Turbo P0) sono ben esplicati nei grafici qui in alto.


Efficienza della modalità Turbo

Analizzando l’efficienza della nuova tecnologia Turbo Core, si nota come essa sia quasi sempre superiore a quella AMD di prima generazione integrata nelle CPU Phenom II X6. Allo stesso tempo i risultati ottenuti sono di gran lunga più interessanti di quelli di un Core i7 980X e di quelli di un Core i5-2500k.

La nuova tecnologia Turbo Core si inserisce in un più ampio ventaglio di soluzioni che permettono di migliorare il rapporto tra consumi e prestazioni. Fra queste ci sono ovviamente le scelte architetturali di cui abbiamo discusso ed il processo produttivo a 32nm, oltre ad un estensivo clock-gating su tutto il circuito, sistema di alimentazione dinamica, feature di risparmio energetico controllate via firmware, stato C6, gestione dell’alimentazione delle memorie e stato di idle low power.
L’annuncio di oggi serve non solo ad ufficializzare la nuova architettura Bulldozer, che tra l’altro è stata già impiegata all’interno dei processori Opteron 6100 e 4200 per sistemi server disponibili da poco più di un mese, ma soprattutto per "dare il LA" alle prime sette CPU AMD FX delle quali quattro saranno immediatamente disponibili.


La line-up completa delle CPU AMD FX

Due modelli top di gamma a otto core, FX-8150 ed FX-8120 , oltre ad un modello a sei core FX-6100 e ad un modello quad-core FX-4100 sono le novità di oggi. Nella tabella che segue abbiamo raccolto tutti i dati relativi alle nuove CPU AMD, a quelle di precedente generazione ed alle soluzioni concorrenti firmate Intel.


Elenco processori

Il modello a 8 core più veloce della nuova gamma di processori AMD, l’FX-8150, ha una frequenza di funzionamento nominale di 3,6GHz che può raggiungere i 4,2GHz in modalità Turbo. Questa CPU dispone di 8 core fisici grazie ai quali può gestire fino a 8 thread indipendenti, 8MB di cache L2, altrettanti di cache L3, un controller delle memorie compatibile con moduli DDR3-1866 ed un TDP di 125W. Gli altri modelli si differenziano per frequenza di funzionamento, numero di core, cache L2 e TDP. La cache L3 resta invariata così come il controller delle memorie. In comune le CPU AMD FX hanno anche il moltiplicatore completamente sbloccato sia verso l’alto che verso il basso, impostabili in un range che va da 4x fino a 39,5x.


Massimo valore di moltiplicatore

I nuovi processori AMD FX continuano ad utilizzare la stessa tipologia di socket introdotta all’epoca delle CPU Phenom. Il socket AM2 si è pian piano trasformato in socket AM3 prima e socket AM3+ ora mantenendo sempre determinate doti di compatibilità. Fra socket AM3 ed AM3+ vi sono comunque delle piccole differenze che includono un diverso numero di pin (941 per il primo e 942 per il secondo) seppure con le attuali CPU Bulldozer pare che AMD non abbia utilizzato il pin aggiuntivo (secondo indiscrezioni sarà usato nella futura evoluzione Piledriver).


Il socket AM3+

La somiglianza con le CPU di passata generazione non si ferma al socket. A prima vista i processori AMD FX non si distinguono dai Phenom II e dagli Athlon II. Il modello FX-8150 che stiamo utilizzando per le nostre prove reca la sigla FD8150FRW8KGU . Si tratta dunque di un engineering sample che comunque non dovrebbe differire dai modelli retail che troverete in commercio.


AMD FX-8150


Phenom II (a sinistra) vs. AMD FX-8150 (a destra)

All’epoca dell’annuncio delle CPU Llano AMD ha introdotto la nuova piattaforma Lynx. Lo stesso accade anche oggi con la piattaforma FX Scorpius seppure chipset e schede madri per questi processori li conosciamo già da tempo: le prime soluzioni con chipset della serie 9 sono state già annunciate diversi mesi fa, in occasione dell’ultimo Computex di Taipei, quando tutti i produttori taiwanesi attendevano l’ufficializzazione delle CPU che solo oggi AMD è stata in grado di immettere sul mercato.


La piattaforma Scorpius

La piattaforma Scorpius va a completare il quadro di tutte le soluzioni per sistemi desktop proposti da AMD:

  • Fascia bassa : piattaforma Brazos (Zacate e Ontario) con socket BGA-413
  • Fascia media : piattaforma Lynx (Llano) con socket FM1 (937-pin)
  • Fascia alta : piattaforma Scorpius con socket AM3+ (942-pin)

La piattaforma Scorpius include una CPU AMD FX, una scheda madre con chispet della serie 9 ed una scheda grafica discreta AMD Radeon HD 6000. Questa rappresenta, secondo la visione di AMD, una soluzione bilanciata in termini di prestazioni e costo per giochi e intrattenimento multimediale .


Schema a blocchi della piattaforma Scorpius

Il chipset AMD 990FX rappresenta il modello top di gamma fra i tre nuovi arrivati e può essere abbinato al southbridge SB950 . Il northbridge dispone di 38 linee PCI Express 2.0, 32 delle quali utilizzabili per due connettori PCIe x16 per schede grafiche in modalità CrossFireX (o quattro connettori x16 dotati ognuno di 8 linee); le restanti 6 linee possono essere impiegate per connettori PCIe x1 o x4. Il southbridge è invece responsabile di ulteriori 4 linee PCI Express, 14 porte USB 2.0, 2 porte USB 1.1, connessione Gigabit Ethernet, 6 porte SATA 3 con RAID 0, 1, 5, 10, audio HDA multicanale e connessione PCI tradizionale. Manca invece il supporto nativo a USB 3.0.


Chipset

Tutti i chipset della serie 9 sono realizzati con tecnologia di processo a 65nm e sono disponibili in package FC BGA con consumi tipici di circa 10W. A differenziare i tre modelli sono solo le possibili configurazioni per le schede grafiche e dunque la disponibilità di linee PCI Express. D’altro canto le altre funzionalità sono gestite dal southbridge SB950, identico  per tutti.

Rispetto al chipset più evoluto della rivale Intel, AMD garantisce un miglior supporto per periferiche di storage con sei connessioni SATA 3.0 native contro le due di Z68 ed una maggiore disponibilità di linee PCI Express (nel caso della piattaforma Intel questa limitazione dipende dalla CPU che integra anche il controller PCIe). Per effettuare le prove è stata usata una scheda madre ASUS Crosshair V Formula con chipset AMD 990FX la quale rappresenta, al momento, uno dei modelli top di gamma per la piattaforma Scorpius. La stessa scheda madre l’avevamo già utilizzata per valutare le prestazioni del controller SATA 3.0 integrato nei nuovi chipset.

La proposta di casa ASUS è stata realizzata utilizzando connettori e PCB colorati in nero e rosso: la vista d’insieme è eccellente, anche grazie al perfetto ordine con cui ogni parte è stata sistemata on board.


La scheda madre ASUS Crosshair V Formula

Il socket AM3+ che, come detto, differisce per solo un pin rispetto al precedente socket AM3, è realizzato in plastica nera e dispone della tradizionale leva in acciaio per il bloccaggio della CPU nella sua sede. Ai lati del socket sono stati posizionati due supporti che permettono l’installazione di dissipatori standard e che possono essere facilmente svitati per far posto invece a soluzioni di raffreddamento custom. Ben fornita la sezione di alimentazione che prevede 8+2 fasi ed un corposo sistema di raffreddamento su tutti i componenti attivi.

La scheda dispone di 4 slot per memorie DDR3-1866 funzionanti in modalità dual-channel (basta utilizzare gli slot a due a due popolando quelli dello stesso colore).


Il socket AM3+ e la sezione di alimentazione

Gli slot di espansione comprendono 4 connettori PCI Express x16: i primi tre possono essere configurati per un funzionamento come x16+x16+N/A oppure x16+x8+x8; il quarto funziona sempre come un x4. Sono poi disponibili un connettore PCI Express x1, infilato fra i primi due connettori PCIe x16 (questo significa che nel caso di installazione di una VGA dual-slot, tale connettore sarà inutilizzabile), ed un connettore PCI tradizionale.


Gli slot di espansione

Il chip del northbridge ha una dimensione abbastanza importante ed è coperto dal sistema di dissipazione che raffredda anche i componenti di alimentazione. ASUS ha previsto un piccolo dissipatore anche sul southbridge SB950.


Northbridge AMD 990FX

Sei connettori permettono di installare altrettanti dischi e periferiche ottiche Serial ATA 3.0. ASUS ha integrato un ulteriore connettore per periferiche eSATA.


I connettori SATA 3.0

Le connessioni di I/O includono quattro porte USB 3.0, sette porte USB 2.0 più una dedicata alla tecnologia ROG Connect, una porta PS/2 per tastiera o mouse, una porta RJ45 per Gigabit LAN, una porta eSATA, jack audio analogici e SPDIF per audio digitale su fibra ottica. È presente infine un tasto per le operazioni di reset del bios.


I connettori di uscita

Per eseguire i test sulle CPU abbiamo rispettato le seguenti regole:

  • Sulla scheda sono stati installati solo i componenti necessari: CPU, Memoria, Scheda video e Hard disk.
  • L’hard disk è stato formattato, sono stati poi installati il sistema operativo, i drivers per le periferiche e, quando necessario, sono state installate patch e aggiornamenti.
  • Ogni test è stato ripetuto per tre volte e, se i risultati di qualche test si mostrano troppo lontani dalla media (elevata varianza), il test stesso è stato di nuovo ripetuto, scartando il risultato non corretto.
  • Alla fine di ogni sessione di prova l’hard disk è stato formattato.

In merito ai sistemi di prova, ci siamo serviti di differenti piattaforme a seconda del tipo di CPU. Ciò è stato necessario per ottenere un sistema funzionante per ogni tipo di Socket che le CPU utilizzate per la nostra comparazione utilizzano. Ovviamente si è cercato di realizzare i sistemi con componenti simili, quando possibile, uguali.


Sistemi di prova

I test eseguiti sono descritti qui di seguito:

Benchmark sintetici

  • Fritz Chess Benchmark : questo è un tool che misura la potenza del processore di sistema utilizzando il motore per la creazione di giochi di scacchi "Fritz 9 engine". Il risultato del test è espresso in nodi per secondo medi. Il software è fortemente ottimizzato per girare in ambienti multicore ed è capace di attivare fino ad 8 thread contemporaneamente.
  • ScienceMark 2.0 : grazie a ScienceMark è possibile misurare le prestazioni del sistema in ambiente di calcolo spinto. Inoltre il software misura le prestazioni della memoria di sistema e della cache integrata nella CPU.
  • SiSoft SANDRA 2010 : questa suite di benchmark sintetici ci offre un quadro specifico delle prestazioni di ogni componente disponibile all’interno della piattaforma di test come memorie, CPU, disco fisso e così via.

Grafica 3D

  • 3DMark06 (versione 1.1.0 Professional) : ci permette di valutare le prestazioni grafiche 3D offerte dal sistema. Nel suo computo sono inclusi, in particolare, la CPU, la memoria di sistema ed il controller grafico.
  • World In Conflict (RTS): si tratta di uno strategico in tempo reale, che unisce a questo tipo di giochi una visuale simile a quella degli sparatutto in prima persona e che fa degli effetti particellari e della fisica le sue armi migliori.
  • Crysis: uno dei più indicativi titoli 3D DirectX 10 per effetti grafici e per l´utilizzo della fisica.

Utilizzo generico

  • PovRay (versione 3.6) : il tool Persistence of Vision Raytracer (PovRay) permette di creare grafica tridimensionale di elevata qualità. Al suo interno troviamo una scena standard creata proprio per effettuare benchmark sulla CPU che sfrutta la maggior parte delle feature disponibili con questo software. Per rendere ripetibili i nostri test utilizziamo sempre le impostazioni di default del file.ini .
  • Cinebench (versione 10 e versione 11) : suite di test multi-piattaforma basato sul software di animazione CINEMA 4D ampiamente utilizzato da studi e case di produzione per la creazione di contenuti 3D. Grazie ad esso possiamo valutare le performance del sottosistema CPU seppure l’influenza di chipset, memorie e scheda grafica installate nel sistema non può essere trascurata. Il software esegue un test di rendering capace di sollecitare uno o tutti i core del processore disponibili.
  • 7-Zip (versione 9.15 beta) : con questo noto software di compressione dati eseguiamo due diversi benchmark. Il primo viene realizzato utilizzando il tool integrato che restituisce una indicazione sui MIPS (million instructions per second) che il sistema è in grado di offrire (potete confrontare i risultati ottenuti con quelli ufficiali e con quelli del vostro sistema). Il secondo invece prende in considerazione una situazione reale nella quale viene richiesto al sistema di comprimere in formato 7z una cartella da 5,36GB contenente 4.379 file di diversa dimensione e tipologia (immagini, testo, html, video, foto, applicazioni) e 536 sottocartelle e poi di decomprimere la stessa. L’operazione di compressione ha una forte dipendenza dalla memoria cache della CPU e dalla memoria RAM installata nel sistema. Quella di estrazione dipende molto, invece, dalla capacità della CPU di gestire le operazioni su interi. In tutti i casi, il software sfrutta abbastanza bene tutte le risorse (core) di CPU a disposizione.
  • Auto Gordian Knot (versione 2.55) : software utile per effettuare backup di DVD o comunque operazioni di transcodifica video nei formati DivX ed XviD. Per le nostre prove utilizziamo il codec XviD che il tool installa di default ed eseguiamo il ripping di un completo DVD (Codice Swordfish) che per l’occasione abbiamo memorizzato su un disco fisso e lo "comprimiamo" in modo da farlo entrare su due CD.
  • Handbrake (versione 0.9.4) : un software di transcodifica video open-source multipiattaforma e multithreaded con il quale effettuiamo una conversione video di un intero DVD (Codice Swordfish) in formato adatto per i dispositivi Apple iPod, iPhone e iPad.
  • DaCapo (versione 9.12) : questa suite di benchmark permette di valutare il comportamento del sistema quando si utilizzano tool di sviluppo per Java. Esso include tutta una serie di applicazioni reali open source fra cui Tomcat, FOP, Eclipse, Batik, Xalan e altri. Nel nostro caso riportiamo il tempo complessivo necessario all’esecuzione di tutti i test.

Partiamo da alcuni test sintetici utili a comprendere il livello di prestazioni di cache e unità di calcolo x86.


SiSoft SANDRA: CPU test

Secondo quanto mostrato dai benchmark whetston e dhrystone del SiSoft SANDRA, la nuova CPU AMD FX-8150 va a posizionarsi nella parte alta della classifica a metà strada Core i7-2600k e Core i5-2500k. Queste ultime due CPU differiscono per la modalità Hyper Threading,  attivata la prima, disattivata la seconda: questo ci fa pensare che l’approccio di Intel verso il multi threading "simulato" sia superiore rispetto a quello di AMD.


SiSoft SANDRA: multimedia test

I benchmark sulle multimediali mostrano esattamente quello che l’architettura Bulldozer è in grado di fare. Quando ad essere stressata è la FPU della (test double e floating point), la CPU FX-8150 non riesce a battere il Core i7-2600k. Al contrario, nell’esecuzione di operazioni su interi il nuovo prodotto di casa AMD rifila un 25% circa alla soluzione rivale.


SiSoft SANDRA: banda dati intercore


SiSoft SANDRA: latenze intercore (a valori inferiori corrispondono prestazioni migliori)

Se con questa CPU AMD voleva incrementare la banda dati fra core dobbiamo ammettere che ci è riuscita in maniera egregia. Pur non riuscendo a raggiungere i valori di CPU Intel top di gamma come il Core i7 980X, l’FX-8150 è enormemente avvantaggiato rispetto ai Phenom II di precedente generazione. I numeri rilevati mostrano un certo vantaggio anche rispetto alle CPU Sandy Bridge che però mostrano una latenza inferiore.


Cache

La spiegazione di quanto appena detto la si trova nei cicli di latenza delle cache: mentre per la cache L1 i valori sono simili a quelli delle CPU rivali e appena superiori a quelli dei Phenom II, lo stesso non può dirsi per le cache L2 ed L3. In questi ultimi due casi hanno influito di certo la dimensione delle cache e l’architettura del chip che ora prevede non solo un’organizzazione fra core ma un secondo raggruppamento in moduli (i dati devono essere smistati prima sui moduli e poi sui core, dunque una maggiore latenza è lecito attendersela).


Science Mark – Banda dati memoria

La banda dati rilevata per le memorie è decisamente elevata ma non agli stessi livelli di quella delle CPU Sandy Bridge. Eppure la piattaforma AMD ha il vantaggio di utilizzare moduli DDR3-1866 contro quelli DDR3-1333 delle rivali. Spostiamo ora la nostra attenzione verso gli ambiti del calcolo intensivo che richiedono notevole potenza alla CPU. Primordia e Molecular Dynamics sono due benchmark tratti da Science Mark che permettono di misurare le performance della CPU con calcoli scientifici. Essi non sono ottimizzati per ambienti multi core, dunque sono utili a controllare sia le prestazioni single-core che l’efficacia delle eventuali tecnologie Turbo di Intel ed AMD.


Primordia (a valori inferiori corrispondono prestazioni migliori)

Purtroppo dal test Primordia emerge come ci sia qualche problema prestazionale per le CPU AMD FX-8150: ben 77 secondi impiegati per completarlo rappresentano il peggior valore della classifica, al di sotto persino di Phenom II X3 720 o dell’APU A8-3850. La spiegazione di un simile comportamento va probabilmente cercata nella gestione delle risorse condivise fra i core del singolo modulo.


Molecular Dynamics (a valori inferiori corrispondono prestazioni migliori)

Ovviamente le cose non cambiano passando al benchmark Molecular Dynamics . Risultati davvero pessimi!


Fritz Chess Benchmark

Fritz Chess è un engine di simulazione del gioco degli scacchi ed è in grado di sfruttare al massimo ambienti multi-threaded (fino a 8 CPU). Viste le premesse ci saremmo attesi, per l’FX-8150, numeri da prima posizione ed invece il Core i7-2600k di casa Intel riesce a batterlo. Nuovamente ci chiediamo come Hyper Threading possa essere superiore ad una architettura dotata di 8 core fisici.


Crittografia

Tra luci ed ombre, il nuovo FX-8150 continua a mostrare due facce. Come sappiamo AMD ha integrato un modulo per l’accelerazione della crittografia mediante algoritmo AES il quale è in grado di accelerare notevolmente tali operazioni ma non in maniera così efficiente come accade per lo stesso modulo che Intel ha integrato in Sandy Bridge. Quando invece tale accelerazione non può essere utilizzata, come nel caso di algoritmi SHA, la nuova CPU di casa AMD riesce ad essere ben più veloce di tutte le rivali Intel.


Crittografia: Truecrypt

Scendendo nel dettaglio della crittografia con Truecrypt, continuiamo a notare quanto già espresso con il SiSoft SANDRA: buone prestazioni per il modulo di accelerazione AES ma sufficienti per l’FX-8150 solo a posizionarsi fra Core i5-2500k e Core i7-2600k. Le prestazioni rilevate con altri algoritmi, pur inferiori in senso assoluto, dicono invece che la presenza di 8 core fisici si fa sentire per davvero. I software di rendering sfruttano sia le risorse grafiche che quelle di CPU, pertanto risultano un ottimo metodo di misurazione delle loro prestazioni. Prendiamo in considerazione, nel nostro batch di prove, PovRay e Cinebench 10.


Povray (a valori inferiori corrispondono prestazioni migliori)

Purtroppo per la nuova CPU AMD, la versione stabile 3.6 di Povray sfrutta poco gli ambienti multi-core. Questo fa si che i tempi necessari all’FX-8150 per eseguire il rendering della scena di test siano superiori a quelli delle soluzioni rivali, superiori persino rispetto a quelli di un Phenom II X6 1090T o di un Phenom II X4 980.


Cinebench 10

In Cinebench 10 rileviamo per la CPU AMD FX-8150 prestazioni massime vicine a quelle di un Core i5-2500k: questa è una cosa che stupisce molto visto che il 2500k non è dotato di tecnologia Hyper Threading. Dunque è come dire che le prestazioni di una CPU a 8 core, che questo benchmark dovrebbe sfruttare a dovere, sono simili a quelle di una CPU a 4 core. In questo caso abbiamo però conferma che il problema non è nell’implementazione multi-core di Bulldozer, bensì nelle prestazioni garantite dal singolo core: i 4000 punti circa ottenuti in modalità “single CPU” sono ben al di sotto dei 6000 punti circa ottenuti dalle rivali Sandy Bridge.


Fattore di moltiplicazione dovuto ad ambienti multicore

Cerchiamo di capire meglio la situazione guardando al fattore di moltiplicazione che esiste fra il valore di Cinebench 10 ottenuto in modalità single CPU e quello ottenuto in modalità multiple CPU. Come si vede dal grafico, e come è lecito attendersi, l’FX-8150 è la migliore fra tutte le CPU esaminate (tolti il sistema Intel a doppia Core 2 Quad e la CPU i7 980X a sei core) garantendo un moltiplicatore superiore a 5x.


7-zip: benchmark integrato

7-zip sfrutta a dovere la potenza delle CPU multi core e questo permette alla CPU AMD FX-8150, finalmente e senza ombra di dubbio, di battere le rivali Intel basate su architettura Sandy Bridge. Potremmo prendere in considerazione anche il Core i7 980X ma solo dal punto di vista tecnologico (il prezzo di questa soluzione è decisamente superiore a quello delle CPU Zambezi): esso dispone di sei core fisici e può gestire fino a 12 thread, situazione notevolmente favorevole con il benchmark suddetto. >>> I software di codifica video permettono di stressare notevolmente i sottosistemi CPU e memorie, dunque niente di meglio per valutare le performance dei diversi processori.


XMPEG (a valori inferiori corrispondono prestazioni migliori)

Il tempo necessario alla CPU AMD FX-8150 per svolgere un’operazione di transcodifica video con il software XMPEG è eccellente, il migliore sinora disponibile nei nostri archivi, tanto da limare tre secondi al tempo impiegato dal Core i7-2600k, precedente top performer.


AGK (a valori inferiori corrispondono prestazioni migliori)

Nella transcodifica video con Auto Gordian Knot i risultati visti in precedenza vengono leggermente ridimensionati ma comunque il nuovo FX-8150 continua a garantire prestazioni interessanti.


Handbrake (a valori inferiori corrispondono prestazioni migliori)

Quanto visto sinora è ulteriormente confermato dalle operazioni di conversione di un intero DVD (Codice Swordfish) in un formato digeribile da Apple iPod effettuate con il software Handbrake. I numeri dell’FX-8150 risultano essere molto vicini a quelli del Core i7-2600k. Abbiamo utilizzato alcuni giochi 3D per capire quanta potenza queste CPU riescano a fornire alla scheda grafica. I test sono stati effettuati con impostazioni di qualità e risoluzioni tali per cui la scheda grafica non faccia da collo di bottiglia.


3DMark06

Il punteggio ottenuto con il 3DMark06 pone l’FX-8150 leggermente al di sotto del Core i5-2500k, sia per quel che concerne il valore specifico per la CPU che relativo all’indice.


Call of Juarez

Davvero buona invece la spinta garantita al gioco Call of Juarez ove la piattaforma basata su FX-8150 riesce a battere quella con le due CPU Sandy Bridge.


World in Conflict

Anche se non al pari di quanto visto con Call of Juarez, i numeri garantiti dalla nuova CPU AMD in World in Conflict restano su buoni livelli. > Quando si ha a che fare con processori multi core è bene osservare il comportamento del sistema con più applicazioni attive allo stesso tempo . Quelli che seguono sono i risultati di alcuni test eseguiti contemporaneamente.


7-zip e Cinebench eseguiti contemporaneamente

L’esecuzione contemporanea di 7-zip e Cinebench porta la CPU FX-8150 ad ottenere un punteggio vicino a quello del Core i7-2600k, sicuramente molto superiore a quello del Core i5-2500k. In tal caso le ottimizzazioni mirate al multithreading sia di Intel che di AMD si fanno sentire eccome!


Povray e Mainconcept (inferiore è meglio)

Ben diverso è il caso di esecuzione contemporanea di Povray (rendering) e Mainconcept (transcodifica video): evidentemente le CPU AMD non digeriscono bene questi software, tanto da lasciare un enorme spazio alle soluzioni rivali. L’FX-8150 deve accontentarsi, in questo caso, di una posizione al di sotto di quella dei fratelli Phenom II X4 980 e Phenom II X6 1090T. Ogni volta che viene presentata una nuova CPU, i produttori indicano sempre un valore di IPC (Istruzioni Per Ciclo) preciso o approssimativo. In questo caso AMD ha completamente dimenticato di parlarne o forse lo ha fatto volutamente. Da tutti i test che abbiamo effettuato è emerso un fil rouge che li collega un po’ tutti: buone prestazioni quando si parla di multi threading, numeri abbastanza scarsi quando l’applicativo è single threaded.

Questo può significare solo una cosa: le prestazioni offerte dal singolo core non sono assolutamente all’altezza di quanto ci si aspettava o comunque non all’altezza della concorrenza e delle CPU di precedente generazione. Per verificare questo assunto abbiamo impostato, nel bios della scheda madre, un funzionamento a singolo core per la CPU in esame. Abbiamo inoltre disattivato il Turbo, impostato frequenze di funzionamento fisse per la CPU a 3,6GHz e per le memorie a 1333MHz. Abbiamo poi confrontato i risultati ottenuti con quelli di un Phenom II funzionante esattamente nelle stesse condizioni sopra descritte.


Potenza del singolo core

Dalla tabella emerge chiaramente che le prestazioni del singolo core Deneb (Phenom II) sono decisamente superiori rispetto a quelle del singolo core Bulldozer. L’IPC di Bulldozer è dunque inferiore rispetto alle CPU di precedente generazione della stessa AMD, probabilmente a causa della condivisione delle risorse e dell’architettura delle nuove cache. I consumi del sistema sono stati valutati misurando l’assorbimento sulla presa di corrente ed effettuando rilevazioni in IDLE (con Cool&Quiet attivo) e sotto sforzo (CPU Stability Test). I valori riportati in tabella tengono conto anche di un fattore di correzione relativo all’alimentatore utilizzato:

  • Il valore registrato va considerato solo in termini comparativi in quanto include anche l’inefficienza dell’alimentatore;
  • L’inefficienza dell’alimentatore non è lineare ma segue una curva che tenderebbe a penalizzare i consumi ridotti (l’efficienza è generalmente maggiore quando il carico sull’alimentatore aumenta). Per questo abbiamo applicato una correzione percentuale ai risultati utile a rendere idealmente lineare la curva di inefficienza.


Consumi con sistema in IDLE (inferiore è meglio)

I consumi in IDLE della piattaforma AMD con processore FX-8150 sono superiori a quelli della piattaforma Intel con CPU Core di seconda generazione; sono invece paragonabili a quelli relativi alle piattaforme Intel socket LGA 1366 o a quelle Phenom II di fascia alta.


Consumi con sistema sotto stress (inferiore è meglio)

Nel momento in cui imponiamo un pensate carico alla CPU, i consumi della nuova piattaforma AMD schizzano in alto superando quelli di qualunque altro sistema provato, persino di quelli del Core i7 980X.


Consumi massimi

Per indagare meglio sui consumi della nuova piattaforma AMD, abbiamo realizzato una sessione di test con WPrime imponendo il massimo carico a CPU e memorie di sistema. I risultati sono visibili in tabella e dicono nuovamente che la piattaforma AMD FX è davvero poco ottimizzata in tal senso. > Uno dei principali motivi per cui AMD invita ad acquistare una CPU della famiglia FX è quello legato alle sue potenzialità di overclock. Come già detto tutti i modelli della nuova serie hanno un moltiplicatore sbloccato ed impostabile in un range, almeno per il modello FX-8150, che va da 4x a 39,5x: con la frequenza di bus di default impostata a 200x significa poter salire teoricamente fino a 7,9GHz.

Ma quanto si riesce davvero a spingere questa nuova CPU? Abbiamo a tal proposito eseguito alcuni test di overclocking sulla nostra piattaforma, utilizzando un sistema di dissipazione ad aria molto potente (Noctua NH-D14 a doppia torre e doppia ventola). Abbiamo disattivato la modalità Turbo e agito su tensioni di funzionamento e moltiplicatore.


Tensione di funzionamento di default

Con la tensione di funzionamento di default, siamo riusciti a portare la CPU fino alla frequenza di 4700 MHz circa, impostando un moltiplicatore di 23,5x.


Tensione di funzionamento pari a 1,45V

Per poter andare oltre siamo stati costretti ad aumentare la tensione di funzionamento fino a 1,45V. Così facendo siamo riusciti a raggiungere i 5GHz con moltiplicatore pari a 25x.


Tensione di funzionamento pari a 1,5V

Ancora un piccolo incremento di tensione, fino a 1,5V, ed ecco superati i 5,1GHz. Un risultato tutto sommato interessante visto che è stato ottenuto con raffreddamento ad aria. Quando AMD stava progettando le nuove CPU Zambezi con architettura Bulldozer probabilmente stava pensando ad una serie di CPU rivali che non rispondeva al nome di Sandy Bridge. Secondo i piani iniziali di AMD, le soluzioni che solo oggi sono state annunciate avrebbero dovuto debuttare almeno un anno prima e trovare sulla propria strada le CPU Core di prima generazione.

Oggi le cose sono decisamente differenti: AMD trova sul suo cammino non solo Sandy Bridge ma svela le sue prime CPU Bulldozer poco prima dell’arrivo della nuova piattaforma high-end firmata Intel. Pur non volendo prendere in considerazione queste ultime, lo svantaggio temporale accumulato si ripercuote in uno svantaggio anche sulle prestazioni.

Dalla CPU FX-8150 ci saremmo attesi prestazioni decisamente superiori per quel che concerne i numeri di applicazioni legacy o lightly threaded. Molto meglio il comportamento nel caso di applicazioni pesantemente ottimizzate per il multi-threading ma anche in questo caso a Sunnyvale devono riuscire a fare di più. D’altro canto il marketing di AMD dipinge le CPU FX-Series come le prime soluzioni a 8 core per desktop. Forse sarebbe stato meglio definirle come CPU quad-core fortemente ottimizzate, definizione che calza perfettamente con quella ingegneristica dell’architettura Bulldozer. Vista sotto questa diversa luce, le prestazioni del singolo core sarebbero potute essere correttamente paragonate a quelle del singolo modulo Bulldozer.

Fatte salve le considerazioni basate puramente sulle sensazioni, le prestazioni rilevate dicono che in media tale CPU va a posizionarsi fra un Core i5-2500k ed un Core i7-2600k. I consumi purtroppo restano ancora molto alti mentre le potenzialità di overclocking possono essere considerate buone, al pari di quelle offerte dalle CPU Sandy Bridge (almeno considerando sistemi di dissipazione non estremi).

Conscia di questa situazione e considerando che oggi le due CPU Sandy Bridge poco sopra indicate vengono vendute sul mercato a prezzi di 190 euro e 260 euro circa, AMD ha imposto dei prezzi che possono essere coerenti:

  • FX-8150: 239-249 euro
  • FX-8120: 199-209 euro
  • FX-6100: 159-169 euro
  • FX-4100: 109-119 euro


Costi intera piattaforma

In aggiunta è corretto considerare anche il costo dell’intera piattaforma, non solo quello della CPU, ed anche in questo caso AMD è in vantaggio rispetto alle proposte Intel.

Riassumendo abbiamo visto nelle CPU AMD FX la possibilità di diventare soluzioni interessanti per il prezzo a cui sono proposte, certo non in grado di competere a viso aperto con le soluzioni della rivale che dispone di un portfolio più ampio spalmato su un range di prezzo altrettanto ampio. AMD si concentra invece su una fascia che va da poche decine di euro fino a 240 euro circa, non riuscendo ormai da anni a fornire soluzioni che possano aggredire fasce di mercato superiori. Da Bulldozer ci saremmo aspettati invece questa possibilità: un vero ritorno al marchio FX.

A cura di Dino Fratelli >>

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
12 ott 2011
Link copiato negli appunti