PI Hardware/ AMD Llano si infila nei desktop

PI Hardware/ AMD Llano si infila nei desktop

Oggi AMD annuncia le APU Llano A-series e le propone come la soluzione definitiva per PC con grafica integrata. I nostri test svelano che è davvero possibile giocarci
Oggi AMD annuncia le APU Llano A-series e le propone come la soluzione definitiva per PC con grafica integrata. I nostri test svelano che è davvero possibile giocarci

Su una cosa ormai si è tutti d’accordo: l’utilizzo dei computer è radicalmente mutato nel corso degli ultimi anni grazie e soprattutto alla Rete ed alla disponibilità di sistemi digitali per l’acquisizione delle informazioni. I computer che prima venivano principalmente utilizzati con applicazioni business (fogli di calcolo, database, word processing e così via) oggi devono supportare l’utente che vuole vedere video e foto, giocare e divertirsi “in full HD” e poi condividere le proprie esperienze con amici e conoscenti. Il focus si sposta dunque dalle performance delle CPU x86, vero cruccio del primo ventennio del computing, a quelle delle GPU che hanno saputo conquistarsi una fetta importante della scena negli ultimi 10 anni.

I processori moderni sono tutti in grado gestire in maniera efficace il carico di lavoro tipico di una CPU x86, che nel corso degli anni non è cambiato molto. Gestire fogli di calcolo o programmi di videoscrittura risulta cosa agevole per qualunque processore di nuova generazione, dunque difficilmente l’utente medio si accorgerà, nel suo quotidiano, di quanto possa essere migliore un modello rispetto all’altro.

Intel ed AMD sono consci di questo trend che continua nella sua evoluzione e cercano di proporre soluzioni efficaci che siano in grado di gestire l’enorme flusso di dati, le operazioni di conversione e la visualizzazione di contenuti su schermi in alta definizione. All’inizio dell’anno il produttore di Santa Clara ha concretizzato la sua visione di questo mercato dando alla luce i processori Core di seconda generazione, nome in codice “Sandy Bridge”. All’interno di questi processori, grazie all’elevato grado di integrazione raggiunto, sono stati sistemati non solo più core CPU ma anche controller delle memorie, sistema di cache multi-livello, controller PCI Express e dulcis in fundo , un chip grafico vero e proprio.

AMD sta lavorando al progetto Fusion , sotto il quale sono raccolti i processori di nuova generazione, ormai da diversi anni. Dopo l’acquisizione di ATI Technologies, avvenuta nel 2006, il produttore americano ha cominciato a condividere i suoi piani di integrazione fra CPU e GPU i quali avrebbero dovuto portare alla commercializzazione della prima APU (Accelerated Processing Unit) già nel 2009 e poi proseguire nella direzione di un sempre maggior livello di integrazione. Invece quella che può essere definita la prima piattaforma Fusion di AMD, Brazos , è arrivata solo alla fine del 2010 sotto forma di una soluzione entry level dedicata a prodotti netbook e nettop.


L’idea dietro Llano

Oggi AMD fa un ulteriore passo avanti nel completamento di un quadro di risposte alle mutate esigenze degli utenti e alle soluzioni concorrenti di casa Intel. Le APU A-Series includono fino a 4 core della famiglia “Stars” realizzati a 32nm ed un chip grafico Radeon “Sumo” dotato di un massimo di 400 shader processor : su questo modulo AMD punta molto, affermando che sia in grado di raggiungere un livello di prestazioni superiore a quello di schede grafiche discrete di fascia bassa e propone la stessa architettura, differenziandola sul TDP, sia per piattaforme desktop che notebook.

Seppure Llano e Sandy Bridge condividano scelte architetturali simili, il peso che AMD da una parte ed Intel dall’altra hanno assegnato ai singoli componenti interni dei rispettivi processori varia notevolmente. Analizzeremo tutto questo in dettaglio nelle prossime pagine. Il paragone che viene subito in mente guardando le nuove APU A-Series di AMD è con le CPU Intel Sandy Bridge: se da una parte questo potrebbe risultare corretto, dall’altra occorre considerare la fascia di prezzo alla quale l’azienda propone i processori con nome in codice Llano. Il modello top di gamma delle CPU Intel Core di seconda generazione costa oltre 300 dollari; per contro AMD propone la APU A8-3850, anche in questo caso modello di punta della nuova serie, a 135 dollari circa. Il paragone corretto è da effettuare dunque con i modelli della famiglia Sandy Bridge Core i3 che prevedono prezzi compresi fra 120 e 140 dollari .

Ciononostante, dal punto di vista squisitamente architetturale, possiamo effettuare un confronto paritario fra Llano e Sandy Bridge. Llano rappresenta la prima proposta di AMD realizzata con processo produttivo a 32nm SOI (viene prodotto nelle fabbriche di GlobalFoundries) che integra fino a 1,45 miliardi di transistor.


Llano vs. Sandy Bridge

Dalla tabella delle specifiche non si apprezzano molto le differenze fra l’una e l’altra architettura: tentiamo perciò di valutare ogni singolo punto per capire quali potranno essere le conseguenze in termini di prestazioni.

  • Il numero di transistor utilizzati da Llano è circa del 50 percento superiore a quello delle CPU Sandy Bridge: questo ha comportato un serio lavoro da parte di AMD per cercare di mantenere il TDP su livelli accettabili. Tecniche di power gating , grazie alle quali sezioni o intere parti della APU si possono spegnere se non utilizzate, sono state applicate in maniera estensiva. Il processo produttivo a 32nm e la tecnologia Turbo (solo nei modelli con TDP di 65W) aiutano a migliorare ulteriormente il quadro generale.
  • Il sistema delle cache nelle APU Llano prevede solo due livelli contro i tre di Sandy Bridge, ma ogni core dispone di un maggior quantitativo di cache L1 e cache L2. Questa scelta presenta vantaggi e svantaggi: cache di dimensioni maggiori sono utili a contenere un maggior quantitativo di dati mentre quelle più piccole sono più veloci. L’utilizzo di un terzo livello di cache condiviso, mancante nelle APU Llano, permette la comunicazione e lo scambio dati fra core all’interno del chip: nel caso delle CPU Intel Core di seconda generazione, la cache L3 garantisce anche la comunicazione fra CPU e chip grafico.
  • Tecnologia HyperThreading: le CPU Sandy Bridge sono in grado di gestire fino a 2 thread per ogni core fisico, mentre le soluzioni AMD devono accontentarsi della classica formula “1 core = 1 thread” .
  • Controller delle memorie compatibile con moduli DDR3-1866 . Le APU AMD Llano sono in grado di gestire moduli di memoria DDR3 fino alla frequenza di 1866 MHz anche se questo è possibile solo se si installa un unico modulo per canale. La maggiore banda delle memorie, rispetto a Sandy Bridge che supporta ufficialmente moduli DDR3-1333, è necessaria a Llano per sopperire alla mancanza di un livello di cache condiviso. Siamo certi, e lo verificheremo nel corso dell’articolo, che Llano sia molto più sensibile di Sandy Bridge al variare della frequenza di funzionamento delle memorie.
  • Controller grafico : differenze sostanziali negli approcci di AMD ed Intel sul core grafico. La prima propone quanto di meglio disponibile oggi sul mercato garantendo il supporto alle API DirectX 11, OpenGL 4.1 e DirectCompute oltre al modulo UVD3 per il supporto alla decodifica di contenuti video HD. La seconda, pur avendo fatto passi da gigante rispetto a quanto forniva in passato, è ancora ferma alle applicazioni DirectX 10.1 e OpenGL 3.0.

Ove Intel ed AMD hanno maggiormente investito risulta ora abbastanza chiaro. Una slide potrebbe però rendere la questione ancor più lampante:


Distribuzione dei componenti nelle CPU AMD e Intel

Nelle CPU Sandy Bridge, oltre il 50 percento della superficie del die è occupato dai componenti x86 e dalle cache mentre al core grafico spetta un 20 percento circa. Nelle APU AMD Llano la situazione è ribaltata in favore del componente grafico: i core x86 e le cache occupano circa il 30 percento; un ulteriore 30 percento è necessario ai componenti del northbridge ed il 40 percento è assegnato alla GPU.


Il diagramma a blocchi di Llano

I modelli di APU Llano per desktop resi disponibili nella giornata di oggi sono 4, tutti con architettura quad-core ma differenziati per TDP (100W o 65W), presenza o meno della tecnologia Turbo e per chip grafico (HD 6550D oppure HD 6530D). Nella tabella seguente abbiamo messo assieme le nuove APU con alcune CPU AMD di precedente generazione ed una serie di modelli Intel di attuale e precedente generazione.


CPU

Esternamente i processori A-Series si presentano identici, o quasi, ai loro predecessori Athlon e Phenom con il grosso plate metallico a coprire il die e garantire un contatto ottimale con il dissipatore. Le sigle che leggiamo ci dicono che si tratta di una APU della serie A8-3800 la cui caratterizzazione la troviamo a seguire (AD3850WNZ43GX).


AMD A8-3850

Un rapido confronto relativo alla parte posteriore con le CPU Phenom II socket AM3 rivela una maggiore densità dei pin di Llano che prevede un rettangolo centrale libero da connessioni ma con alcuni piccoli componenti SMD.


Llano (a sinistra) vs. Phenom II (a destra)

Il “modulo” CPU delle APU Llano è composto da 4 core della serie Stars e 4MB di cache L2 (esistono anche modelli mobile con due soli core). L’architettura del singolo core prevede alcuni piccoli miglioramenti che permettono di incrementare l’IPC (Instruction Per Cycle) del 6 percento circa rispetto alle soluzioni di precedente generazione utilizzate per realizzare le CPU Athlon II e Phenom II a 45nm.


Diagramma a blocchi core Stars

Le maggiori prestazioni sono state ottenute essenzialmente grazie ad una cache L2 più ampia, moduli di hardware prefetch migliorati e buffer di reorder e load/store più ampi. Nei modelli in cui è supportata, è disponibile anche la tecnologia AMD Turbo CORE che garantisce prestazioni superiori con consumi ridotti.

Pur apprezzando l’impegno di AMD nel cercare di ottimizzare la CPU e comprendendo le ragioni addotte in precedenza, occorre considerare che il miglioramento delle prestazioni paventato si riferisce ad un’architettura nata ben 4 anni fa e aggiornata solo marginalmente due anni dopo. Quindi, se questi saranno i numeri che verificheremo, l’architettura CPU di Llano offre prestazioni solo comparabili a quelle dell’architettura Phenom del 2007.

La rivale Intel, nello stesso periodo di tempo, è riuscita a raddoppiare le performance delle sue CPU. Per vedere novità interessanti in tal senso da parte di AMD forse si dovrà aspettare Bulldozer.


Controller delle memorie

AMD è stata la prima ad integrare il controller delle memorie all’interno delle sue CPU. La tradizione continua anche con Llano che prevede un controller compatibile con memorie DDR3 fino alla massima frequenza di 1866MHz (la condizione necessaria è che sia installato non più di un modulo per singolo canale). In queste condizioni la banda dati disponibile sul controller è pari a 29,8GB/s e questa potrebbe essere sfruttata anche interamente dal core grafico integrato il cui canale di collegamento con il Northbridge pare sia in grado di supportare una banda dati anche doppia (probabilmente utile per aggiornamenti futuri).

In aggiunta AMD ha creato un sistema di gestione dinamica della priorità della banda di memoria condivisa fra CPU e GPU. Visto che gli applicativi attuali difficilmente (o meglio quasi mai) sfruttano contemporaneamente le risorse di tutti e quattro i core x86 e del chip grafico, dare una priorità all’uno o all’altro componente è certamente cosa buona e giusta . AMD considera di importanza fondamentale il controller grafico integrato nei moderni processori e per questo tutto quello che non è stato possibile fare sulla CPU è stato invece fatto sulla GPU. A nostro avviso sul piatto della bilancia ci sono diversi aspetti da considerare che includono anche quelli legati alle applicazioni GPGPU: se queste in futuro dovessero trovare terreno fertile, allora sì che sarebbe interessante giocare sul peso delle componenti CPU e GPU disponibili all’interno di un chip.

Attualmente queste applicazioni sono però relegate solo alla risoluzione di compiti specifici o utilizzate solo in ambiti di ricerca. Crediamo perciò sia ancora troppo presto per basare i nostri ragionamenti su simili aspetti, poco vicini a come l’utente medio utilizza il proprio PC. Diverso è il discorso del supporto che una APU come Llano potrebbe fornire ai casual gamer , a chi vuole divertirsi con il proprio PC e a chi necessita di un sistema completo, che consumi poco e che sia in grado di soddisfare ogni esigenza “general purpose”.

All’epoca del rilascio di Sandy Bridge affermammo che Intel fosse riuscita già in questi intenti anche se dal punto di vista del supporto del gaming entry level c’era ancora di che migliorare. Probabilmente con Llano sarà aggiunta questa ulteriore tessera ad un complesso mosaico. Prima di scoprirlo, però, analizziamo da vicino l’architettura della GPU.


Diagramma a blocchi di Sumo

L’architettura del chip grafico assomiglia a qualcosa di molto familiare: Sumo , questo il suo nome in codice, è a tutti gli effetti una versione rivista e corretta del progetto Redwood utilizzato per la realizzazione di schede grafiche discrete come le Radeon HD 5570 e 5670.

Partendo da Redwood, AMD ha apportato delle modifiche, alcune delle quali necessarie per far sì che il chip possa dialogare non con un proprio controller delle memorie bensì con il Northbridge e possa rispondere a più stringenti requisiti di risparmio energetico attraverso l’utilizzo di una tecnica di power gating . In questa riorganizzazione AMD ha introdotto il modulo UVD 3 (in Redwood è disponibile il modulo UVD di seconda generazione) e realizzato il chip a 32nm.


Diagramma a blocchi di Redwood

Sumo utilizza una architettura unificata di tipo TeraScale 2 VLIW 5 con pieno supporto per le applicazioni DirectX 11, comprese le funzioni di tessellation, Shader Model 5.0 e DirectCompute, per le API OpenGL 4.1, per l’anti-aliasing (24x MSAA, SSAA ed MLAA) ed il texture filtering (filtro anisotropico 16x angle-independent), per AMD APP e per OpenCL 1.1.


Chip grafici

Quello che emerge in maniera netta è che il chip grafico integrato nelle APU Llano è una vera e propria GPU, non un prodotto realizzato appositamente che deve sottostare a numerosi compromessi. Le feature sono esattamente quelle di una tradizionale scheda grafica AMD Radeon di fascia bassa mentre l’architettura poco si discosta da quella di Redwood delle VGA Radeon 5570 e 5670 (basta guardare al numero di Texture Unit, ROPs e Shader Processor). L’unica vera differenza è nella banda di memoria: l’utilizzo di chip GDDR3 o GDDR5 a bordo della scheda offre una banda decisamente superiore a qualunque soluzione possa essere implementata tramite condivisione della memoria di sistema.

I quasi 30GB/s teorici forniti da memorie DDR3-1866 sono pari a circa la metà di quanto disponibile con una VGA discreta basata su Redwood con memorie DDR3: e se gli ingegneri di AMD avevano fatto un buon lavoro con tali VGA appare chiaro che il vero collo di bottiglia di Sumo è da individuare proprio nella banda di memoria, specie se si utilizzano normali moduli DDR3-1333. Da quanto detto in precedenza, se si riesce a migliorare questo aspetto ci si deve attendere un netto miglioramento delle prestazioni.

Llano offre però un piccolo vantaggio rispetto alle GPU discrete, vantaggio che può diventare importante quando la quantità di dati da copiare è elevata: il chip grafico può accedere direttamente alla memoria unificata tra CPU e GPU evitando così la necessità di copiare le texture delle mappe dalla memoria virtuale di Windows, dove sono state generate, nella RAM e poi nella memoria video attraverso il bus PCI Express. La tecnica “Zero Copy”, che è possibile utilizzare perché CPU e GPU condividono l’accesso alla stessa memoria, permette di aggiornare solo i puntatori senza dover copiare il contenuto.


Chip grafici integrati

Il confronto con i chip grafici integrati Intel di attuale e precedente generazione è davvero impietoso. Sumo mette sul piatto qualcosa come 400 unità di calcolo, quasi 40 volte quelle utilizzate da Intel (il confronto in realtà non potrebbe essere fatto tout court per via della differente architettura) e numerose unità per la gestione delle texture e dei pixel, supporto esteso per tutte le feature di ultima generazione e via discorrendo.

Il modulo UVD, aggiornato alla versione 3.0, comporta il supporto alla decodifica di file MPEG-4 Part 2 come quelli DivX ed XviD oltre a quelli MPEG-2, MVC, VC-1 e H.264. Supporto pieno anche per stream in alta definizione Blu-ray 3D, possibile anche grazie all’adozione di una porta HDMI 1.4a. L’efficienza del modulo UVD 3, rispetto all’UVD 2.0, si concretizza nella possibilità di riprodurre flussi video usando solo i suoi moduli hardware fixed function , anziché gli shader della GPU, e consumando molto meno. Come accade per l’intero chip grafico, il modulo UVD 3 può essere completamente spento quando non utilizzato grazie alla sua capacità di power gating .


Il modulo UVD 3.0

Lynx è la piattaforma che AMD ha progettato per i sistemi desktop che faranno uso di Llano. Il nome ricorda il vecchio browser che agli albori di Internet permetteva di navigare in maniera testuale fra i pochi siti web allora disponibili, prevalentemente fra le BBS.

Dopo diversi anni di gestione della compatibilità fra piattaforme diverse, passando dai socket AM2 a quelli AM3+, con Llano AMD effettua una forte virata utilizzando un socket non compatibile con quelli passati e seguendo la linea tracciata da Intel nella differenziazione fra piattaforme. Non più un solo socket sul quale installare tutti i tipi di processore, ma uno per ogni fascia:

  • Fascia bassa : piattaforma Brazos (Zacate e Ontario) con socket BGA-413
  • Fascia media : piattaforma Lynx (Llano) con socket FM1 (937-pin)
  • Fascia alta : Bulldozer su Socket AM3+ (non ancora annunciata)


Struttura della piattaforma Lynx

La piattaforma Lynx prevede un chip FCH o Fusion Controller Hub che nella fattispecie è indicato dalle sigle A55 FCH oppure A75 FCH a seconda del modello.


Caratteristiche chip FCH

AMD vuole imporre la propria superiorità anche nel campo dei chipset integrando il supporto a tutte le nuove tecnologie in fatto di comunicazione anche se i due chip A55 ed A75 differiscono proprio per queste caratteristiche distintive. Il primo assomiglia a qualcosa di più datato e sarà probabilmente utilizzato dai produttori di schede madri per realizzare prodotti low-cost destinati a sistemi molto economici. Il secondo, AMD A75, mostra invece tutta la sua forza innovativa garantendo il supporto nativo per ben 6 connessioni Serial ATA 3.0 (chi dispone di periferiche SATA 2.0 non deve preoccuparsi in quanto lo standard SATA 3.0 è retrocompatibile), porte eSATA, RAID e porte USB 2.0 e 3.0.

I nuovi chip FCH di AMD perdono, nei confronti dell’ultimo nato in casa Intel, Z68 per la cronaca, solo per alcune feature proprietarie, come SmartResponse che permette di sfruttare un disco SSD come una grossa cache per un disco tradizionale. Da Sunnyvale non hanno ancora tirato fuori nessuna risposta a questa tecnologia… Sempre che ce ne sia la necessità!

Diagramma a blocchi A55 (a sinistra) e A75 (a destra)

Dal diagramma a blocchi dei due chip FCH appare chiaro il funzionamento della piattaforma nella sua interezza. La APU controlla le uscite video, che possono essere di tipo Display Port, HDMI e DVI (un adattatore può eventualmente trasformare quest’ultima in una connessione VGA analogica) e fornisce supporto per due canali di memoria DDR3, una connessione PCI Express 2.0 x16 ed ulteriori 4 connessioni PCI Express 2.0 x1. Una connessione UMI da 2GB/s garantisce lo scambio dati con il chip FCH che, dal canto suo, controlla ulteriori 4 connessioni PCI Express 2.0 x1, le connessioni PCI, l’audio, le porte USB e quelle Serial ATA. La nostra piattaforma di test comprende la APU A8-3850 ed una scheda madre socket FM1 con FHC A75, modello ASRock A75 Pro4 . Questa configurazione è il massimo che oggi può essere preteso per realizzare un sistema basato sui processori AMD A-Series.


La confezione della scheda madre ASRock A75 Pro4

La scheda madre prevede una classica disposizione dei componenti con la zona di sinistra che comprende il socket, gli slot per le memorie, la sezione di alimentazione ed i connettori di uscita e quella di destra ove sono stati integrati i connettori PCI e PCI Express, il chip FCH, le porte e gli header di espansione SATA, USB e Firewire.


La scheda madre di casa ASRock

Il socket FM1, al pari della CPU, prevede un incavo centrale rettangolare e due supporti laterali sui quali può essere agganciato il dissipatore. Per quest’ultimo è possibile pescare “all’interno dello stesso scaffale” di quelli utilizzabili per socket AM2 ed AM3, vista la piena compatibilità del sistema di aggancio.


Socket FM1 e sistema di aggancio del dissipatore

Gli slot per le memorie sono 4 e su di essi possono essere installati fino a 64GB di memoria DDR3. AMD assicura piena compatibilità con moduli DDR3-1866 ma solo se installati uno per singolo canale (solo sui due slot bianchi o sui due slot blu), altrimenti dovrete usare moduli DDR3-1333.


Gli slot per memorie DDR3

La disponibilità di connettori di espansione PCI Express e PCI è buona: la scheda madre ASRock A75 Pro4 ne prevede due PCIe 1x, due PCIe 16x (che possono utilizzare nel complesso solo 16 linee elettriche e dunque funzionare come 16x/0x o 8x/8x) e tre PCI tradizionali.


Connettori SATA, pulsanti e header di espansione

Vicino al chip FCH, raffreddato da un piccolo dissipatore passivo in alluminio, sono stati disposti i connettori Serial ATA 3.0, cinque per la precisione, un doppio display a sette segmenti utile a visualizzare lo stato del sistema, due tasti di servizio per avviare e resettare la scheda madre ed alcuni header per collegare ulteriori porte USB e Firewire.


I connettori di uscita

Il parco connessioni offerto da questa scheda madre include quattro porte USB 3.0, due porte USB 2.0, una porta PS/2 per tastiera o mouse, una porta RJ45 per Gigabit LAN, una porta eSATA, una porta Firewire e poi tre connettori per uscite video DVI, VGA e HDMI, jack audio analogici e SPDIF per audio digitale su fibra ottica. È altresì presente un tasto per le operazioni di reset del bios.


La CPU Llano A8-3850 installata

Il supporto nativo per connessioni USB 3.0 permette ai produttori di schede madri di realizzare prodotti capaci di offrire prestazioni molto elevate. La piattaforma A75 offre una feature molto interessante denominata Superspeed USB 3.0 che, se attivata, garantisce trasferimenti dati molto più veloci rispetto a quello offerto da altre soluzioni concorrenti.


AMD USB 3.0 Superspeed

AMD non è stata molto prodiga di dettagli sul funzionamento di questa tecnologia, ma a nostro avviso essa non fa altro che creare una piccola cache dati da utilizzare durante i trasferimenti. Funziona? Vediamolo con i seguenti test.


File Benchmark: Superspeed OFF

Il test File Benchmark di HD Tune  mostra un andamento che segue una curva crescente direttamente proporzionale fra prestazioni e dimensioni del blocco trasferito.


File Benchmark: Superspeed ON

L’attivazione della modalità Superspeed permette di ottenere un netto vantaggio anche se solo nelle operazioni sui file di piccole dimensioni ed in special modo in quelle di scrittura. Tale miglioramento si traduce in vantaggi pratici visto che sono proprio i file di piccole dimensioni a creare i maggiori problemi nei trasferimenti attraverso USB.


USB 3.0 – Lettura


USB 3.0 – Scrittura

I nostri test rivelano esattamente quanto messo in luce dai test sintetici. I tempi di trasferimento di una grossa cartella da oltre 5GB con notevoli file di piccole dimensioni subiscono miglioramenti molto interessanti usando la modalità Superspeed, tali da garantire alla piattaforma AMD una netta vittoria. Quando nel trasferimento è invece coinvolto un singolo file di grosse dimensioni, il vantaggio non esiste.


USB 2.0 – Lettura


USB 2.0 – Scrittura

Abbiamo provato la stessa tecnologia anche su porte USB 2.0 ed in questo caso il guadagno è ancora superiore ed è riscontrabile sia con file piccoli che con quelli di più grossa dimensione. Per eseguire i test sulle CPU abbiamo rispettato le seguenti regole:

  • Sulla scheda sono stati installati solo i componenti necessari: CPU, Memoria, Scheda video e Hard disk.
  • L’hard disk è stato formattato, sono stati poi installati il sistema operativo, i driver per le periferiche e, quando necessario, sono state installate patch e aggiornamenti.
  • Ogni test è stato ripetuto per tre volte e, se i risultati di qualche test si mostrano troppo lontani dalla media (elevata varianza), il test stesso è stato di nuovo ripetuto, scartando il risultato non corretto.
  • Alla fine di ogni sessione di prova l’hard disk è stato formattato.

In merito ai sistemi di prova, ci siamo serviti di differenti piattaforme a seconda del tipo di CPU. Ciò è stato necessario per ottenere un sistema funzionante per ogni tipo di Socket che le CPU utilizzate per la nostra comparazione utilizzano. Ovviamente si è cercato di realizzare i sistemi con componenti simili, quando possibile, uguali.


Sistemi di prova

I test eseguiti sono descritti qui di seguito:

Benchmark sintetici

  • Fritz Chess Benchmark : questo è un tool che misura la potenza del processore di sistema utilizzando il motore per la creazione di giochi di scacchi “Fritz 9 engine”. Il risultato del test è espresso in nodi per secondo medi. Il software è fortemente ottimizzato per girare in ambienti multicore ed è capace di attivare fino ad 8 thread contemporaneamente.
  • ScienceMark 2.0 : grazie a ScienceMark è possibile misurare le prestazioni del sistema in ambiente di calcolo spinto. Inoltre il software misura le prestazioni della memoria di sistema e della cache integrata nella CPU.
  • SiSoft SANDRA 2010 : questa suite di benchmark sintetici ci offre un quadro specifico delle prestazioni di ogni componente disponibile all’interno della piattaforma di test come memorie, CPU, disco fisso e così via.

Grafica 3D

  • 3DMark06 (versione 1.1.0 Professional) : ci permette di valutare le prestazioni grafiche 3D offerte dal sistema. Nel suo computo sono inclusi, in particolare, la CPU, la memoria di sistema ed il controller grafico.
  • World In Conflict (RTS): si tratta di uno strategico in tempo reale, che unisce a questo tipo di giochi una visuale simile a quella degli sparatutto in prima persona e che fa degli effetti particellari e della fisica le sue armi migliori.
  • Crysis: uno dei più indicativi titoli 3D DirectX 10 per effetti grafici e per l´utilizzo della fisica.

Utilizzo generico

  • PovRay (versione 3.6) : il tool Persistence of Vision Raytracer (PovRay) permette di creare grafica tridimensionale di elevata qualità. Al suo interno troviamo una scena standard creata proprio per effettuare benchmark sulla CPU che sfrutta la maggior parte delle feature disponibili con questo software. Per rendere ripetibili i nostri test utilizziamo sempre le impostazioni di default del file.ini .
  • Cinebench (versione 10 e versione 11) : suite di test multi-piattaforma basato sul software di animazione CINEMA 4D ampiamente utilizzato da studi e case di produzione per la creazione di contenuti 3D. Grazie ad esso possiamo valutare le performance del sottosistema CPU seppure l’influenza di chipset, memorie e scheda grafica installate nel sistema non può essere trascurata. Il software esegue un test di rendering capace di sollecitare uno o tutti i core del processore disponibili.
  • 7-Zip (versione 9.15 beta) : con questo noto software di compressione dati eseguiamo due diversi benchmark. Il primo viene realizzato utilizzando il tool integrato che restituisce una indicazione sui MIPS (million instructions per second) che il sistema è in grado di offrire (potete confrontare i risultati ottenuti con quelli ufficiali e con quelli del vostro sistema). Il secondo invece prende in considerazione una situazione reale nella quale viene richiesto al sistema di comprimere in formato 7z una cartella da 5,36GB contenente 4.379 file di diversa dimensione e tipologia (immagini, testo, html, video, foto, applicazioni) e 536 sottocartelle e poi di decomprimere la stessa. L’operazione di compressione ha una forte dipendenza dalla memoria cache della CPU e dalla memoria RAM installata nel sistema. Quella di estrazione dipende molto, invece, dalla capacità della CPU di gestire le operazioni su interi. In tutti i casi, il software sfrutta abbastanza bene tutte le risorse (core) di CPU a disposizione.
  • Auto Gordian Knot (versione 2.55) : software utile per effettuare backup di DVD o comunque operazioni di transcodifica video nei formati DivX ed XviD. Per le nostre prove utilizziamo il codec XviD che il tool installa di default ed eseguiamo il ripping di un completo DVD (Codice Swordfish) che per l’occasione abbiamo memorizzato su un disco fisso e lo “comprimiamo” in modo da farlo entrare su due CD.
  • Handbrake (versione 0.9.4) : un software di transcodifica video open source multipiattaforma e multithreaded con il quale effettuiamo una conversione video di un intero DVD (Codice Swordfish) in formato adatto per i dispositivi Apple iPod, iPhone e iPad.
  • DaCapo (versione 9.12) : questa suite di benchmark permette di valutare il comportamento del sistema quando si utilizzano tool di sviluppo per Java. Esso include tutta una serie di applicazioni reali open source fra cui Tomcat, FOP, Eclipse, Batik, Xalan e altri. Nel nostro caso riportiamo il tempo complessivo necessario all’esecuzione di tutti i test.

Partiamo da alcuni test sintetici utili a comprendere il livello di prestazioni di cache e unità di calcolo x86.


SiSoft SANDRA: CPU test

I quattro core x86 della APU AMD A8-3850 offrono una potenza di calcolo pari a quella di una CPU Core i5 661, leggermente superiore a quella mostrata dai precedenti prodotti Phenom II 940, ma inferiore a quella di un Core i3 2100 (dual-core) o di un Core i5 750.


SiSoft SANDRA: multimedia test

Le performance rilevate sulle unità multimediali mettono in luce un ottimo sprint della nuova APU Llano A8-3850 che va a confrontarsi direttamente con il modello quad-core top di gamma di precedente generazione, il Phenom II X4 980. Questo significa anche stare vicino ad un Core i7 870 e ben al di sopra di Core i3 2100 o Core i5 750.


SiSoft SANDRA: banda dati intercore


SiSoft SANDRA: latenze intercore (a valori inferiori corrispondono prestazioni migliori)

L’effetto della cache L2 di dimensioni maggiori è evidente nella superiore banda dati fra core che passa da una media di 4,5GB/s delle CPU Phenom II, ai 6,5GB/s della APU Llano che stiamo esaminando. Da questo punto di vista AMD è stata brava a non introdurre ulteriori latenze.


Cache

I tempi di latenza delle cache L1 , alle quali AMD non ha apportato alcuna modifica sostanziale, restano esattamente identici a quelli dei Phenom II e delle CPU Core 2 di Intel. Le latenze delle cache L2 di Llano sono invece leggermente migliori di quelle di Phenom II nonostante la capienza sia raddoppiata (512KB per ogni core Phemom II vs. 1MB per ogni core Llano).


SiSoft SANDRA: banda dati delle memorie

La banda dati delle memorie rilevata per la APU A8-3850 risulta essere decisamente inferiore a quella di processori AMD di attuale generazione, nonostante le memorie siano impostate su valori del tutto comparabili. Probabilmente si tratta dell’influenza del core grafico integrato o di un errore nel software di rilevazione. Spostiamo ora la nostra attenzione verso gli ambiti del calcolo intensivo che richiedono notevole potenza alla CPU. Primordia e Molecular Dynamics sono due benchmark tratti da Science Mark che permettono di misurare le performance della CPU con calcoli scientifici. Essi non sono ottimizzati per ambienti multi CPU, dunque sono utili a controllare sia le prestazioni single-core che l’efficacia delle eventuali tecnologie Turbo di Intel ed AMD.


Primordia (a valori inferiori corrispondono prestazioni migliori)

Il test Primordia rivela la vera anima del nuovo A8-3850: la sua frequenza di funzionamento di 2,9GHz è esattamente a metà strada fra quella del Phenom II 920 (2,8GHz) e quella del Phenom II 940 (3,0 GHz) e così sono anche i risultati. Il diretto rivale Core i3 2100 se la cava decisamente meglio (anche se dual-core ha una frequenza di funzionamento superiore, pari a 3,1GHz).


Molecular Dynamics (a valori inferiori corrispondono prestazioni migliori)

Quanto visto con il benchmark immediatamente precedente può essere ripetuto per Molecular Dynamics . Risultati a metà strada fra quelli di Phenom II 920 e 940 ma ben inferiori a quelli di Core i3 2100, Core i5 661 e Core i5 750.


Fritz Chess Benchmark

Fritz Chess è un engine di simulazione del gioco degli scacchi ed è in grado di sfruttare al massimo ambienti multi-threaded (fino a 8 CPU). Anche in questo caso la nuova APU AMD basata su architettura Llano si trova ingabbiata fra i suoi predecessori Phenom II 920 e Phenom II 940. Rispetto ai modelli della rivale Intel che possono stare sulla stessa fascia di prezzo (o leggermente al di sopra), il prodotto AMD riesce a battere il Core i3 2100 ed il Core i5 661 ma non l’i5 750.


Crittografia

La mancanza di un modulo per l’accelerazione degli algoritmi di crittografia AES non permette alla nuova APU A8-3850 di avvicinarsi ai numeri delle CPU Intel Sandy Bridge o Clarkdale (Core i5 661). Ciononostante il prodotto riesce a raggiungere gli ottimi numeri del Phenom II X4 980 che rappresenta il modello top di gamma delle CPU quad-core ormai di precedente generazione.


Crittografia: Truecrypt

Volendo scendere nel dettaglio delle prestazioni, effettuiamo una comparazione diretta fra Core i3-2100 e AMD A8-3850: come si può facilmente notare, applicativi in grado di sfruttare la potenza di tutti i core girano decisamente bene sulla nuova APU con prestazioni molto vicine a quelle del fratello maggiore Phenom II X4 980. >>> I software di rendering sfruttano sia le risorse grafiche che quelle di CPU, pertanto risultano un ottimo metodo di misurazione delle loro prestazioni. Prendiamo in considerazione, nel nostro batch di prove, PovRay e Cinebench 10.


Povray (a valori inferiori corrispondono prestazioni migliori)

Che le CPU AMD non siano ottimizzate per funzionare bene con Povray è cosa nota e la APU A8-3850 non fa differenza. Il risultato ottenuto va ancora una volta a posizionarsi a metà strada fra Phenom II 920 e 940, ma a distanza abissale dai numeri delle rivali i3 2100 o i5 750.


Cinebench 10

Davvero ottime le prestazioni ottenute dalla nuova APU di AMD con Cinebench 10 : battuto il diretto rivale Core i3-2100 che può contare solo su due core fisici (anche se raddoppiati dalla tecnologia Hyperthreading), l’A8-3850 riesce a superare anche il Core i5 750 e mettersi ad un passo dal fratello maggiore Phenom II X4 980.


7-zip: benchmark integrato

Con 7-zip la potenza espressa dai processori AMD A8-3850, Intel Core i3-2100 ed i5 661 è quasi la stessa, con differenze solo lievemente apprezzabili. Poco più sopra troviamo il Core i5 750 ed i vecchi Phenom II 920 e 940. >> I software di codifica video permettono di stressare notevolmente i sottosistemi CPU e memorie, dunque niente di meglio per valutare le performance dei diversi processori.


XMPEG (a valori inferiori corrispondono prestazioni migliori)

Buoni i tempi fatti registrare nelle operazioni di codifica video dalla APU AMD A8-3850 utilizzando il software XMPEG : l’A8-3850 lo ritroviamo nei pressi del Core i5 661 e del Core i7 940, anche se non riesce a raggiungere le performance del diretto rivale Core i3-2100.


AGK (a valori inferiori corrispondono prestazioni migliori)

Anche nella transcodifica con Auto Gordian Knot notiamo una buona risposta della APU Llano in prova che si garantisce un posto vicino al Core i5 661.


Handbrake (a valori inferiori corrispondono prestazioni migliori)

Analizziamo in dettaglio il comportamento della APU AMD utilizzando il software Handbrake per la conversione di un intero DVD (Codice Swordfish) in un formato digeribile da Apple iPod. Il risultato che otteniamo è chiaro: A8-3850 performa quanto un Core i7 920 con un tempo leggermente migliore di quello necessario al rivale i3-2100 per completare la medesima operazione. >> Lo abbiamo già detto ma è sempre bene ribadirlo: anche se i processori A-series sono assimilabili ad una normale CPU x86, ed è così che la si deve vedere, AMD punta notevolmente sul core grafico integrato, sulla sua potenza e sulle sue feature. Più volte, in occasione delle varie conference call , il produttore ha affermato di essere anni luce avanti nello sviluppo dei driver rispetto alla rivale Intel. E come dargli torto? L’esperienza nel settore 3D accumulata con l’acquisizione di ATI non può essere certo relegata ad una unità di business secondaria.

In questa prima parte della valutazione del chip grafico integrato nelle APU AMD A8-3850 (Radeon HD 6550D) ci prenderemo cura di rilevare le prestazioni con applicazioni 3D e videogame molto leggeri, specie per il livello di dettaglio cui li abbiamo impostati. Questo ci serve per avere un confronto diretto con le prestazioni garantite da altri IGP integrati in chipset e CPU. In ogni caso abbiamo effettuato test sia con memorie DDR3-1333MHz che con memorie DDR3-1866MHz.


3DMark06

Siamo realmente su un altro livello ! Se i numeri del 3DMark06 saranno confermati dalle applicazioni reali, possiamo dire che AMD è riuscita nel suo intento. Il core grafico integrato in Llano, almeno nella sua incarnazione più potente, è capace di offrire prestazioni doppie rispetto a quelle del suo diretto rivale, Intel Core i3 2100 e di almeno il 50 percento superiori rispetto a quelle di Core i7 2600K o Core i5 2500K. Come ci aspettavamo, l’influenza della banda offerta dalle memorie DDR3-1333 o DDR3-1866 è molto forte: utilizzando le seconde il guadagno che se ne ottiene è pari al 15 percento circa.


Crysis – low detail

Se con il 3DMark06 avevamo strabuzzato gli occhi, i risultati ottenuti con Crysis (DirectX 10) fanno gridare al miracolo . Non serve scendere a livello delle CPU Core i3 2100, in quanto anche i modelli top di gamma della famiglia Sandy Bridge non riescono in alcun modo a stare al passo con il chip grafico Radeon HD 6550D dell’A8-3850. L’utilizzo di memorie DDR3-1866 fornisce ancora una volta una spinta notevole, quantificabile sempre in un 15 percento medio.


World in Conflict – low detail

Il gioco World in Conflict (DirectX 10) è maggiormente dipendente dalle prestazioni della CPU e questo avvantaggia un poco le soluzioni Intel Sandy Bridge. Il confronto con il solito Core i3-2100 non è comunque proponibile, visto che l’APU AMD A8-3850 raggiunge performance quasi doppie. Rispetto a Core i5-2500K e Core i7-2600K il vantaggio esiste ancora ma risulta meno importante.

Le maggiori prestazioni del chip grafico AMD integrato nella APU A8-3850 vengono maggiormente avvalorate nel momento in cui andiamo ad osservarne la qualità delle scene prodotte. Il superiore livello di dettaglio rispetto a quello fornito dai chip Intel è evidente, considerato anche che con le soluzioni AMD è possibile giocare a titoli DirectX 11 ed applicare i filtri di AntiAliasing .

Far Cry 2 – A sinistra AMD A8-3850, a destra Core i3-2100

Persino l’implementazione del filtro anisotropico nelle APU A8-3850 è migliore rispetto a quella implementata nei chip grafici integrati Intel. Come dimostra il tool AF Tester , in casa AMD il filtro anisotropico viene applicato allo stesso modo in tutte le direzioni mentre la scelta di Intel privilegia solo alcune direzioni lasciando scoperte le altre.

AF Tester – A sinistra AMD A8-3850, a destra Core i3-2100

>> Test 2D
Altro aspetto di fondamentale importanza è quello delle potenzialità 2D dei chip grafici integrati. Possiamo così capire quale prodotto permette di gestire meglio tutte le operazioni (e sottolineiamo tutte) che vengono effettuate ogni giorno con il proprio PC: spostamento di una finestra, apertura di un programma, attivazione della voce di un menù, visualizzazione di foto o del semplice desktop e così via. Per eseguire i test ci siamo serviti del software Passmark Performance Test .


Test 2D – Aero OFF

Il comportamento della GPU integrata nella APU A8-3850 ricalca esattamente gli stessi valori mostrati dalla scheda grafica Radeon HD 5570. Da questo punto di vista le CPU Intel di ultima generazione sembrano essere in grado di rispondere meglio, specie quando sono chiamate ad applicare filtri alle immagini e fare rendering 2D.


Test 2D – Aero ON

Attivando la modalità Aero di Windows 7, e dunque il nuovo motore di rendering 2D di casa Microsoft, il rapporto fra le diverse soluzioni resta circa lo stesso anche se notiamo una maggiore sofferenza da parte della APU A8-3850.

Video HD
Analizziamo il comportamento del sistema con flussi video in alta definizione con accelerazione hardware attivata. Valutiamo anzitutto l’occupazione del tempo di CPU con 2 spezzoni video a 1080p: il trailer di “The Simpson Movie” ed il trailer di “300”.


Occupazione CPU con video Full HD 1080p

Valori molto contenuti, quelli mostrati dalla APU AMD A8-3850 che si pone quasi al pari di quelli visti con Core i5 661 e Core i5-2500K.

3D stereoscopico
L’ultima tendenza in termini di video in alta definizione è quella legata al supporto del 3D stereoscopico . Per valutare le capacità di decodifica di simili flussi abbiamo utilizzato PowerDVD 11 ed uno spezzone del film di animazione “Bolt” in 3D.

Video 3D – Hardware OFF Video 3D – Hardware ON

L’attivazione del supporto hardware permette alla CPU di liberarsi di un notevole carico tanto da passare da un’occupazione del 35 percento circa a meno del 10 percento. >> Visto che giochi e applicazioni di base sono compiti troppo facili per il chip grafico integrato in questa APU, abbiamo deciso di metterla seriamente alla sbarra. Abbiamo dunque eseguito alcuni benchmark, scegliendo fra quelli che solitamente usiamo per testare schede grafiche discrete e usando impostazioni di massima qualità anche se limitatamente a risoluzioni di 1280×1024 e 1680×1050. Ecco come è andata.


Stalker: Call of Prypiat


Devil May Cry 4


HAWX 2


FarCry 2


Alien vs. Predator


The Last Remnant

Quel che possiamo notare dai grafici è che, nonostante la forte pressione imposta alla scheda grafica, alla risoluzione di 1280×1024 è possibile giocare con diversi titoli utilizzando il core grafico integrato della APU AMD A8-3850 anche se usiamo un livello di dettaglio elevato (riducendo la qualità è ovviamente possibile migliorare ulteriormente le prestazioni). Aumentando la risoluzione le prestazioni cominciano a soffrire molto di più ma è possibile recuperare parte di quanto perso facendo leva su memorie DDR3-1866 che garantiscono un boost prestazionale del 20 percento circa. >> I consumi del sistema sono stati valutati misurando l’assorbimento sulla presa di corrente ed effettuando rilevazioni in IDLE (con Cool&Quiet attivo) e sotto sforzo (CPU Stability Test). I valori riportati in tabella tengono conto anche di un fattore di correzione relativo all’alimentatore utilizzato:

  • Il valore registrato va considerato solo in termini comparativi in quanto include anche l’inefficienza dell’alimentatore;
  • L’inefficienza dell’alimentatore non è lineare ma segue una curva che tenderebbe a penalizzare i consumi ridotti (l’efficienza è generalmente maggiore quando il carico sull’alimentatore aumenta). Per questo abbiamo applicato una correzione percentuale ai risultati utile a rendere idealmente lineare la curva di inefficienza.


Consumi con scheda grafica discreta

L’utilizzo del processo produttivo a 32nm ha permesso ad AMD di ridurre i consumi dei propri processori. Nonostante la presenza di oltre un miliardo di transistor, i consumi restano sugli stessi livelli di quelli delle CPU Intel Core di seconda generazione.


Consumi con controller grafico integrato

Ma cosa accade nel momento in cui togliamo la scheda grafica esterna ed utilizziamo il chip integrato? I consumi in senso assoluto si riducono anche se quelli legati ai quattro core x86 restano molto elevati. In condizioni di utilizzo blando, invece, la piattaforma AMD riesce a ricondursi su valori interessanti. >> L’era Fusion è ormai avviata e, seppure la vera “fusione” fra componenti x86 e GPU non c’è ancora stata, con Llano AMD posa le prime pietre di questo lungo percorso che porterà alla realizzazione di prodotti nei quali la simbiosi sarà talmente forte che sarà difficile distinguere i singoli moduli. Da questo punto di vista Intel è ancora molto avanti: potremmo affermare che è molto più “Fusion” una CPU Sandy Bridge che non uno dei modelli AMD appena annunciati.

Llano resta comunque la dimostrazione vivente che realizzare un processore con una forte integrazione, capace di prestazioni grafiche elevate, quantomeno sufficienti a soddisfare le necessità di un casual gamer , e consumi contenuti è oggi possibile.

AMD punta decisamente sulla potenza e sulle feature del core grafico integrato , una soluzione che deriva da una GPU utilizzata per la realizzazione di VGA discrete, senza alcuna strozzatura se non fosse per la limitata banda di memoria dovuta alla necessità di sfruttare quella di sistema.

Questo processore permette di giocare e lo permette davvero. Prendete un gioco, accettate di non esagerare con la risoluzione video ma non preoccupatevi troppo della qualità, impostate tutto su dettagli medi o alti e schiacciate il tasto play . Quelle che vi troverete davanti saranno sicuramente scene molto fluide che vi permetteranno di godere dell’esperienza videoludica. Non solo: il supporto per flussi video in alta definizione, compresi quelli 3D, è garantito, così come non sono state lasciate nel dimenticatoio tutte le caratteristiche innovative che l’industria dei videogame e della grafica professionale oggi offre (DirectX 11, Shader Model 5, OpenGL 4.1) e quelle legate alle applicazioni GPGPU (OpenCL e AMD APP).

Il core grafico integrato in Llano può essere utilizzato anche in combinazione con una VGA discreta con la limitazione che questa non offra prestazioni troppo superiori o troppo inferiori: per esempio le APU con Radeon HD 6550D potranno essere accoppiate con VGA HD 6670, HD 6570, HD 6450 e HD 6350 anche se per ottenere prestazioni solo leggermente migliori (AMD parla di guadagni dell’ordine del 10 percento). Inoltre, il produttore ha integrato nei driver la funzionalità Steady Video che permette di migliorare i flussi video tremolanti in real time senza la necessità di ricodificarli e dunque senza perdere tempo prezioso prima di poterli vedere.

A proposito di driver, AMD si garantisce anche un importante vantaggio attraverso l’unificazione di quelli per il chip grafico presente in Llano e di quelli per le tradizionali VGA Radeon. Questo significa che ogni mese si avrà a disposizione un aggiornamento che garantirà miglioramenti delle prestazioni e del supporto per i giochi di nuova generazione.

Sul fronte CPU , la potenza offerta da A8-3850 è interessante, considerato il livello di prezzo che dovrebbe restare sotto i 150 euro. Certo non abbiamo visto alcun avanzamento sostanziale, con numeri spesso ingabbiati fra quelli di modelli AMD funzionanti a frequenze simili, ma il pezzo di silicio va considerato nella sua interezza e va considerato che con applicazioni fortemente multi-threaded questa APU riesce a stare vicino ad un Core i5 750.

I consumi della piattaforma si sono finalmente ridotti ed ora, seppure ancora più elevati, possono essere considerati competitivi con quelli delle piattaforme di fascia bassa della rivale Intel. In questo senso c’è ancora del lavoro da fare, lavoro che può passare per una migliore integrazione dei componenti e/o ottimizzazione degli stessi per ottenere un prodotto finale più efficiente.

Parlando della piattaforma, possiamo reputare interessanti anche alcune feature introdotte da AMD con Lynx. Ci riferiamo in particolare al supporto nativo per connessioni Serial ATA 3.0 e USB 3.0 con tecnologia Superspeed (disponibili solo con le schede madri dotate di chip FCH A75).

Non sappiamo, infine, quanto la scelta di cambiare socket e differenziare le piattaforme in base alla fascia di mercato sia una soluzione dettata da ragioni tecniche o di mercato. Ma fatto sta che ora anche AMD terrà in piedi, come Intel, tre linee di prodotti non compatibili tra loro.

In base a quanto detto riteniamo che le APU Llano potranno essere utilizzate per la realizzazione di piattaforme multimediali, sistemi HTPC e computer in genere compresi nella fascia di prezzo che va da 400 a 700 dollari.

Link copiato negli appunti

Ti potrebbe interessare

Pubblicato il
30 giu 2011
Link copiato negli appunti