Tag Archives: gpu

Nouveau e CPUFreq: Geforce 9800 supera GTX680

Il recente test di Michael Larabel sul driver AMD open source, fra le due versione del kernel 3.11 e 3.12 (da git), ha reso evidente un miglioramento delle prestazioni del computer. Lo stesso test è stato ripetuto con il driver Nouveau, però in questo caso il guadagno è risultato minimo con le schede denominate Kepler e Fermi. Per quale motivo? Il motivo è che il driver open source non supporta ancora il reclock, ovvero la selezione del livello delle prestazioni della GPU.

I cambiamenti nel codice di CPUFreq (il modulo che governa la frequenza d’esercizio della CPU) hanno giovato alle GPU Radeon, ma non a tutte quelle di marca nVidia. Da tempo c’è la possibilità di fare “re-clocking” delle schede grafiche GeForce: fino alla serie 7 il reclock avveniva in fase di boot e non interessava la velocità della VRAM; a partire dalla serie 8, i modelli M dei portatili avevano la capacità di riaggiustare sia il clock della RAM video sia quello del core della GPU. Questa modifica fu decisa per ridurre i consumi energetici quando la GPU si trovava per lo più in riposo. Il clock era impostato a una velocità intermedia fra il valore massimo e quello minimo d’esercizio. Con le GeForce 200 il clock al boot era impostato a ⅓ della velocità massima della GPU. Con le schede video denominate Fermi (dalla serie 400 alla 600) le prestazioni sono peggiorate perché il clock di default è al 10% della frequenza massima d’esercizio e non c’è ancora modo di fare reclock usando il driver Nouveau. Per questo motivo nel test di Michael la scheda 9800GTX ha superato una GeForce GTX680.

PTS: Nouveau bench con Xonotic
PTS: Nouveau bench con Xonotic

Linux e il 3D Benchmarking

L’analisi delle prestazioni di un elaboratore consiste nel misurare le capacità di calcolo con un insieme di programmi (carico di lavoro, detto workload) particolari. “Nella maggior parte dei casi le prestazioni sono l’attributo più importante nell’orientare la scelta fra diversi elaboratori disponibili” (Patterson e Hennessy, Struttura e progetto dei calcolatori, pag. 37). Certamente la misura da sola non suggerisce alcuna indicazione utile all’acquirente. Occorre ripeterla fra varie macchine, cioè svolgere un confronto e poi riferire i risultanti. Studiando questi dati, nel corso degli anni, i progettisti hanno perfezionato gli elementi del personal computer che davano maggiori prestazioni in certe aree piuttosto che in altre. L’acceleratore grafico (GPU) ha sostituito la CPU nei calcoli geometrici e si è specializzato sul rendering delle scene 3D. La tecnologia SLI (o l’alternativa Crossfire), di recente invenzione, promette di raddoppiare o triplicare (quasi), a seconda del numero di GPU messe in parallelo, le prestazioni dell’elaboratore con le applicazioni 3D che sono prevalentemente giochi basati su OpenGL o DirectX. Gli ingegneri hanno aggiunto poi alla GPU le istruzioni macchina per risolvere complicate formule di matematica e fisica, mi riferisco all’engine CUDA di nVidia. Una valutazione accurata sull’efficienza del sistema hardware e software viene svolta con un gruppo di benchmark. Si tratta spesso di programmi individuati fra quelli che l’utente utilizza abitualmente (Phoronix Test Suite), oppure sono applicazioni specifiche che esaminano determinate componenti (CPU2006, RAMSpeed, ecc). Oggi la grafica 3D richiede più potenza e memoria di qualsiasi altro programma per PC. Quando usiamo i videogiochi come carico di lavoro sul nostro banco di prova, otteniamo una previsione molto attendibile delle prestazioni del calcolatore. Il metodo è semplice. Possiamo valutare l’affidabilità del nostro computer partendo dai seguenti giochi: Quake III, Unreal Tournament 4, Doom 3, Enemy Territory, Quake Wars, Savage 2, Nexuiz, perché li troviamo a pagamento, gratuitamente o come demo nel World Wide Web e con uno sforzo minimo riusciamo a installarli in Linux.

Quake Wars

Quake Wars si adatta bene all’analisi delle prestazioni. Il suo motore grafico è derivato da Doom 3 e incorpora la tecnologia denominata MegaTexture che migliora indubbiamente l’aspetto del gioco negli spazi aperti della mappa. Possiamo adoperare, per il nostro scopo, la versione di prova oppure quella commerciale. Prima dobbiamo scegliere la mappa, quindi registrare una partita da Internet e poi ripetere la registrazione con una opzione determinata. Al termine dell’operazione, il motore grafico calcola il frame rate dividendo il numero totale di immagini che compongono l’animazione con il tempo, espresso in secondi, impiegato dalla macchina fisica per visualizzarle. Il risultato esprime l’effettiva prestazione della scheda grafica e del sottosistema hardware/software. Il valore suggerisce anche a quale risoluzione video possiamo giocare senza perdere troppa qualità nell’immagine.

Scarica uno dei pacchetti messi a disposizione per Linux

  1. Quake Wars demo v2.0 – Contiene la mappa Valley
  2. Quake Wars 1.5 Full – Richiede il DVD

Per registrare una partita, collegati a un server e premi il tasto F12. Troverai il file della registrazione nella directory:

$HOME/.etqw/base/demos

Dalla console del gioco esegui i seguenti comandi in successione:

com_unlock_FPS 1
com_unlock_timingMethod 0
com_showFPS 1
timeNetDemo FILENAME.ndm
condump FILENAME.log

Puoi mettere questi comandi, preceduti dalla parola chiave seta, in un file di testo chiamato NOMEFILE.cfg:

seta com_unlock_FPS 1
seta com_unlock_timingMethod 0
seta com_showFPS 1
timeNetDemo FILENAME.ndm (* questo senza seta *)

Poi dalla console devi soltanto invocarlo con: exec NOMEFILE.cfg

Non dimenticare la riga di comando di Unix che abilita la console (se disabilitata):

etqw +set com_AllowConsole 1

 

Colpo di nVidia: acquisisce Ageia

Per una questione “legale” con Ageia, Ryan Gordon non ha potuto portare Unreal Tournament 3 a Linux; ebbene questa impasse brobabilmente si sbloccherà, perché giusto ieri nVidia ha annunciato l’acquisizione proprio di Ageia, azienda che progetta harware (PPU) e software (PhysX) specializzato per l’accelerazione dei calcoli di fisica nei videogiochi.
L’obiettivo per entrambe le società è davvero ambizioso e forse i giocatori beneficeranno molto da questa unione, dato che i modelli futuri di GPU GeForce, definite GeForce®-accelerated PhysX, incorporeranno una tecnologia in grado di portare nei giochi effetti ultra realistici; come complemento a CUDA naturalmente, NVidia fornirebbe così una propria soluzione per migliorare il calcolo fisico su PC e Playstation 3 nel mercato dei videogames o in campo scientifico, grazie anche alla programmazione parallela, nella computer vision, il video editing in tempo reale, ecc.

Ageia Physx card
Ageia Physx card

Sapphire ATI 2600 XT. Scheda grafica di fascia media

Ho ritirato la scheda video ieri dal negozio. Sono però ancora impaziente di avere tutte le componenti disponibili, perché soltanto così potrò completare il montaggio del PC e verificare, sulla base delle scelte fatte il mese scorso, se Quake Wars “girerà” con un buon FPS. Oggi mi limiterò dunque a presentare con alcuni scatti fotografici la componente video, ovvero una ATI HD 2600 XT di marca Sapphire per bus AGP 8x, costata 101,50€.
Ciò che risalta di più sulla confezione è la dicitura “256MB GDDR3 Memory” e poi, ovviamente, al centro il personaggio femminile 3D (riprodotto anche sul corpo del dissipatore della GPU) che dovrebbe incarnare il vero spirito “combattivo” della scheda video con quei videogame tosti da elaborare. La scatola ha dimensioni ridotte, ma comunque nell’insieme è assai robusta; essa contiene il cavetto per il collegamento alla TV e quello per l’alimentazione ausiliaria, la guida rapida all’installazione, un adattatore DVI-VGA, un adattatore RCA, il CD con il software per Windows XP e Vista, infine la Sapphire HD 2600 XT ben protetta da una busta antistatica e assicurata saldamente alla scatola da “linguette” di cartone.

Sapphire Radeon HD 2600 XT
Sapphire Radeon HD 2600 XT

Le caratteristiche tecniche principali, riportate dal sito di Sapphire Italia, sono le seguenti:

  • GPU: ATI Radeon RV630 XT
  • Bus: AGP
  • Memoria: 256MB
  • Tipo di memoria: GDDR3 128-Bit
  • Freq. memoria: 1400Mhz
  • Engine clock: 800Mhz
  • Ramdac: 400Mhz
  • Tecnologie Integrate: OpenGL 2.0

 

Quake Wars 1.2 R5, nVidia GeForce 7300 Go e Linux From Scratch 6.3. Nuovo bench

Propongo in questo articolo i risultati del benchmark effettuato tra ieri e oggi sul mio portatile con il driver beta 169.04 per schede nVidia e il gioco Quake Wars.

Non posso dire con assoluta certezza se questa versione incrementa le prestazioni di Quake Wars, perché i dati relativi al timeNetdemo che ho in mano non superano nettamente quelli rilevati all’inizio di novembre. C’è stato un progresso, ecco.
Il problema di stabilità riscontrato con il driver Nvidia della serie 100.XX durante l’ultimo test con LFS 6.3 non si è più ripresentato, per esempio. Non potendo usare il driver 1.0-9755 a causa del kernel installato, a questo punto il “169.04″ è, fra tutti quelli disponibili, il driver che devo preferire per giocare. Tra l’altro è stata aggiunta, nel pannello di controllo della scheda video, una interfaccia alla tecnologia PowerMizer per monitorare lo stato della GPU (vedasi immagine a lato). PowerMizer è una peculiarità delle GeForce per mobile computing (Go 7300, 8600M). Essa gestisce efficientemente la potenza richiesta dalla GPU nei vari task. Ma nemmeno passando da Quake Wars 1.2-11401 a 1.2-11663 con la release 5 (R5) del client di gioco, il frame rate medio è migliorato. E’ proprio giunto il momento di esaminare un sistema hardware alternativo.
Anche stavolta ho considerato per la prova tre livelli di dettaglio, corrispondenti alle denominazioni: “low quality”, “medium quality”, “high quality”; essi si determinano opportunamente variando i parametri principali della grafica, nella scheda delle impostazioni video del gioco. Ho usato la mappa Salvage, registrata tempo fa durante una partita online, per il timeNetDemo.

Sta Quake Wars sfruttando pienamente le capacità multithreading della CPU Dual Core montata sul portatile A6Tc? Probabilmente no. La variabile r_useThreadedRenderer ha internamente valore 0 ed è impossibile cambiarlo. A proposito di questo, spero di raccogliere maggiori informazioni per il prossimo articolo sul tweaking.
Alla risoluzione di 1280×1024 pixels e dettagli minimi ho rilevato 24.1 FPS. Qui mi fermo, perché nemmenno con i dettagli alti a 800×600 ho potuto far girare il timeNetDemo, purtroppo.