Breve anÃ¡lisis de la arquitectura de las GPUs Nvidia

De forma muy simplificada, el procesamiento vectorial de las GPU NVidia se basa en una multitud de nÃºcleos simples, agrupados en procesadores mÃºltiples. La terminologÃa oficial es:

Streaming Processor (SP):
Streaming Multiprocessor (SM):: integra varios SPs.

Conceptualmente, cada nÃºcleo CUDA tendrÃa una ALU para enteros y otra para coma flotante (tanto en precisiÃ³n simple como doble). En la prÃ¡ctica, el nÃºmero total de nÃºcleos que soportan precisiÃ³n doble suele ser menor, en un factor entre 1/32

El nÃºmero total de cores simplemente serÃa el producto de los SP/SM por el nÃºmero de SMs. En el caso de SP de doble precisiÃ³n, se suelen indicar como fracciÃ³n de los SP de simple precisiÃ³n. Por ejemplo, la GTX 980 Ti tiene un factor FP64/FP32 de 1/32, lo cual significa que de los 2772 cores, hay 2772/32=84 cores de doble precisiÃ³n (el resto obviamente son de simple)

Las operaciones por segundo (teÃ³ricas) se pueden calcular multiplicando las «operaciones por instrucciÃ³n-nÃºcleo-ciclo» por el nÃºmero de nÃºcleos y por la velocidad de reloj. Dado que hay nÃºcleos de precisiÃ³n simple (FP32) y doble (FP64), los GFLOP/s tambiÃ©n suelen etiquetarse como de simple o doble precisiÃ³n. Por ahora, las «operaciones por instrucciÃ³n-nÃºcleo-ciclo» son 2, ya que la instrucciÃ³n de suma y multiplicaciÃ³n («FMA») comporta 2 operaciones.

Ejemplos:

GTX 980 Ti -> 2 * 2800 * 10^9 = 5.6 TFLOP/s precisiÃ³n simple, 2*84*10^9 = 0.168 TFLOP/s precisiÃ³n doble.

La nomenclatura de los procesadores incluye una letra que referencia la arquitectura a la que pertenecen. AsÃ, los GF corresponderÃan a Fermi (2009), los GK a Kepler (2012) y los GM a Maxwell (2014).

En esta tabla se comparan las caracterÃsticas de algunas de las tarjetas mÃ¡s interesantes (en las diversas generaciones):

Para saber mÃ¡s…

«CUDA programming», Shane Cook (2012)

«Computer Architecture, a Quantitative approach» (5th ed), Patterson & Hennessy (2011)

«New hardware features in Kepler, SMX and Tesla K40», Manuel UjaldÃ³n (2014).

Wikipedia: arquitecturas Maxwell, Kepler y Fermi.

Dejar un comentario Cancelar la respuesta