AMD "Bulldozer", 32nm - high-K - AM3… A finales de año con suerte.



  • Bulldozer es el nombre en clave del primer procesador de 32 nanometros para sobremesa de AMD, pero la cosa no queda ahy, segun se extrae de articulo de Robert Hallock en tech.icrontic.com este va a ser el paso culminante de la estrategia de amd para salir de su prolongado bache y tomar una posicion desde la que plantarle cara directamente a intel.

    Los nuevos micros poseen una arquitectura completamente nueva, con cambios un poco radicales para lo que nos tiene acostumbrados, y parecen ser las lineas generales del camino que van a tomar las arquitecturas venideras.
    Como nota curiosa decir que a los pocos dias de esta noticia intel difundia que esta investigando en la misma linea de avances tecnicos, (anda que si no fuese por la competencia).

    Lo que se ve en la imagen no es un micro completo aunque lo parezca, es en realidad un nucleo, si si, cada nucleo sera asi y vendran de 4 a 8 como este en un micro.
    Segun se explica hay dos nucleos paralelos e independientes que comparten de forma flexible todo menos la cache L1, y cada uno de estos nucleos usara una version avanzada de multihilo que podria disponer de hasta 8 pipelines. Todo esto dentro de cada nucleo, o "modulos" como los esta llamando la propia AMD.

    Uno de tantos detalles interesantes es que AMD pasara en este micro a utilizar material High-K, señal evidente de que realmente pretende sacar un micro muy competitivo, es de suponer que eso afectara al precio, ya veremos cuanto.

    CMT (Cluster-based Multi Treading) traera aire fresco a las capacidades multi-hilo de cpu, y supuestamente desbancara al Hyper-Threading de Intel.

    Tambien se esperan novedades para portatil y netbook en 32nm para principios de 2011.
    Mas detalles: tech.icrontic.com/… ...amds-next-generation-processors

    Salu2.



  • Pues segun apuntan los ultimos rumores el zocalo para los micros de gama mas alta se llamara AM3 r2, y todavia no hay informacion fiable sobre la intercompatibilidad de estos con el actual AM3.

    Tambien se sabe ya que los micros de 2 nucleos con grafica integrada que constituiran la gama baja seran los primeros en llegar probablemente al final de este año, y que los de gama media de 2 y 4 nucleos asi como los mas poderosos Bulldozer no llegaran hasta el 2011.

    Todos los micros utilizaran nuevos chipsets y nuevos zocalos, el zocalo AM3 r2 para los Bulldozer y el zocalo FM1 para el resto de la gama, asi que de momento no se sabe si se podra montar uno de estos Bulldozer en las actuales placas AM3-8xx.
    Ademas todo apunta a que AMD distribuira estas nuevas gamas de forma similar a como lo hace Intel con sus actuales i3 i5 e i7

    Parece que AMD seguira sacando productos muy interesantes con una relacion precio/rendimiento mas que interesante pero seguira luchando en la retaguardia, ya que es de suponer que Intel se esforzara en tener productos algo mas evolucionados (y mas caros claro) para esas mismas fechas.
    Ya veremos si Intel para esas fechas lo supera o sencillamente se limita a pasar sus actuales gamas a los 32 nanometros.

    Se espera tener mas informacion durante el mes de agosto.

    Salu2.


  • Veteranos HL

    Esperemos no les salga como los phenom I. La verdad es que AMD se esfuerza en innovar cosa muy buena pero no le va bien. Esperemos que estos salgan muy buenos y haya una guerra de precios, porque ver el i7 980X a 1000€ me parece una bestialidad.



  • Bueno, el núcleo llano no tiene más remedio que cambiar de socket por que el AM3 no está preparado para un cambio asi, bulldozer pinta bastante interesante. De todas maneras se hablá por ahí de la posibilidad de sacar un six-core bulldozer cosa que no termino de ver, por que en ese caso 2 de los "núcleos" perderían la capacidad de procesar flotantes en modo 256bits…



  • @Wargreymon:

    "…
    De todas maneras se hablá por ahí de la posibilidad de sacar un six-core bulldozer cosa que no termino de ver, por que en ese caso 2 de los "núcleos" perderían la capacidad de procesar flotantes en modo 256bits...

    ¿Y eso por que?, según se aprecia cada uno de los núcleos tiene su propia unidad de coma flotante, es una unidad doble de 128bits cada una con un organizador que las maneja para los 8 threads físicos del núcleo permitiendo en cada ciclo instrucción de 128 o de 256bit según la necesidad, y esto es internamente e independientemente en cada nucleo, ya sea elcpu de 2, 4 6 u 8 núcleos (también habrá bulldozer de 8 cores).
    Vamos que la posibilidad de procesar en cada ciclo instrucción fp de 128 o de 256bit según los hilos que soliciten fp dentro del núcleo, sera independiente entre núcleos, cada núcleo podrá gestionar independientemente su doble fpu de 128bit en cada ciclo de reloj.

    Es muy temprano la verdad para "pillarse los dedos" argumentando sobre esta arquitectura, en agosto se dice que habrá información algo mas fiable, pero si lo que se comenta es verdad este micro desbancara a intel a no se que esta misma tenga ya listo algo similar:
    Fijaros que según la información disponible las imagenes que veis son de un core y no del cpu completo, esto supondría que estos micros tratarían instrucciones desglosadas pero de forma nativa o sea físicamente, y en ese caso este micro estaría por delante de cualquier i7 presente, y la tendencia es precisamente esa, cluster multi-hilo versátil capaz de usar los hilos independientemente o cumbinados según la necesidad de cada instrucción, o sea seria la siguiente devolución al hyperTrheding de intel.

    No me acuerdo donde he leído que Intel esta también trabajando con prototipos sobre esta misma arquitectura de cluster físico.

    En cualquier caso mosquea bastante que en las imagenes este core (modulo como lo viene llamando amd) es etiquetado en conjunto como "bulldozer" lo que deja dudas :( de si realmente es un núcleo o el micro completo o que es realmente. Y al mismo tiempo se puede apreciar que este "modulo" o núcleo integra también un modulo llamado "Shared L3 and NB",lo que me deja pensando si sera el micro completo o si sera una nueva manera de implementar el NB en la que cada núcleo se pudiera comunicar con el sistema independientemente, lo cual supongo que seria un gran avance.

    Lo que si que esta claro es que la expectativa puede venir a ser muy fuerte !!! a ver si en agosto llega información mas fiable y así no tenemos que especular tanto ;)

    Salu2



  • @defaultuser:

    ¿Y eso por que?, según se aprecia cada uno de los núcleos tiene su propia unidad de coma flotante, es una unidad doble de 128bits cada una con un organizador que las maneja para los 8 threads físicos del núcleo permitiendo en cada ciclo instrucción de 128 o de 256bit según la necesidad, y esto es internamente e independientemente en cada nucleo, ya sea elcpu de 2, 4 6 u 8 núcleos (también habrá bulldozer de 8 cores).
    Vamos que la posibilidad de procesar en cada ciclo instrucción fp de 128 o de 256bit según los hilos que soliciten fp dentro del núcleo, sera independiente entre núcleos, cada núcleo podrá gestionar independientemente su doble fpu de 128bit en cada ciclo de reloj.

    Es muy temprano la verdad para "pillarse los dedos" argumentando sobre esta arquitectura, en agosto se dice que habrá información algo mas fiable, pero si lo que se comenta es verdad este micro desbancara a intel a no se que esta misma tenga ya listo algo similar:
    Fijaros que según la información disponible las imagenes que veis son de un core y no del cpu completo, esto supondría que estos micros tratarían instrucciones desglosadas pero de forma nativa o sea físicamente, y en ese caso este micro estaría por delante de cualquier i7 presente, y la tendencia es precisamente esa, cluster multi-hilo versátil capaz de usar los hilos independientemente o cumbinados según la necesidad de cada instrucción, o sea seria la siguiente devolución al hyperTrheding de intel.

    No me acuerdo donde he leído que Intel esta también trabajando con prototipos sobre esta misma arquitectura de cluster físico.

    En cualquier caso mosquea bastante que en las imagenes este core (modulo como lo viene llamando amd) es etiquetado en conjunto como "bulldozer" lo que deja dudas :( de si realmente es un núcleo o el micro completo o que es realmente. Y al mismo tiempo se puede apreciar que este "modulo" o núcleo integra también un modulo llamado "Shared L3 and NB",lo que me deja pensando si sera el micro completo o si sera una nueva manera de implementar el NB en la que cada núcleo se pudiera comunicar con el sistema independientemente, lo cual supongo que seria un gran avance.

    Lo que si que esta claro es que la expectativa puede venir a ser muy fuerte !!! a ver si en agosto llega información mas fiable y así no tenemos que especular tanto ;)

    Salu2

    Si que podría haber un bulldozer de 6 nucleos, llevas razón, sería un micro con 3 modulos, lo que no sería posible es un supuesto micro con 3 núcleos…

    Lo que no entiendo muy bien es lo que dices de que cada núcleo puede gestionar su FPU doble. Por lo que se un modulo sería equivalente a 2 "núcleos" (dicho por AMD), por lo que habría una FPU doble en cada modulo. Eso querria decir que en un caso ideal que cargue el micro al 100% habría posibilidad de ejecutar en cada nucleo una unica instruccion FP 128 o ejecutar en cada modulo una unica instruccion FP256 (es decir, empleando 2 núcleos), por lo que la capacidad sería en un octo-core o bien de ejecutar 8 FP128bits simultaneos o 4 FP256 bits simultaneos (sin entrar a operaciones por ciclo y unidades de ejecucion de cada nucleo y demás).

    Lo que si parece en un principio, viendo los 8 pipelines que tiene cada unidad de enteros en los modulos, que cada uno de ellos será visto por el SO como 8 hilos, haciendo un total de 32 hilos en un bulldozer zambezi de 8 núcleos, que es algo que se comentaba también tiempo atras...



  • Pues entonces ahy estara mi error; si en realidad cada modulo son dos cores la cosa cambia un poco la verdad.
    Entonces sera como dices tu, cada modulo (o conjunto de dos cores) podria combinar sus dos unidades FP de 128 para ejecutar instrucciones FP de 256.

    Lo de tener integrado el bulldozer NB en cada modulo tambien me llama mucho la atencion, a ver como funciona eso en la practica.

    Yo la verdad es que me he basado en las informaciones mas tempranas que he visto sobre el asunto. pero aun con tantas novedades interesantes, talvez lo que mas me llama la atencion es que los vayan a frabricar con material Hi-K, si salen por lo menos tan buenos como los Phenom II y encima con Hi-K seguro que consiguen un margen de overclock muy bueno, superior a los actuales (ojala), y si la politica de precios se mantiene es de suponer que seria un producto muy pero que muy interesante.

    Salu2.



  • @defaultuser:

    Pues entonces ahy estara mi error; si en realidad cada modulo son dos cores la cosa cambia un poco la verdad.
    Entonces sera como dices tu, cada modulo (o conjunto de dos cores) podria combinar sus dos unidades FP de 128 para ejecutar instrucciones FP de 256.

    Lo de tener integrado el bulldozer NB en cada modulo tambien me llama mucho la atencion, a ver como funciona eso en la practica.

    Yo la verdad es que me he basado en las informaciones mas tempranas que he visto sobre el asunto. pero aun con tantas novedades interesantes, talvez lo que mas me llama la atencion es que los vayan a frabricar con material Hi-K, si salen por lo menos tan buenos como los Phenom II y encima con Hi-K seguro que consiguen un margen de overclock muy bueno, superior a los actuales (ojala), y si la politica de precios se mantiene es de suponer que seria un producto muy pero que muy interesante.

    Salu2.

    Supongo que lo del NB integrado se referirá solo a integrar el controlador pcie dentro del micro, como los lynnfield de Intel, asi dejan las placas con solamente el southbridge, pero bueno, tendremos que esperar un mesecito para saber más…

    Por cierto, lo de los 32nm en High-K me parece que era un rumor solamente, por lo que se ve en los roadmaps de GlobalFoundries no tienen planes de pasarse a High-K y los 32nm seguirán siendo SOI:

    Supuestamente el 32nm SPH es el orientado a las CPU, el 28nm HP el orientado a GPUs y el 28nm SLP el orientado a GPUs para portatiles.

    Saludos ;)



  • @Wargreymon:

    Supongo que lo del NB integrado se referirá solo a integrar el controlador pcie dentro del micro, como los lynnfield de Intel, asi dejan las placas con solamente el southbridge, pero bueno, tendremos que esperar un mesecito para saber más…

    Por cierto, lo de los 32nm en High-K me parece que era un rumor solamente, por lo que se ve en los roadmaps de GlobalFoundries no tienen planes de pasarse a High-K y los 32nm seguirán siendo SOI:

    Supuestamente el 32nm SPH es el orientado a las CPU, el 28nm HP el orientado a GPUs y el 28nm SLP el orientado a GPUs para portatiles.

    Saludos ;)

    No si lo de NB integrado esta claro, todo tiene pinta que las arquitecturas disponibles van a imitar mas o menos a la distribucion que tiene ahora Intel en sus ix, pero lo curioso decia yo es el hecho de que cada "modulo" lleve su propio NB en lugar de haber un unico NB dentro del cpu.

    Ya veremos como es todo finalmente, porque los rumores estan muy bien para crear espectativa pero de los rumores al resultado final a veces cambia tanto.
    A ver dentro de un mesecito como pinta la cosa, a ver si progresan bastante o solo se renuevan un poco, por lo menos que pasen a 32nm verdad ;)

    Salu2.



  • @defaultuser:

    No si lo de NB integrado esta claro, todo tiene pinta que las arquitecturas disponibles van a imitar mas o menos a la distribucion que tiene ahora Intel en sus ix, pero lo curioso decia yo es el hecho de que cada "modulo" lleve su propio NB en lugar de haber un unico NB dentro del cpu.

    Ya veremos como es todo finalmente, porque los rumores estan muy bien para crear espectativa pero de los rumores al resultado final a veces cambia tanto.
    A ver dentro de un mesecito como pinta la cosa, a ver si progresan bastante o solo se renuevan un poco, por lo menos que pasen a 32nm verdad ;)

    Salu2.

    Hombre lo del NB en cada modulo igual es más cosa del dibujo, por que pone "shared", asi que igual es compartido por todos los modulos, pero en el dibujo no se ve, por que la L2 también es shared…

    No se, la verdad es que si es curioso si...



  • Bueno, ya van saliendo cosillas:

    http://www.anandtech.com/show/3863/amd-discloses-bobcat-bulldozer-architectures-at-hot-chips-2010
    http://blogs.amd.com/work/

    Al final nada de CMT, que rabia, sin saber mucho más tienen pinta de ir a competir con nehalem y los Sandy Bridge de 4 núcleos, pero con los Sandy Bridge de 8 núcleos dificil.



  • La intención de AMD con bulldozer y estos módulos dual core es tener "dual cpus" cuyo rendimiento este entre SMT y CMP. La idea es ahorrar espacio, ya que según AMD , el segundo core en el modulo solo aumenta en 12% su área, de esta manera puede colocar mayor cantidad de estos modulos en un mismo chip. Si AMD logra colocar muchos mas de estos módulos que la cantidad de cores que intel pueda colocar en sus CPUs, creo que pueden tener alguna ventaja en aplicaciones que puedan dividirse en muchos threads. Ahora, la incógnita es aun el rendimiento single thread, parece que AMD ha mejorado el front-end tambien, haciendolo 4-issue. Ademas perece que han implementado un pre-fetching agresivo (similar al i7) y mejorado la unidad de prediccion de saltos. Esto, en teoría, debería representar una mejora en este aspecto; habrá que ver en la practica si realmente llega a alcanzar a los i7 clock for clock. Otra inquietud que me asalta es el rendimiento de aplicaciones multithreading que no tengan muchos threads, es decir, que solo usen 2 o 3. Habria que ver como sera la interaccion con el sistema operativo para que exista un verdadero rendimiento en estos casos CMP, y que no se compartan recursos en un mismo modulo, sobretodo si se están ejecutando instrucciones FP de 256 bits. Habra que ver como funciona esto también.



  • @Wargreymon:

    Bueno, ya van saliendo cosillas:

    http://www.anandtech.com/show/3863/amd-discloses-bobcat-bulldozer-architectures-at-hot-chips-2010
    http://blogs.amd.com/work/

    Al final nada de CMT, que rabia, sin saber mucho más tienen pinta de ir a competir con nehalem y los Sandy Bridge de 4 núcleos, pero con los Sandy Bridge de 8 núcleos dificil.

    Si es cierto el hecho de que agregar el segundo core al modulo sin replicar las unidades FP solo aumenta el area un 12%, no veo porque AMD no pueda colocar 8 modulos en un chip, obteniendo asi 16 threads por chip. Ademas, según he leído Intel aun no ha anunciado CPUs de 8 cores. Teniendo en cuenta que un modulo de bulldozer potencialmente podria dar mas rendimiento que un core con SMT (ejecutando 2 threads simultaneos, por supuesto), creo que podria ser competitivo. Tambien habra que ver que mejoras hace intel a los sandy bridge, me parece que es mas un asunto de rendimiento por thread, que el numero de threads o de cores.



  • @cdbular:

    Si es cierto el hecho de que agregar el segundo core al modulo sin replicar las unidades FP solo aumenta el area un 12%, no veo porque AMD no pueda colocar 8 modulos en un chip, obteniendo asi 16 threads por chip. Ademas, según he leído Intel aun no ha anunciado CPUs de 8 cores. Teniendo en cuenta que un modulo de bulldozer potencialmente podria dar mas rendimiento que un core con SMT (ejecutando 2 threads simultaneos, por supuesto), creo que podria ser competitivo. Tambien habra que ver que mejoras hace intel a los sandy bridge, me parece que es mas un asunto de rendimiento por thread, que el numero de threads o de cores.

    Hombre, poder puede sin problemas, el asunto es que en 32nm sea economicamente viable, por que además con 4 modulos tiene pinta de estar ya muy cerca de los 100w (AMD pone los bulldozer como de 10 a 100w en lo que a consumo se refiere).

    Lo que comentas de amplicaciónes con pocos threads es algo que me pregunto yo también. Windows 7, a la hora de usar el SMT en los micros de Intel asigna los hilos en las CPU pares (cpu0, cpu2, cpu4…) para que no haya perdida de rendimiento y cuando llega al último los asigna a las unidades restantes, la solucion sería que en AMD ocurriera lo mismo. Viendo la numeración que pone AMD en los cores de cada modulo es hasta posible que pueda emplear el mismo sistema que Intel.



  • Pues al menos espero que sean competitvos, porque intel ya lleva mucho tiempo subido en la parra con los i7, a ver si bajan los precios y nos dejan a todos tener procesadores de ultima generacion.:D



  • @cdbular:

    Pues al menos espero que sean competitvos**, porque intel ya lleva mucho tiempo subido en la parra con los i7**, a ver si bajan los precios y nos dejan a todos tener procesadores de ultima generacion.:D

    +1.

    No puedo estar más de acuerdo. :)



  • @cdbular:

    Pues al menos espero que sean competitvos, porque intel ya lleva mucho tiempo subido en la parra con los i7, a ver si bajan los precios y nos dejan a todos tener procesadores de ultima generacion.:D

    +1

    Tienes toda la razón. A ver si AMD se pone las pilas y empieza a sacar procesadores que realmente sean competitivos y puedan dar más guerra con los de Intel, que a la postre beneficia al consumidor.


  • Veteranos HL

    Pues mas rumores o no según se mire.

    Según informa la web DonanimHaber.com, AMD dio a conocer algunas cifras de rendimiento de su próxima arquitectura en una presentación para sus socios. A tenor de lo adelantado por la compañía, un procesador de 8 núcleos basado en “Bulldozer” tendría un rendimiento un 50% mayor que los procesadores de gama alta existentes, como el Core i7 950 (4 núcleos, 8 hilos) y el Phenom II X6 1100T (6 núcleos), destacando sobretodo en juegos y aplicaciones de renderizado. No se han facilitado datos sobre la frecuencia del procesador ni el equipo donde fue testeado, pero si esas cifras son ciertas, lo dejarían incluso por encima del Core i7 980X de seis núcleos, el procesador de escritorio más rápido de Intel en estos momentos.



  • Y se sabe para cuando o una aproximación?


  • Veteranos HL

    Pues se dice que para el 2 trimestre de este años, ya veremos.


Accede para responder
 

Has perdido la conexión. Reconectando a Hardlimit.