Muchos artículos describen en detalle las arquitecturas K7/K8 y netburst, y porque la arquitectura netburst de intel (la de los P4) resulta ser un tanto ineficiente cuando se le compara con K8. En http://www.arstechnica.com existen artículos detallados de por qué la superioridad arquitectural del K8 sobre netburst y se describe en detalle, el único problema es que la página está en ingles y si no conoces los fundamentos de los procesadores te será muy pero muy díficil el entendimiento de los mismos.
Bueno trataré de darte un acercamiento.
La arquitectura Netburst de intel nace de P6 (la arquitectura del P Pro PII y PIII), pero con muchas mas etapas de las que poseín el PIII. Lo que hizó intel básicamente para desarrollar la nueva arquitectura fue subdividir las etapas o "pipeline stages" de un procesador P6 en subetapas, esto con el fin de poder trabajar a mayores velocidades de reloj. Efectivamente el procesador podía trabajar a mayores velocidades de reloj , pero esto volvia la arquitectura más ineficiente ya que la nueva CPU P4 podía ejecutar menos instrucciones por cilclo de reloj que su antecesor (para esta parte es recomendada una lectura sobre pipelining y sus efectos sobre la eficiencia del procesador). Básicamente el Primer P4 willamente constaba de 20 etapas en comparacion con las 10 de su antecesor el PIII, de esta forma los primeros PIV trabajando casi un 40% a mayor velocidad de reloj poseín menor rendimiento que un PIII on un Athlon a 1GHz. Luego intel decidió renovar el nucleo del P4 sacando el presscot y aumentó las etapas a 32 , esto fué el acabose debido a los grandes problemas térmicos que llegó a presentar ya que la cuenta de transistores se aumentó significativamente y por consiguiente el consumo de potencia, las corrientes de drenaje y el calor. (También hay artículos en arstechnica que describen los cambios en el presscot y el porque de sus problemas térmicos). La nueva aqrquitectura de intel estará basada en P6 (con pocas etapas) y seguramente incorporará algunas carácteristicas de netburst, será mucho más eficiente que netburst y deberá consumir poca potencia.
detalles sobre netburst
http://arstechnica.com/articles/paedia/cpu/pentium-2.ars/1
En cuanto a AMD, la arquitectura K7 fué concebida para competir con el PIII y desde el primer momento logró el objetivo, pero con un defecto: el calentamiento. El K7 sólo poseia 15 etapas y aunque poseía más etapas que el PIII, las unidades de ejecución (especialmente la FPU) eran muy superioires a la del PIII (quizás muy potentes para su época), esta únidad era capaz de ejecutar teóricamente hasta 9 instrucciones por ciclo contra sólo 6 del posterior P4, de allí que AMD comenzará a usar el Prating y a considerar a la velocidad de reloj como un parámetro secundario. EL K7 ncesitaba un rediseño y AMD se dió cuenta de que la unidad de ejecución aún era lo suficientemente potente y que no necesitaría de muchos cambios ( de hecho las unidades de ejecución del K7 son casi idénticas a las del K8 con algunos aditamentos), se trabajo principalmente en el "front end" (es la parte del la CPU que decodifica y entrega las instrucciones a las unidades de ejecución (FPU/ALU)), el objetivo era aumentar la tasa con la cual el front end entregaba instrucciones al back end (que es donde se encuentra el nucleo de ejecución) con este fin AMD decide integrar el controlador de memoria dentro de la misma cpu para reducir las latencias y de esta manera aumentar el número de instrucciones que puedieran ser obtenidas por el front en por ciclo de reloj, de esta manera se aumentaría la eficiencia de todo el procesador llegando casi a obtener en gran cantidad de ocasiones casi el rendimiento teórico del nucleo de ejecución : 9 instrucciones por ciclo. Además la nueva arquitectura fue concebida para multiprocesamiento creando una nueva interfaz para la comunicación entre varias CPUs y con los períféricos del sistema esta interfaz llamada HTT (Hypertransport) es un link serial de 16 bits que interconecta la CPU con el chipset, la memoria se conecta directamente a la CPU. Cada CPU AMD64 debe tener un link HT dedicado al chipset y otros dedicados a la comunicación con otras CPUs dependiendo del modelo que se tenga. El AMD64 solucionó tambien los problemas de calentmiento al utilizar una nueva tecnica de fabricación creada en conjunto con IBM.
Detalles del hammer:
http://arstechnica.com/articles/paedia/cpu/amd-hammer-1.ars