AMD Clawhammer Vs Intel Pentium 4 XEon e Itanium
-
Tassadar, si lo de indagar lo has dicho por mi, podriamos ver cual de los dos sabe mas de la x86-64, porque desde luego yo no me invento las cosas.
Tus calculos por regla de 3 estan muy bien para el colegio, pero poco practicos para estas cosas, entre otras porque tus propios calculos sobre plataforma x86, que dan 3562 MFLOPS son menores que los de el P4 con tu valor a 10 Ghz.
Discutir por cosas que no existen me parece una tonteria pero imagino que sabras que la regla de 3 vale para calculos lineales y no exponenciales, logaritmicos y de mas, que se aproxima mas al rendimiento de los procesadores, ya que segun tu regla de calculo, un procesador al doble de velocidad que otro rinde el doble y eso no es asi.
Teniendo en cuenta que me has aproximado el rendimiento al 40% por encima utilizando la arquitectura x86-64 podrias tambien usar la SSE de los Pentiums, ya que si utilizas la x86 extendida con los registros de 64 bits estas optimizando codigo para dicha plataforma.
Te tengo que decir ademas que el P4 ya tiene tecnologia HT, con lo que has de suponer que a 10 Ghz tambien la tendria y volviendo a la optimizacion del codigo para 64 bits ya tienes la respuesta.
Me parece muy curioso el modo que tienes de calcular el rendimiento de los procesadores, per oteniendo en cuenta que la propia AMD has establecido el rendimiento del Hammer en 3400 PR y dado que podemos aproximarlo a un P4 a 3,4 Ghz, siendo realistas el rendimiento estaria mas bien por ahi y no por mas del doble.
Lo dicho, el Hammer va a ser bueno, pero no es un milagro, sigue siendo un procesador.
-
Pero vamos que con dos ordenadores de estos que monten le alegran las ventas a AMD.
Pues de momento solo se va a montar uno, sera un cray con 10000 opterons para un departamento de energia nuclear, para hacer simulaciones y esas cosas.
-
gekkani, yo cuando los comparo no lo hago a nivel de arquitectura ya que como tu dices tonteria, pero teniendo en cuenta que van a correr las mismas plataformas y van a estar en el mimo mercado pues parece logico comparar el rendimiento sobre las mismas aplicaciones.
Todo esto muy teorico, claro esta, porque a muy poca gente se le ocurre pasarle el 3DMark a un Xeon.
-
Veamos, hago un pequeño resumen de como viene el desarrollo del próximo año para AMD e Intel (juntando los micros de uno y de otro que van a competir en mercado doméstico-profesional, tanto de entrada/entrada-medio, como medio-alto/alto):
ENTRADA/ENTRADA-MEDIO
–-------------------------------AMD: Athlon XP Barton
Intel: Celeron P4 (joer)MEDIO-ALTO/ALTO
AMD: Athlon 64 (ClawHammer)
Intel: Pentium 4 Northwood HTEsto es lo que hay. Ahora que cada uno saque conclusiones de lo que se avecina
PS: para finales de 2003 Intel tiene previsto sacar el Prescott, Pentium 4 a 0.9 micras.
Para principios de 2004 está previsto que haga tal paso a 0.9 AMD en su Athlon 64. -
yap, ok pako.
Pero me sigue sonando muy raro todo el rollo este… AMD saca un trasto a 64bits e intel sigue con el p4? ¬_¬
Nose.. a mi hay algo que no me cuadra.
-
Pues eso es lo que hay macho… como decía en otro post, aquí nadie se guarda conejos en la chistera, en forma de tecnologías secretas que tenían guardadas (caso Intel) y ahora la va sacar, sino que las cartas de uno y otro están echadas... y esto es lo que hay...
Y una cosa, para mí el P4 correspondiente respecto del 64, va a ser un digno rival, eh, que tampoco nadie se crea que el 64 se va a pasear, seguramente saldrá con claridad victorioso, pero nada de barrer literalmente, estoy de acuerdo con Packo, eso sí, será el mejor, con claridad, pero eso es una cosa y otra es que ahora vayamos a pensar que va a dejar al P4 con sus mejoras "paralelas" que introducrá Intel como HT, fsb 800, etc, como si de un celeroncillo se tratara... aunque eso tambien, Athlon 64 será una plataforma pujante y P4 estará dando sus últimos coletazos...
-
Vamos a ver. Pakohuelva, yo no digo que tu te inventes las cosas, pero yo tampoco me invento nada, todo mi anterior post giraba en torno al tema de que el rendimiento del P4 en fpu pura es simplemente patético, y eso es lo que intentaba demostrar, otra cosa es que en las aplicaciones del dia a dia la cosa sea así, ya que la mayoría del software actual tiene soporte para SSE2 (si no, muy chungo lo tendría el P4)
Respecto a lo de las reglas de 3, quizás no sean completamente exactas, que no lo son, por tema de buses, memorias, etc, pero te invito a que en el sandra, por ser el programa que he hablado antes, testees un athlon a 700 mhz y otro a 1400, y verás como el 1400 saca matemáticamente el doble (con un error del 3-4%). Un micro a 1400 mhz hará el doble de trabajo que uno a 700, otra cosa es que después en la vida real el rendimiento sea el doble, que no lo será por los factores que ya he comentado.
En el caso de que las reglas de 3 fallasen, darían las mismas imprecisiones para el p4 que para el hammer, así que quizas mis cálculos no son tan 'de colegio'.Me parece muy curioso el modo que tienes de calcular el rendimiento de los procesadores, pero teniendo en cuenta que la propia AMD has establecido el rendimiento del Hammer en 3400 PR y dado que podemos aproximarlo a un P4 a 3,4 Ghz, siendo realistas el rendimiento estaria mas bien por ahi y no por mas del doble
En ningun momento he dicho que el rendimiento de un hammer a 2 ghz sea similar al de un p4 a 6, 7 o 10 ghz. te ha parecido que he dicho eso? si es asi, relee mi post porque te habrás perdido en algun sitio. Repito que de lo que hablo es del rendimiento del P4 en FPU pura, no del 'rendimiento de p4'.
Que pones en tela de juicio ese 40% de aumento al pasar de 32 a 64 bits?, me parece muy bien, si ni los que han diseñado el micro saben cual será la mejora, yo mucho menos.
Que me dices que no te crees que incluso a 32 bits un Hammer a 1400 mhz rinda como un Athlon 2200+, y por tanto un hammer a 2 gigas como un Athlon a 2600 reales?, perfecto, porque los unicos datos que tenemos es que un hammer a 1400 mhz puntúa igual en el 3Dmark que un Athlon 2200+ (1800 mhz), nada mas.
Pero vamos, lo que si esta claro, y lo puedes comprobar cuando tu quieras, es que en FPU sin optimización un Athlon a 2 ghz de los de ahora (2400+), da aproximadamente 2772 MFLOPS, y para igualar esta marca necesitamos un P4 a 5,3 ghz. (Y aquí en ningun momento hablo del hammer, que aún no está en la calle)
Los Athlon a 2 gigas existen, no hace falta ninguna regla de 3, y bueno, si miras la puntuación de un Pentium 4 a 3 gigas por ejemplo, y la comparas con la de un p4 a 2 gigas, te dará un 50% más casi exactamente (las reglas de 3 no fallan tanto como dices), así que por la 'regla de 3 de colegio' puedes calcular cuanto da un todavía inexistente pentium 4 a 5,3 ghz.
Claro que todo esto con la versión del sandra que yo tengo ahora mismo, ya que en la última 'curiosamente' y como ya nos tiene acostumbrados el sandra en cada versón, las puntuaciones de los pentium 4 han subido un buen porcentaje, y la de los Athlon siguen iguales, así que ese 5,4 gigas con el nuevo sandra se podría quedar a lo mejor en 4 o 4,5.
De todas formas, nos números exactos no es lo que yo pretendía, sino ver que la FPU del p4 es malísima, y que eso de 10 gigas para igualar un hammer a 2 no es tan descabellado, y que si no son 10, 6 o 7 seguro que si.
Yo en ningun momento intento desprestigiar a nadie ni poner en duda los conocimientos de nadie, y pakohuelva es alguien que controla mucho de todo esto, pero vamos, no me vengas con que ' Discutir por cosas que no existen me parece una tontería pero imagino que sabras que la regla de 3 vale para calculos lineales y no exponenciales, logaritmicos y de mas….', porque yo no hablo por hablar nunca, y todo lo que posteo por aquí lo hago con conocimiento de causa, otra cosa es que tu me hayas malentendido. Y por otra parte, no creo que el rendimiento de los procesadores sea exponencial o logarítmico.
-
Hola!
He estado leyendo este post y aparte de acabar con un lio tremendo con los nombres de los nuevos procesadores, y debido sin duda a mi tremenda ignorancia, me he enterado de muy poco
Pero si que me ha llamado mucho la atencion los 3 post larguisimos defender una comparacion tan extraña como curiosa entre un Hammer a 2 Ghz y P4 a 10.
Dices:
Así, un Hammer a 2 ghz daria (funcionando en modo 32 bits) 3562 MFLOPS, frente a 5200 de un P4 a 10 ghz
Que alguien me explique esto, porque que yo sepa, 5200 es muy superior a 3562 y eso sin contar con que al P4 le has quitado las instrucciones iSSE2, cosa que comentare luego.
Luego para explicar esta incoherencia, dices:
no creo que sea muy descabellado pensar que al pasar de 32 a 64 bits se obtendrá un aumento de rendimiento de un 40% en el FPU una vez los programas se hagan especificamente para x86-64, con lo cual esos 3562 MFLOPS se convertirían en 4986 MFLOPS, los cuales no andan muy lejos de los 5200 del un P4 a 10 Ghz que hemos calculado.
Que alguien me lo explique de nuevo, porque 4986, sigue siendo menor que 5200 y para colmo para conseguir ese numero en el Hammer, dices que los programas tienes que estar optimizados para el.
Y entonces por tu misma linea de razonamiento, si optimizas para el hammer, ¿porque no aplicas tb las optimizaciones iSSE2 del P4?. Yo mismo te lo dire: porque la puntuacion de este subiria mas de un 50%, doblaria totalmente la del Hammer y si hasta ahora tu razonamiento no tiene ni pies ni cabeza, entonces ya acabaria tirado por los suelos.
Vamos, que sinceramente no se que es lo que pretendes demostrar, no entiendo porque repites una y otra vez lo del rendimiento penoso del P4 sin iSSE2 y para hacer tus calculos se lo quitas, ¿porque se lo quitas?. Si estan ahi evidentemente es para algo no? o son un adorno?.
Eso es como si coges el P4, le quitas los 512k de cache y luego dices que el rendimiento sin ellos es una mierda…. oye pues si... pero es como lo del iSSE2... es que estan ahi para que el rendimiento no sea una mierda, no para que se los quites... sinceramente no entiendo nada
Asi que suscribo todo lo que te ha comentado pakohuelva, y que aparte de que tus calculos son todos hipoteticos, he mirado alguna de las cifras que das y segun el sandra que tengo instalado (ultima version) los procesadores dan mas puntuacion que la que tu dices (tanto los AMD como los Intel).
De todas formas, nos números exactos no es lo que yo pretendía, sino ver que la FPU del p4 es malísima, y que eso de 10 gigas para igualar un hammer a 2 no es tan descabellado, y que si no son 10, 6 o 7 seguro que si
Supongo que con esta frase lo explicas todo, pero leyendo eso, en vez de poner 3 post larguisimos con toda clase de operaciones extrañas y sin mucho sentido, lo podias haber resumido todo en esta frase:
"La FPU del P4 es una mierda!! abajo el iSSE2!!"
Asi a todos nos hubiese quedado mas claro lo que querias decir realmente
Seamos serios por favor…... (pero tampoco olvidemos mantener el buen humor )
Salu2
-
porque los unicos datos que tenemos es que un hammer a 1400 mhz puntúa igual en el 3Dmark que un Athlon 2200+ (1800 mhz), nada mas.
Que me indiques el 3DMark para darme el rendimiento de un procesador esta muy bien.
http://www6.tomshardware.com/cpu/20021114/p4_306ht-11.html
Este es sobre OpenGL asi que influye la grafica, mira estos mejor:
http://www6.tomshardware.com/cpu/20021114/p4_306ht-17.html
http://www6.tomshardware.com/cpu/20021114/p4_306ht-18.html
http://www6.tomshardware.com/cpu/20021114/p4_306ht-11.htmlComo puedes observar conforme va aumentando la velocidad del procesador el rendimiento va disminuyendo cada vez mas sobre el teorico que deberia dar. Fijate en el P4 a 1.8 y a 3.6
Sin embargo tienes razon en lo del Sandra, en ese test si que es el doble de rendimiento con lo que dice mucho de la validez del mismo. Eso si, en los test meten todo el conjunto SSE, 3DNow y demas para hacer los calculos.
Como ves, no soy el unico que cree que te has pasado.
Ademas tomas como referencia la unidad de calculo flotante que es la mayor ventaja de los Hammer ya que puede calcular numeros de mas bits en menos operaciones por ciclo de reloj que los P4, sin embargo el HT tambien tiene los registros duplicados y puede calcular dos nuemros de 32 bits en casi un ciclo de reloj, con lo que igualaria (teoricamente) los 64 bits del Hammer.
Si los Hammer hubieran salido cuando se anunciaron si hubiese supuesto una revolucion, pero a estas alturas la velocidad de los P4 hace que no se note tanto la diferencia de rendimiento, sobre todo valiendo lo mismo que van a valer.
Otra cosa que habeis comentado es lo de Intel y que no haga nada, pues no es asi. Hay un rumor bastante fuerte que apunta a que Intel esta preparando un micro con tecnologia x86-64, despues de todo esta tecnologia es bastante facil de evolucionar desde los 32 bits.
Por ultimo un pequeño detalle, Intel podria matar al Hammer o herirlo muy gravemente. Solo tendria que implantar la DDR-II muy rapidamente y el Hammer quedaria desfasado tecnologicamente.
-
Por ultimo un pequeño detalle, Intel podria matar al Hammer o herirlo muy gravemente. Solo tendria que implantar la DDR-II muy rapidamente y el Hammer quedaria desfasado tecnologicamente.
¿ein? eso mismo tiene previsto hacer igualmente en su momento AMD con Hammer…
Otra cosa que habeis comentado es lo de Intel y que no haga nada, pues no es asi. Hay un rumor bastante fuerte que apunta a que Intel esta preparando un micro con tecnologia x86-64, despues de todo esta tecnologia es bastante facil de evolucionar desde los 32 bits.
pufff si de rumores se trata… vamos a ser un poquillo más rogurosos, vamos digo yo
-
Juande te lo he demostrado ahora mismo en el otro post, yo no hablo por hablar, cuando digo algo es porque tiene veracidad.
No se si sabras que el Hammer lleva el controlador de memoria integrado en la CPU, una gran ventaja, pero un gran inconveniente a la vez. Ahora mismo ese controlador soporta DDR333, aunque podria ser que en el momento de salir soportara DDR400.
Si Intel fuerza la salida de la DDR-II, y lo tiene mas facil que con Rambus ya que nVidia y ATI la van a usar, AMD tendria que rediseñar el controldor de memoria de la CPU, lo que significaria cambiar la CPU, teniendo en cuenta que normalemte el rediseño de la misma se efectua cada 18 meses, menos para Intel mas para AMD, segun el momento. AMD se veria forzada a rediseñar su CPU muy rapidamente, aumentando el coste y los problemas. Intel por su parte solo tendria que implementar un nuevo chipset, cosa que viene apareciendo cada 6 meses, segun el momento y la necesidad, pero, desde luego, es mucho mas sencillo cambiar el controlador de memoria del Northbridge que de la CPU.
Se podria pensar que AMD podria resistir bastante tiempo sacando provecho a sus bus y a la menor latencia de memoria con DDR333, pero perderia toda la ventaja frente a la DDR-II y buses de 800 Mhz de Intel, con lo que tendriamos mismo rendimiento a mayor precio.
Sobre lo de Intel y la X86-64, me podrias dar una razon para que no la adoptase. Teniendo en cuenta que la tecnologia es abierta, de que ademas, Intel y AMD tienen contratos de cesion de tecnologias, que tarde o temprano hay que migrar hacia los 64 bits y esta es una manera comoda de ahcerlo y, por ultimo, de que microsoft ya tiene(tendra) un SO con soporte para esta arquitectura no se que razon tiene Intel para no sacarlo.
No te voy a poner enlces porque no me acuerdo de memoria, pero seguramente si buscas en los articulos tecnicos de anand sobre esta tecnologia encuentres algo.
Pero por si se te ocurre pensar que si tiene pensado algo asi porque no aparece en sus documentos la respuesta es simple, si lo hicera confirmaria que la arquitectura X86-64 es el futuro y no sus P4, porlo que resulta mucho mas sencillo tener un desarrollo sobre esta arquitectura y sacarlo o no en funcion de como funcione.
-
Pako, te vuelvo a decir lo mismo, todo lo que indicas, son simples especulaciones o elocubraciones sin que estén basadas en realidad de lo que hay hoy y se sabe habrá mañana, composiciones de lugar seguramente propias o que uno se va creando (yo incluído) en función de lo que se lee por ahí o por allá.
Cada uno tiene sus planes, Intel los suyos y AMD los suyos. Ahora mismo los planes de uno y de otro para el año 2003 están sobre la mesa y son los que señalaba en un post anterior de esta rama. Esto es lo que hay. ¿Que Intel trabaja en diversas posibilidades del pelaje que sea (implementar ddr-II, crear su propio x86-64, etc, etc)?, pues ni lo sabes tú, ni lo sé yo, ni lo sabe ninguno de nosotros, por no saberlo no lo saben ni los sitios más especializados en la materia, sólo lo sabrán los responsables de Intel, más allá de lo que quieran contar; como tampoco sabemos, más allá de como tambien AMD quiera contar, qué trabajos o proyectos viene desarrollando AMD, porque por la misma regla que comentas lo que crees sobre Intel… ¿quién te dice que AMD no tiene ya en desarrollo azanzado su micro Hammer con soporte DDR-II, pudiendo forzar a su vez, si Intel lo hace, su salida antes de lo que ellos tienen previsto? Pues esto, ni tú lo sabes, ni yo lo sé, ni nadie que no sean los propios de AMD lo saben. Por tanto, vuelvo al principio, lo que hay previsto y anunciado para todo el 2003 es lo que hay y he dicho en post anterior, lo demás, son suposiciones o composiciones de lugar, que igual pueden servir para Intel como para AMD, y no para uno sí, y para otro no.
Saludos.
-
Joder, la que se ha liado por lo de los 10 gigas, jeje, vamos a ver, vuelvo a repetir por enésima vez que no estoy diciendo que un Hammer a 2 gigas rinda igual que un Pentium 4 a 6, 7 o 10 ghz, y quien quiera seguir malentendiendome, que lo haga y que siga posteando diciendo lo tonto y lo ilógico que soy.
Todo esto viene a cuento de una simple frase, que puse inocentemente y sin darme cuenta de lo que se iba a liar, una simple frase que decia algo que puede ser totalmente cierto, y es que un hammer funcionando a 64 bits puede llegar a rendir en coma flotante como un p4 a 10 gigas usando la FPU. ¿Que esto es una tonteria y que no significa nada respecto al rendimiento de ambos procesadores? pues si, perfectamente, soy el primero que lo dice, para algo esta el SSE2 del P4, y si un programa esta optimizado para hammer, mucho antes para P4.
En cuanto a que 5200 es mas que 4900 y pico, lo se, pero vamos, 5200 es un 5% mayor que ese 4986 que dí, lo cual no considero que sea una diferencia abismal, cuando dije lo de los 10 gigas lo dice sin hacer los cálculos, solo teniendo mas o menos en mente todo lo que he dicho, no hice las cuentas como lo hice en el anterior post.
Con respecto a lo que dice cronos, pues por supuesto que si usas el SSE2 el P4 da más puntuacion (mas del doble), es que si no fuera asi, apaga y vámonos.
De todas formas, por lo que yo se el SSE2 es como el MMX y todo eso, se basa en hacer 'atajos' para hacer los cálculos.
No entiendo mucho de matemáticas pero en un simil es como si con FPU pura para calcular la longitud de un círculo haces PIdiametro, y con SSE 2 haces 3,1416diametro. El segundo cálculo es muchisimo mas facil que el primero, y mucho mas rápido, y para la mayoria de los casos nos servirá igual, pero para valores grandes y que requieran gran exactitud se produciran diferencias entre el valor real y el calculado. Otro símil es el logaritmo neperiano (o algun cálculo de esos, jeje, no estoy muy puesto en trigonometría), que para valores pequeños es igual a otra función trigonometrica, mucho mas fácil de calcular, pero conforme el numero al que se lo calculas es mayor, el error se va acrecentando.
Total, que en juegos el SSE2 irá de lujo, porque no vas a notar la diferencia entre que el punto de fuga de un pasillo este un píxel mas a la derecha de donde debería estar, pero habrá ciertos calculos científicos que requieran de una grandisima precisión, que no puedan permitirse el lujo de este pequeño o casi ínfimo error.Yo antes pensaba que el SSE2 era mucho mas preciso que la FPU, porque usa variables de 80 bits (no no estoy equivocado) frente a las 64 de las variables float normales, pero ya no es que las variables sean más exactas, que lo son en el SSE2, sino los cálculos que se hacen con ellas.
Y siento volver a soltar un rollo macabeo, pero a cuenta de todo esto fue cuando yo hice el comentario de los 10 gigas, y de que la FPU del p4 deja mucho que desear.
Total, que un Hammer a 2 ghz en general sera segun yo pienso, similar a un P4 a 3400 mhz.
-
Tassadar solo una cosa, las MMX no eran atajo, eran ¿32? instrucciones que aceleraban una serie de calculos, es algo similar a lo que hacen los chip graficos.
Por ejemplo, si girar una piramide se hace muchas veces se implementa una funcion que solo se dedique a eso, de esta manera no tienes que calcular todos los datos de manera individual.
En el caso de un procesador no se me ocurre ningun buen ejemplo bueno, pero te voy a poner uno malo, imaginate que siempre se hace la suma 3+3+3+3, pues eso se puede implementar como 4*3, pues algo asi, ya se que el ejemplo es muy malo.
En resumen se trata de implementar por "hardware" algunos calculos muy repetidos por "software".
-
Las mmx son como dices, un juego de instrucciones para acelerar cálculos, en este caso, cálculos de enteros, y creo si mal no recuerdo que eran 54 instrucciones, aunque no se, quizás eran 32, me pones en duda…... a ver si alguien nos lo puede confirma. los 3dnow de AMD y los SSE de intel son como los MMX, pero para cálculos en coma flotante.
Como bien dices, el cometido de las SSE2 es usar atajos para calcular cosas que se suelen calcular (valga la redundancia), pero más que calculos ya hechos del tipo 3+3+3 son funciones, no tiene sentido almacenar cálculos hechos con datos concretos. Lo que se hace es calcular funciones y procedimientos matemáticos comunes, mediante formulas ya prefabricadas, que son mas eficaces que hacerlos 'a mano', en este caso 'a FPU' jeje; pero eficaces en tanto a tiempo de computación, no en cuanto a exactitud, y no voy a repetir los ejemplos que di antes, si no me matais xDD.
La verdad que no conozco profundamente el funcionamiento de las SIMD, ya sea MMX, SSE, SSE, 3Dnow, enhanced 3Dnow..... , así que vendría bien que alguien con mas conocimientos que yo nos ilustrara un porquito, jeje :).
Un amigo mio me comentó que el flask tiene una opción de testear juegos de instrucciones (la exactitud de los resultados), y que el lo ha probado, y los resultados son:
-El FPU pura da prácticamente un error 0
-El MMX da algunas inexactitudes, pero es valido para comprimir (como ya digo trabaja con enteros, no con float)
-El SSE, SSE2 y los 3Dnow, ya sea el normal o el enhanced, dan bastantes mas inexactitudes, y el propio flask como consecuencia desaconseja su uso para la compresión de video.
Yo es que no tengo DVD ni he usado el flask en mi vida, pero a ver si alguien lo puede probar.....
-
Ya te dije que el ejemplo era malo:p pero veo que has piyado la idea, el de la piramide girando era mejor.
Ahora que mencionas 54 me suena mucho mas ese numero que el mio.
Como comentas mas que atajos son funciones predefinidas para acelerar determinados calculos.
Si es posible que se cometan mas errores al utilizar estas tecnologias porque no utilicen toda la precision de la FPU, pero es verdad que en la mayoria de los casos ni siquiera es necesario.
Yo si he usado el Flask y otros programas de ese tipo y siempre activo todas las instrucciones porque la diferencia de calidad para un Divx no compensa la diferencia de tiempo. Para otros temas mas profesionales si puede ser importante.
P.D.: Vamos con el ejemplo otra vez. Si tenemos 3+3+3+3, es decir simpre se suman 4 veces unos enteros pues me implemento la multiplicacion 4xn (3 en este caso). Algo ha mejorado el ejemplo.
Ahh, si quieres exactamente el tema de las MMX y demas te las puedo buscar a nibel de esamblador, creo recordar, que las tengo por algun sitio.
-
Hombre, ya es meterme en temas que no controlo del todo, pero esas inexactitudes tanto de los SSE como de los 3Dnow! (no solo es probrema de intel) son reales y ahí estan, si el flask desaconseja su uso por algo será, ya te digo que yo nunca he usado ese programa ni he comprimido divx, pero amigos mios que si lo han hecho me han dicho que se nota en la calidad cuando activas estos juegos de instrucciones (pero no lo he comprobado por mi mismo).
El tema está en que el P4 en FPU pura es bastante malo, mientras que los athlon son mucho mas eficientes, y aun sin usar sse o 3dnow dan buen rendimiento, frente al p4 que sin SSE2 está perdido.
En cuanto a hasta donde llegan esas inexactitudes no lo se, pero vamos, supongo que en la construcción de un gran puente o en calculos que vayan destinados a una construcción de ese tipo o cosas así muy delicadas que necesiten mucha exactitud, no se podrán permitir el lujo de esos fallos o inexactitudes, es lo que dije, en un quake te da igual que el punto de fuga del pasillo este un pixel mas a la derecha, pero hay cosas mas serias que un quake….
-
Dudo mucho que en la compresion a Divx nadie note la diferencia, mas que nada porque la perdida de esta formato en considerable.
Sobre la precision, no se yo que decirte, habria que ver que exactitud quieres y cual es el error cometido por estos calculos, pero te aseguro que no se va a romper un puente por ello.
Si te empeñas me busco las reperesentaciones de mantisa y esponente de arquitectura de computadores para ver la precision, pero, de cabeza, te aseguro que era muy grande.
-
Personalmente no se si se nota la diferencia al comprimir divx o no, ya que no lo he comprobado por mi mismo, lo del error, pues existe y sin llegar a ser grandisimo, es apreciable, y en ciertas aplicaciones en las cuales se necesita mucha exactitud se nota, si no es en las que he comentado, no se me ocurren otras mas delicadas, jeje.
En cuanto a averiguar la mantisa, el exponente y todo eso, te repito que no van por ahí los tiros, las variables usadas en el SSE2 seguramente tienen más precisión que las de la FPU, pero el fallo no viene de la precision de las variables, sino de los calculos que se les aplican. Por muy precisas que sean las variables, si los cálculos dan aproximaciones, no el resultado real (aunque sean aproximaciones muy grandes) los resultados tendrán ese error.
-
¿Quien ha hablado de variable?.
Con la representacion de mantisa y exponente me refiero a la que utiliza el procesador para calcularlas, no a la longitud de la variable. Supongo que sabras que cada procesador (o arquitectura) define o usa un estandar para las representaciones numericas.
Que los procesadores comenten errores es sabido, pero creo que te has pasado un poco. La precision al hacer calculos es imposible, pero de ahi a que se comentan errores tan sumamente grandes como para que se caigan puesntes y demas. Ten en cuenta que los estudios de arquitectura utilizan PCs en su mayoria y estos montan Pentiums, tambien en su mayoria. Ademas, ¿si no lo calculas con un procesador con que lo calculas?, o, ¿quieres decir que los Pentiums son los culpables de que la nave que tenia que aterrizar en Marte lo hizo en Jupiter y se podia haber evitado al usar Athlons.?
Lo dicho, que la teoria esta muy bien y sabemos que no son absoltamente precisos, pero cometer un error de 1 un milimetro en 1.000.000.000.000.000.000.000.000 de Km parece razonable (32 bits).