• Portada
    • Recientes
    • Usuarios
    • Registrarse
    • Conectarse

    SuperPi tirando de la GPU NVidia

    Programado Fijo Cerrado Movido
    Software
    5
    21
    4.3k
    Cargando más mensajes
    • Más antiguo a más nuevo
    • Más nuevo a más antiguo
    • Mayor número de Votos
    Responder
    • Responder como tema
    Accede para responder
    Este tema ha sido borrado. Solo los usuarios que tengan privilegios de administración de temas pueden verlo.
    • T
      tonibaca @jordiqui
      Última edición por

      @jordiqui:

      hola
      http://files.extremeoverclocking.com/file.php?f=211
      En esta página encontrarás software para benvh, y hay un link ruso, pero no lo tengo en favoritos y no recuerdo el nombre.
      Un saludo

      PD: si arrancas en modo seguro y quieres apuirar, primero prueba a ver cuánta ram consume, y luego asignas la cantidad de ram para arrancar. ( con trichanel el mínimo es 256, pero para el multicore necesitarás algo más(:)

      Gracias por la info, pero wl HyperPi ya lo conocia y no sirve. Lo unico que hace es ejecutar una instancia de SuperPi en cada core pero no esta optimizado para calculo en paralelo. Es como si ejecutaras SuperPi varias veces a la vez.

      1 Respuesta Última respuesta Responder Citar 0
      • WargreymonW
        Wargreymon @jordiqui
        Última edición por

        @jordiqui:

        hola
        Nvidia Launches Tesla Personal Supercomputer - Tom's Hardware
        Un Shader es un programa que se ejecuta sobre la GPU en las etapas programables del pipeline y nos permite implementar efectos gráficos muy interesantes. A día de hoy hay tres tipos de Shaders: de vértices, de fragmentos y geométricos:

        Los de vértices nos permiten aplicar operaciones a los vértices que son enviados a la GPU permitiéndonos hacer efectos cómo Skinning, Displacement Mapping …

        Los de fragmentos nos permiten aplicar transformaciones a los pixels en la etapa de fragmentos permitiéndonos hacer efectos como Normal Mapping, Blur, Bloom, Phong shading, DoF ,..

        Los novedosos shaders geométricos nos permiten aplicar transformaciones a las primitivas(un conjunto de vértices) permitiendo hacer efectos como real-time tesellation, destrucción de mesh ....

        GLSL es el lenguaje de descripción de Shaders de OpenGL y en este artículo veremos cómo cargarlos, aplicarlos y pasarles parámetros. Además podréis descargar un ejemplo programado para Gnu/Linux.
        Nada que por todo lo que he leído al respecto, shader es un programa que se ejecuta sobre la gpu, y que afecta sobretodo en efectos gráficos, más que sobre, por ejemplo, los algortimos de otro tipo de bench. En el link, una review muy interesante de Tesla, nvidia sobre un core i7 extreme edition.
        Un saludo.:vayatela:

        De donde has copiado eso? 😄

        No se, lo veo explicado de una forma un poco rara, por que sobretodo llamarles shaders de fragmentos a los pixel shaders uy, que cosa más rara xD.

        Las unidades de shaders unificados de las tarjetas gráficas son micorprocesadores muy simples y muy especificos, como ha dicho jordiqui de una forma un poco rara (xD) que de cara a juegos a la hora de programarlos pueden funcionar como pixel shaders, vertex shaders o geometry shaders. Son unidades que por ejemplo en el caso de nVidia cada una tiene 1 ALU y 1 FPU (mucho más simples que las de una CPU) y en el caso de ATI cada shader tiene 1 FPU y 5 ALU. Son unidades muy simples que son movidas por otra unidad a la que nVidia y ATI la suelen llamar Ultra Dispatch processor, ultra threaded processor, etc. Este se encarga de paralelizar el trabajo entre las microunidades shader lo que ocurre es que en el caso de los juegos, por como se programan, pues se puede repartir el trabajo perfectamente, no es como en una CPU que es algo más complicado.

        Tal y como vemos ahora el SuperPI no se puede ejecutar tal cual en una GPU, necesitaria emplear CUDA, stream o OpenCL, pero vamos, una GTX 275 por ejemplo con 240 FPUs y ALUs que tiene se ventila el SuperPI en un plis.

        jordiquiJ 1 Respuesta Última respuesta Responder Citar 0
        • jordiquiJ
          jordiqui Veteranos HL @Wargreymon
          Última edición por

          Hola
          Lo he sacado de t'homshardware. No obstante, hasta que no vea un test de esta tarjeta en superpi, fritzbenchmak, cinebench, cpu burn, winrar ( 200Mb) no me creo que vaya más rápido que un Xeon X7500, por ejemplo, haciendo esas pruebas. Lo afirmo de esta forma, porque mi amigo ( suj en playchess, trabaja para Intel) lo ha probado con resultados bastantes flojos. Es decir cualquier Extreme, kenstfield le ganaba en cálculo con el programa Rybka. ( Acepta hasta 2048 CPU). Si bien, como comentas si usara las FFU pues ya veríamos, aunque no creo que se pueda. Porque son dos tipos de lenguajes distintos.:mudo:
          Un saludo.

          Cluster MPI de tres nodos formado por tres SERVIDORRES HP PROLIANT DL360P 1U 2X E5-2680V2 CPU'S, 20 cores, 40 hilos a una frecuencia base de 2,8GHz. 192 GB de memoria RAM DDR3 ECC (8 x módulos de16 GB 800Mhz)´+ 1U 2X E5.-2697 V2 a una frecuencia base de 2,8 Ghz 192 GB de Ram ECC (8 módulos de 16 Gb 800 mhz) 24 Cores 48 hilos ( 44c/88T)+ 1u 2xE5 2603v2 con una frecuencia base de 1,9ghz 64 Gb DDR3 ecc (4x módulos de 16)

          hlbm signature

          T 1 Respuesta Última respuesta Responder Citar 0
          • T
            tonibaca @jordiqui
            Última edición por

            Buenas…....

            Por lo que he podido averiguar, SuperPi nunca podrá correr en mas de un procesador puesto que la naturaleza del algoritmo que calcula el numero Pi hace imposible que se paralelize. Se basa en divisiones y para cada decimal que calcula necesita el resto de la división inmediatamente anterior. Por eso el wPrime no calcula el numero Pi sino que hace raices cuadradas de numeros de manera paralela, pero a la postre lo que nos interesa es el numero de operaciones realizadas en un periodo de tiempo concreto que nos permita hacer comparaciones de velocidad.
            Ahora el tema esta en buscan una herramienta wPrime que permita medir en rendimiento de una GPU frente a una CPU. Os animais ?

            jordiquiJ defaultuserD 2 Respuestas Última respuesta Responder Citar 0
            • jordiquiJ
              jordiqui Veteranos HL @tonibaca
              Última edición por

              @tonibaca:

              Buenas…....

              Por lo que he podido averiguar, SuperPi nunca podrá correr en mas de un procesador puesto que la naturaleza del algoritmo que calcula el numero Pi hace imposible que se paralelize. Se basa en divisiones y para cada decimal que calcula necesita el resto de la división inmediatamente anterior. Por eso el wPrime no calcula el numero Pi sino que hace raices cuadradas de numeros de manera paralela, pero a la postre lo que nos interesa es el numero de operaciones realizadas en un periodo de tiempo concreto que nos permita hacer comparaciones de velocidad.
              Ahora el tema esta en buscan una herramienta wPrime que permita medir en rendimiento de una GPU frente a una CPU. Os animais ?

              Hola
              Incluso se podría crear una rama para hacer ese tipo de Benchn, eso sí, a las Tesla de nvidia hay que darles de comer a parte.
              Un saludo.🆒

              Cluster MPI de tres nodos formado por tres SERVIDORRES HP PROLIANT DL360P 1U 2X E5-2680V2 CPU'S, 20 cores, 40 hilos a una frecuencia base de 2,8GHz. 192 GB de memoria RAM DDR3 ECC (8 x módulos de16 GB 800Mhz)´+ 1U 2X E5.-2697 V2 a una frecuencia base de 2,8 Ghz 192 GB de Ram ECC (8 módulos de 16 Gb 800 mhz) 24 Cores 48 hilos ( 44c/88T)+ 1u 2xE5 2603v2 con una frecuencia base de 1,9ghz 64 Gb DDR3 ecc (4x módulos de 16)

              hlbm signature

              1 Respuesta Última respuesta Responder Citar 0
              • defaultuserD
                defaultuser Veteranos HL @tonibaca
                Última edición por

                @tonibaca:

                Buenas…....

                Por lo que he podido averiguar, SuperPi nunca podrá correr en mas de un procesador puesto que la naturaleza del algoritmo que calcula el numero Pi hace imposible que se paralelize. Se basa en divisiones y para cada decimal que calcula necesita el resto de la división inmediatamente anterior. Por eso el wPrime no calcula el numero Pi sino que hace raices cuadradas de numeros de manera paralela, pero a la postre lo que nos interesa es el numero de operaciones realizadas en un periodo de tiempo concreto que nos permita hacer comparaciones de velocidad.
                Ahora el tema esta en buscan una herramienta wPrime que permita medir en rendimiento de una GPU frente a una CPU. Os animais ?

                Algo me sonava a mi de haber leido que el superpi es un calculo con mucha interdependecia entre los resultados, un solo hilo que recurre a lo bestia a la cache del micro y a la ram, con lo que la grafica con muchos hilos pequenitos y sin caches parece ser que no estaria a la altura.

                Quien sabe, si se va popularizando el aprovechamiento de la grafica para otras cosas, puede que les vayan implementando mas versatilidad, talvez una memoria intermedia, talvez la posibilidad de partir instrucciones y resolverlas en varios hilos.

                Comparar CPU y GPU solo se puede en pruebas muy especificas y aun asi no sirve de referencia, son muy distintos, se puede comparar lo que tardarian en acabar un trabajo que los dos sean capaces de realizar, pero el Wprime por ejemplo igual no da una idea de lo que tardarian en recodificar un video u otros trabajos de interes.

                Salu2.

                PD:
                Las graficas con la arquitectura que conocemos hasta ahora solo pueden hacer trabajos que se puedan partir en pequeños fragmentos independientes, o que sean de por si fragmentos pequeños independientes.

                Ryzen 5 3600 - Tuf B550 pro - 2x 8g 3600c18 - Strix rtx 2060 - M2 1TB

                T jordiquiJ 2 Respuestas Última respuesta Responder Citar 0
                • T
                  tonibaca @defaultuser
                  Última edición por

                  A ver…...

                  Una GPU es un procesador especializado para ejecutar determinados programas para los cuales da un rendimiento excepcional. Lo que pretenden fabricantes con Nvidia es extender el concepto de GPU hacia aplicaciones de proposito general, pero para que estas se aprovechen de este mayor rendimiento tienen que ser rediseñadas para que soporten el proceso en paralelo, lo cual no siempre es posible (como el caso de SuperPi) pero existen una gran cantidad de escenarios (creación de contenido digital, calculo científico, CAD, etc) que se pueden beneficiar ampliamente y es ahi donde Nvidia y su CUDA entran en acción.

                  Por poner un ejemplo, un equipo con varias tarjetas Tesla puede alcanzar hasta 4 TeraFlops. Para poder alcanzar esta capacidad de procesamiento necesitariamos un cluster de varios cientos de nodos.

                  defaultuserD 1 Respuesta Última respuesta Responder Citar 0
                  • defaultuserD
                    defaultuser Veteranos HL @tonibaca
                    Última edición por

                    @tonibaca:

                    A ver…...

                    Una GPU es un procesador especializado para ejecutar determinados programas para los cuales da un rendimiento excepcional. Lo que pretenden fabricantes con Nvidia es extender el concepto de GPU hacia aplicaciones de proposito general, pero para que estas se aprovechen de este mayor rendimiento tienen que ser rediseñadas para que soporten el proceso en paralelo, lo cual no siempre es posible (como el caso de SuperPi) pero existen una gran cantidad de escenarios (creación de contenido digital, calculo científico, CAD, etc) que se pueden beneficiar ampliamente y es ahi donde Nvidia y su CUDA entran en acción. ...

                    No si yo no preguntava, yo aclarava, y creo que ya sabemos todos bastante bien de que va el tema CUDA, el post trata de "superpi tirando de la GPU Nvidia" y de si el paralelismo masivo plantara cara a la cache masiva calculando superpi. Como comente antes se pueden hacer comparaciones especificas de pruebas concretas pero por las diferencias intrinsecas de arquitectura no se puede hacer una comparacion "global" para un ranking CPU/GPU, ha de ser un ranking para cada prueba concreta.

                    @tonibaca:

                    … Por poner un ejemplo, un equipo con varias tarjetas Tesla puede alcanzar hasta 4 TeraFlops. Para poder alcanzar esta capacidad de procesamiento necesitariamos un cluster de varios cientos de nodos.

                    Hablamos de GPU´s CUDA´s enabled, asi se titula el post y de eso habla el foro donde se origina el rumor, las TESLA ya tienen una arquitectura distinta a las geforce, ademas las tesla cuestan un pico y CUDA pretende aprovechar las posibilidades extra de las graficas que todos ya tenemos (bueno yo no :risitas:).

                    He leido el foro un poco por encima (principio y final) y por lo que dicen si que es tecnicamente posible pero es bastante dificil y complicado paralelizar el calculo superpi, y las instrucciones tan especificas de la gpu no ayudan mucho. Y por lo que dicen ya han coseguido paralelizar el calculo entre unos cuantos cores.

                    ! " Quote:
                    Originally Posted by trinibwoy
                    What would be the point running a serial program on a GPU? The problem isn't cuda or opencl. The problem is that either the math isn't parallelizable or people aren't smart enough (yet) to make it so.
                    ! This is correct.
                    ! The math IS parallelizable. And the proof is here (already posted):
                    ! http://www.xtremesystems.org/forums/…d.php?t=221773
                    ! HOWEVER,
                    ! It is very difficult to do. It was hard enough to parallel it into several threads for several cores. So it will be MUCH harder to parallel it into hundreds of threads for a GPU...
                    ! Also GPUs right now don't have the right instruction set to be efficient with this kind of computation. (They are too specific for graphics.) So I won't be surprised if even the best of GPU implementations have trouble beating a CPU implementation.
                    "

                    Es natural pensar que aunque las graficas no se lleguen a hacer mas complejas en arquitectura para no robarle terreno a otros productos, o para no encarecerla fuera de la funcion que de momento es la principal (3D), pero en los nucleos nuevos seguro que se estrena microcodigo que venga a facilitar mas estos temas y a abrir nuevas posibilidades.

                    Salu2,

                    Ryzen 5 3600 - Tuf B550 pro - 2x 8g 3600c18 - Strix rtx 2060 - M2 1TB

                    WargreymonW 1 Respuesta Última respuesta Responder Citar 0
                    • jordiquiJ
                      jordiqui Veteranos HL @defaultuser
                      Última edición por

                      @defaultuser:

                      Algo me sonava a mi de haber leido que el superpi es un calculo con mucha interdependecia entre los resultados, un solo hilo que recurre a lo bestia a la cache del micro y a la ram, con lo que la grafica con muchos hilos pequenitos y sin caches parece ser que no estaria a la altura.

                      Quien sabe, si se va popularizando el aprovechamiento de la grafica para otras cosas, puede que les vayan implementando mas versatilidad, talvez una memoria intermedia, talvez la posibilidad de partir instrucciones y resolverlas en varios hilos.

                      Comparar CPU y GPU solo se puede en pruebas muy especificas y aun asi no sirve de referencia, son muy distintos, se puede comparar lo que tardarian en acabar un trabajo que los dos sean capaces de realizar, pero el Wprime por ejemplo igual no da una idea de lo que tardarian en recodificar un video u otros trabajos de interes.

                      Ahora encuentro una respuesta lógica a toda la rama
                      Gracias Default.;D

                      Cluster MPI de tres nodos formado por tres SERVIDORRES HP PROLIANT DL360P 1U 2X E5-2680V2 CPU'S, 20 cores, 40 hilos a una frecuencia base de 2,8GHz. 192 GB de memoria RAM DDR3 ECC (8 x módulos de16 GB 800Mhz)´+ 1U 2X E5.-2697 V2 a una frecuencia base de 2,8 Ghz 192 GB de Ram ECC (8 módulos de 16 Gb 800 mhz) 24 Cores 48 hilos ( 44c/88T)+ 1u 2xE5 2603v2 con una frecuencia base de 1,9ghz 64 Gb DDR3 ecc (4x módulos de 16)

                      hlbm signature

                      defaultuserD 1 Respuesta Última respuesta Responder Citar 0
                      • defaultuserD
                        defaultuser Veteranos HL @jordiqui
                        Última edición por

                        Hombre segun la gente del foro donde se inicia la noticia ya consiguen paralelizar el calculo entre algunos nucleos, pero entre cientos se ve que es un palizon. Ya veremos, de momento yo hasta que no vea funcionar algo …

                        Salu2.

                        Ryzen 5 3600 - Tuf B550 pro - 2x 8g 3600c18 - Strix rtx 2060 - M2 1TB

                        1 Respuesta Última respuesta Responder Citar 0
                        • WargreymonW
                          Wargreymon @defaultuser
                          Última edición por

                          @defaultuser:

                          Es natural pensar que aunque las graficas no se lleguen a hacer mas complejas en arquitectura para no robarle terreno a otros productos, o para no encarecerla fuera de la funcion que de momento es la principal (3D), pero en los nucleos nuevos seguro que se estrena microcodigo que venga a facilitar mas estos temas y a abrir nuevas posibilidades.

                          No se, yo creo que en el futuro mejoraran algo los shaders, pues actualmente esos procesadores tienen unidades muy simples. Las unidades ALU solamente son capaces de ejecutar cosas como SIN,COS, etc, y en el caso de las ATI solo un 1/5 de la cantidad total de ALUs puede hacer eso, nada que ver con las de las CPU.

                          Tal vez para juegos no haga falta más, eso si que no lo se, pero tener unidades más "amplias" si que ayudaría con CUDA y Stream seguramente.¿Puede que las nuevas gráficas tengan mejoras a ese nivel? Habrá que verlo jaja :D.

                          defaultuserD 1 Respuesta Última respuesta Responder Citar 0
                          • defaultuserD
                            defaultuser Veteranos HL @Wargreymon
                            Última edición por

                            No me he fijado como va AMD con este tema, pero como no escucho apenas hablar supongo que va algo retrasada.
                            Lo bueno seria como siempre que rivalizaran lo mas directamente posible en computacion en gpu, ya que entonces si que se espabilan en poner a punto la tecnologia lo antes posible.

                            Salu2.

                            Ryzen 5 3600 - Tuf B550 pro - 2x 8g 3600c18 - Strix rtx 2060 - M2 1TB

                            1 Respuesta Última respuesta Responder Citar 0
                            • 1
                            • 2
                            • 1 / 2
                            • First post
                              Last post

                            Foreros conectados [Conectados hoy]

                            1 usuarios activos (0 miembros e 1 invitados).
                            febesin, pAtO,

                            Estadísticas de Hardlimit

                            Los hardlimitianos han creado un total de 543.3k posts en 62.8k hilos.
                            Somos un total de 34.8k miembros registrados.
                            xenium_digital ha sido nuestro último fichaje.