Banco de pruebas Hardlimit
-
@kynes dijo en Banco de pruebas Hardlimit:
Con 128 hilos creo que tengo el record mundial en multihilo:
Bueno, y si no lo tengo, lo pruebo en 256 hilos a ver qué pasa
Ahí ha fallado la sincronización. Básicamente estás pasando un puñado de hilos en tiempos diferentes y se están sumando las puntuaciones como si se hubieran pasado todos a la vez.
-
Algunas conclusiones que saco de esto:
-
Cuando el banco de pruebas se ejecuta con una cantidad 4 veces superior al número de hilos del procesador, el programa falla y da resultados absurdos. Esto no me preocupa porque va a estar limitado al doble de hilos.
-
Cuando se ejecuta una cantidad superior al número de hilos del procesador (pero por debajo de una cantidad absurda), se suelen producir espurios en la primera muestra. Aquí resultados al doble de hilos de tres modelos diferentes:
Core i7-6820HQ
Pentium N3540
Core i5-7300HQ
Que esto suceda en tres modelos diferentes, deja claro que es un comportamiento generalizado. Curiosamente, estos picos se ven en los tests#1, 2 y 4, pero no en el 3. Que no se reproduzca ese comportamiento en el 3, hace que me resulte complicando pensar en un fallo del programa, pero no se puede descartar todavía.
A continuación, los mismos modelos con un número de hilos igual a los de la CPU:
Core i7-6820HQ
Pentium N3540
Core i5-7300HQ
Si hay picos, son prácticamente inapreciables.
- En los i5 e i7, se aprecia una mejora sostenida durante toda la prueba. Aquí sólo hay dos opciones: que se esté acaparando una mayor cantidad de CPU o que se esté aprovechando mejor la segmentación. En el caso del Core i7-6820HQ, es un PC con bastantes programas en segundo plano junto a un antivirus. El Pentium N3540 lleva Windows 10 sin más, sin nada en segundo plano y sin antivirus. Quizás por esto, el duplicar el número de hilos no mejora el rendimiento de una forma sostenida.
En general
Lo que distorsiona el resultado mostrado en el programa con el doble de hilos es el pico inicial. El problema es que no sé por qué se produce. Si fuera el programa, esperaría un pico en todos los tests o un pico al principio y otro al final, pero no se produce así. ¿Puede ser una jugarreta de la caché? La verdad es que ni idea. Pero raro es y al programa habrá que darle un repaso.
-
-
¿Y por qué no quitamos la opción de especificar nº de hilos y forzamos a que siempre corra con el nº de núcleos de que disponga la CPU? Lo digo para evitar diferencias innecesarias entre usuarios.
-
@krampak Inicialmente, la razón de tener la libertad de especificar el número de hilos fue por si fallaba la detección del HT/SMT. De momento, eso no ha pasado ninguna vez. Así que por ahí, no hay razones para mantenerlo.
Desde el punto de vista de medir el rendimiento de un procesador, elegir el número de hilos sirve para ver cómo rinde un micro a media carga, algo que sería bastante interesante de cara a evaluar procesadores a media carga, que en realidad es como se usan buena parte del tiempo. Pero si ya es difícil recibir validaciones con la configuración por defecto, mucho más lo es con configuraciones un poco exóticas.
Aquí una solución, como dices, es, o bien quitar la posibilidad de elegir el número de hilos o quizás limitar el máximo al número de hilos del procesador para dejar abierta esa posibilidad.
Otra posibilidad (que es complementaria) es hacer una media truncada, algo que se acabará aplicando porque eso corregiría todos los resultados que se han enviado hasta ahora.
Y otra posibilidad es ignorar directamente la primera muestra; una solución sencilla pero poco elegante.
El método sobre cómo calcular la puntuación final es algo a lo que llevo tiempo dándole vueltas (de ahí que el programa y la central usen criterios diferentes). La media truncada es la que lleva las de ganar porque evita este tipo de problemas de origen desconocido y porque filtra el resultado en PCs con carga moderada de fondo.
El banco de pruebas tiene varios mecanismos para evitar trucar resultados y en el inicio del desarrollo, fue la parte a la que se le dedicó más horas. Afortunadamente, este fallo tiene solución con carácter retroactivo. Una cosa clara es que uno de los objetivos es que se mida el rendimiento real de la máquina, sin que una configuración determinada del programa ofrezca una superioridad de rendimiento que no existe.
Esto último lo digo para que quede claro que este no es un fallo baladí y que se va a solucionar. Hasta entonces, sigo abierto a sugerencias.
-
A ver si lo he entendido bien: el programa ejecutado por defecto muestra resultados fiables, pero al ajustar el parámetro de cuántos hilos queremos que use, es propenso a mostrar resultados "inusuales"...
Si es así, personalmente sólo dejaría validar los resultados obtenidos por defecto, al menos hasta que se solvente la incidencia... sólo nos faltaba un ejército de pollagorders haciéndose trampas al solitario y de paso, adulterando la clasificación (ésto para mí es lo más grave, al fin y al cabo, creo que lo que se pretende es que la tabla sea fiable).
La opción de elegir el número de hilos se puede mantener, avisando que puede dar resultados erroneos y que no sirven de manera "oficial", para los que les guste el cacharreo.
-
Seguramente, para mañana o pasado (a partir de ahí, lo que tarden en certificar los de Microsoft) esté lista la versión 1.4, que vendrá con el tema de las puntuaciones falseadas solucionado entre otros cambios.
Si alguno tenéis algún procesador actual y potente, me vendría bien una captura de la pestaña CPU para ponerla en la página de la Store, que por aquí sólo tengo PCs un poco viejunos.
-
Esto es lo más potente que tengo en mi casa, no sé si es lo que buscas.
-
@whoololon Gracias por la imagen. Al final no la he puesto porque parece que está muy comprimida y no se ve bien en la Store.
Sobre el programa, ya está disponible la versión 1.4. Los detalles los tenéis en el primer mensaje de este hilo. En esencia, entre otras cosas se ha corregido el tema de las puntuaciones falseadas y se han hecho algunos cambios en la interfaz.
De momento, se sigue pudiendo elegir el doble de hilos de los máximos del procesador sólo en modelos sin HT/SMT.
-
Muy chula la última versión !! se ve más profesional y se nota muchísimo el reducido tiempo de carga.
-
Y para celebrarlo, lo inauguramos con un radiante i3-3120M.
Edito: Por cierto, sigue saltando el Smart Screen, al menos en W8.1.
-
@krampak dijo en Banco de pruebas Hardlimit:
Muy chula la última versión !! se ve más profesional y se nota muchísimo el reducido tiempo de carga.
Gracias. Me alegra que se aprecie la diferencia en el arranque.
@whoololon dijo en Banco de pruebas Hardlimit:
Y para celebrarlo, lo inauguramos con un radiante i3-3120M.
Edito: Por cierto, sigue saltando el Smart Screen, al menos en W8.1.
Perfecto, hacía tiempo que no entraba nada nuevo.
Lo del Smart Screen también sigue pasando en Windows 10. La verdad es que está tardando más de lo que he leído por ahí. Quizás todavía no se ha descargado las veces suficientes o puede que al final sí que sea importante descargarlo desde Internet Explorer o Edge. Espero que en los próximos días acabe desapareciendo.
-
Nuevo micro
[url=https://bm.hardlimit.com/result.php?bm=0f38c8bc44c5faeaa7a1f2038f2a2b492134] [img]https://bm.hardlimit.com/screenshot.php?bm=0f38c8bc44c5faeaa7a1f2038f2a2b492134&style=1[/img] [/url]
https://bm.hardlimit.com/screenshot.php?bm=0f38c8bc44c5faeaa7a1f2038f2a2b492134
-
@Xevipiu ¿Es una muestra de ingeniería? ¿Quizás de un Core i9-9900K/S?
-
@cobito dijo en Banco de pruebas Hardlimit:
@Xevipiu ¿Es una muestra de ingeniería? ¿Quizás de un Core i9-9900K/S?
No, es de un serie 10º Gen, de un i9 10980HK, capado, pero se defiende
-
@Xevipiu dijo en Banco de pruebas Hardlimit:
@cobito dijo en Banco de pruebas Hardlimit:
@Xevipiu ¿Es una muestra de ingeniería? ¿Quizás de un Core i9-9900K/S?
No, es de un serie 10º Gen, de un i9 10980HK, capado, pero se defiende
Ok, me había despistado la firma ya que el tuyo devuelve 906ED de los que todos son Coffee Lakes.
En realidad tiene sentido según los resultados porque le saca un 15-20% al Core i9-9900K en multihilo.
Queda en muy buena posición en monohilo. Si se quita el test de memoria (donde los Zen 2 suelen quedar bien situados) quedaría el primero del ranking monohilo.
-
@cobito dijo en Banco de pruebas Hardlimit:
@Xevipiu dijo en Banco de pruebas Hardlimit:
@cobito dijo en Banco de pruebas Hardlimit:
@Xevipiu ¿Es una muestra de ingeniería? ¿Quizás de un Core i9-9900K/S?
No, es de un serie 10º Gen, de un i9 10980HK, capado, pero se defiende
Ok, me había despistado la firma ya que el tuyo devuelve 906ED de los que todos son Coffee Lakes.
En realidad tiene sentido según los resultados porque le saca un 15-20% al Core i9-9900K en multihilo.
Queda en muy buena posición en monohilo. Si se quita el test de memoria (donde los Zen 2 suelen quedar bien situados) quedaría el primero del ranking monohilo.
Piensa que el tema memorias voy capado a 2140 o 2400mhz, es un gran handican, los ZEN o los mismos 9900k me machacan
Aqui tienes la familia de micro-code´s de procesadores "ES", para tu base de datos
-
Acaba de publicarse la versión 1.5.0 del programa que viene principalmente con cambios sobre la información relacionada con la memoria:
· Ahora detecta "factor de forma" de memoria integrada en encapsulado de procesador (SoC).
· Ahora detecta tipos de memoria HBM, HBM2, DDR5 y LPDDR5.
· Se ha corregido un fallo que hacía que bajo ciertas configuraciones de memoria, no se mostrara en el programa la información del tipo de memoria, factor de forma ni frecuencia.
· Ahora se muestra en el programa la marca y número de parte de la memoria.
· *También se envía la marca y número de parte de la memoria RAM en el proceso de validación.
· *Además se envía también en la validación el repertorio de instrucciones disponible junto a detección de hypervisor (ejecución sobre máquina virtual).*Las informaciones relacionadas con la memoria y el repertorio de instrucciones disponible se mostrarán en la central próximamente. Esto además dará pie a la creación de una base de datos de memorias junto a los resultados del test de memoria. Sobre la detección de uso de hypervisor, próximamente los resultados enviados desde una máquina virtual se descartarán para el cálculo de estadísticas.
De momento está disponible el ejecutable y en las próximas horas será posible su descarga/actualización desde la Microsoft Store.
Como de costumbre, si véis algo raro, no dudéis en comentarlo.
-
Parece que hemos estado más de un mes con la base de datos del banco de pruebas bloqueada y, por lo tanto, sin recibir validaciones durante este periodo. Desde ayer, el sistema de validaciones vuelve a estar operativo.
-
Se han añadido histogramas en la página de resultados validados. Ahora, cuando valides tu resultado, si hay más de 5 validaciones en el modo en cuestión, aparecerá un histograma por test donde se ve la frecuencia en que se repiten las puntiaciones en una serie de rangos. También se indica en qué rango se encuentra tu resultado. Ejemplo. Tardan un poco en cargar y todavía habrá que corregir un par de cosillas, pero para la mayoría de casos, funcionan correctamente.
Además se añaden Zen 3, Tiger Lake y Rocket Lake a la lista de arquitecturas, por lo que ahora es posible ver los rankings de las CPUs que hemos recibido de dichas arquitecturas.
-
La central extiende sus tentáculos al mundo de las placas base. En el menú ahora está la lista de placas base ordenadas por socket. Dentro de la lista, se clasifican por chipset. Además, en la ficha de cada procesador, sale una lista de placas base donde se ha probado dicho micro.