Esta semana estrenamos la primera fase del navegador de archivos. Todos los archivos de casi todos los discos están ya indexados y son navegables. Se han quedado en el tintero un par de MDF/MDS de la Micromanía que no hay forma de extraerlos a pesar de que sí es posible la mayoría de MDF/MDS.
Aquí tenéis un disco donde, además de aparecer la información que ya se anunció, ahora incluye la lista de archivos y carpeta navegables.
Además del explorador de archivos, es posible ver información detallada de cada archivo junto a duplicaciones, es decir, archivos que podrían tener nombres, fechas y otros atributos distintos pero cuyo contenido es el mismo. La información que se muestra es la siguiente:
- Nombre del archivo en el medio y ruta actuales.
- Fecha de creación original en el medio.
- Tamaño en formato ISO/IEC 80000-13 binario.
- El tipo de contenido de forma descriptiva (de aquí para la mayoría todavía no saldrá informació; ya se irá añadiendo).
- Tipo de MIME (no es 100% preciso, pero casi).
- Una descripción más detallada del contenido del archivo, por ejemplo, si es un ejecutable autoextraible, se dan detalles del contenido encapsulado.
- Una firma MD5
- Una firma SHA256
Aquí un ejemplo de pkunzip.exe que es un archivo bastante popular.
En esta primera fase, ha sido un reto el poder determinar el conjunto de caracteres del sistema de archivos. Unas veces se usa UTF-8, otras veces se usa CP850 y hay por ahí un par de imágenes que tienen pinta que salieron mal de origen por algún fallo en el software de creación (según parece, no era raro en los 90). En cualquier caso, los nombres de los archivos se muestran correctamente con sus eñes, acentos y demás independientemente del formato original.
Tenemos 570.000 archivos. Esto viene de los medios de las cinco publicaciones que tenemos de momento, que se están usando como referencia para todo el desarrollo antes de añadir mucho más.
También se ha comenzado con la segunda fase del navegador, que consiste en extraer todos los archivos extraibles. Y de los extraidos, repetir la operación recursivamente. En estos momentos somos compatibles con mas de 70 formatos de comprimidos de todas las épocas que se determinan por heurística, no por extensión ni por número mágico, lo cual evita que ningún archivo compatible se escape. Sobre esto, cuando esté pulida esta primera versión del extractor, se pondrá en producción. Con el tiempo, se irán añadiendo más formatos pero de momento nos quedamos con esos 70-80 para priorizar otros aspectos.
En otro orden de cosas, se ha hecho un cambio en la configuración de v86 que hace que la respuesta de las máquinas virtuales sea ahora mucho más rápida (ejemplo). Era algo que yo no notaba por ir en local, pero ahora que todo el tráfico para por un VPS, me doy cuenta de detalles de rendimiento mejorables (dependientes de la latencia).
Y para terminar, se ha corregido la algoritmia detrás del nuevo sistema de traducción de páginas haciendo que ahora se rendericen las páginas mucho más rápido (esto afecta tanto al museo como al banco de pruebas). Este cambio, además, ha dejado de romper ciertas funciones como la lupa en las revistas y la captura del puntero del ratón en las virtualizaciones.

