La fase 3A está en proceso a la vez que ha entrado en producción (todavía queda mucho que procesar, pero eso es ya automático). Para la visualización se están usando formatos normalizados y libres. La idea es que, independientemente del formato original, se pueda ver en cualquier navegador, porque uno de los problemas de los archivos antiguos es que muchas veces dejan de ser reproducibles por problemas de codec/formatos/algoritmos. Los formatos elegidos son: VP9 para video, OPUS para audio y WebP para imagen.
Se pueden visualizar desde el navegador los siguientes tipos de archivos:
Imágenes, vídeos y audios
Estos tres tipos de "media" se están sacando por heurística. Eso quiere decir que están saliendo una gran cantidad de imágenes, videos y audios incluso de archivos que no son identificables como tales. En el caso de las imágenes, se muestra además bastante metainformación. Con el tiempo, se irán añadiendo las metainformaciones a videos y audios y es posible que se muestran histogramas de color en imágenes (esta información ya se está capturando; sólo queda mostrarla).
Por su parte, a las imágenes se les pasa OCR. Si el texto está lo suficientemente definido, los resultados no están mal. Se usará en el futuro para buscar textos en imágenes aunque desde ya, se muestra el OCR cuando se visita la imagen.
Ejemplo 1 de imagen
Ejemplo 2 de imagen (ejemplo representativo de OCR)
MIDIs
Los midis vienen en seis sabores (ni más ni menos). Se han renderizado en:
- OPL2 (sintetizador).
- OPL3 (sintetizador).
- Gravis UltraSound (pats oficiales).
- Roland MT-32 (roms oficiales).
- FluidR3 (soundfont moderna).
- ToH (soundfont moderna).
En algunos casos, no ha sido posible sacar MT-32, GUS y/o ToH. Muchos MIDIs antiguos están mal formados, no siguen el estándar, etc.
Ejemplo de MIDI
Ejemplo 2 de MIDI
MODs
Se están renderizando para que cumplan lo más posible con el Paula de Amiga gracias a OpenMPT. Inicialmente se iban a ofrecer varias versiones, pero aquí el panorama es más sombrío y parece que todos los esfuerzos se centran en esta implementación. Aquí también se están escaneando los archivos por heurística y la verdad es que están saliendo cosas la mar de interesantes, como archivos PSM que eran una especie de MODs de Epic que se usaban en cosas como su Pinball o en Jazz Jackrabbit (he tenido que buscar qué es esto porque no tenía ni idea que existía).
Ejemplo de PSM de Jazz JackRabbit
Otro PSM de Silver Pinball (precursor del Pinball de Epic Megagames)
MOD normal
Otro MOD
Navegador de archivos
En otro orden de cosas, cuando accedéis a cualquier carpeta, se muestra una selección de todos estos archivos que abarcan la carpeta actual y todas las subcarpetas superiores (sale máximo 6 archivos por tipo). Conforme vais navegando por las carpetas, se van acotando los "media" mostrados. Y si hacéis clic a un archivo visualizable, se muestra toda la información junto a la visualización. Lo que sale, sale en orden de "importancia" y la importancia consiste en cantidad de pixels en imágenes y duración en el resto.
El procesado es lento (vamos por el 2%). Todavía va por los primeros medios de la lista. Aquí tenéis un ejemplo:
Directorio raíz de la PCMania 21
Además, es posible ver todos los archivos de un tipo concreto desde el directorio actual. Por ejemplo, aquí están todas imágenes de PCMania 27.
Para terminar, se han empezado a mostrar iconos al lado de archivos y carpetas para que sean mejor identificables. Todavía quedan muchos, pero ya se irán añadiendo. Para esto, se están usando caracteres Unicode ya que me estoy aficionando a la normalización de formatos y codificaciones.
Hay una cosilla: esto se supone que es un buscador de archivos. Pero he ido a buscar unos cuantos archivos para ponerlos en este hilo como ejemplo y resulta que se me ha olvidado implementar el buscador y no me he dado cuenta hasta ahora. Así que eso intentaré tenerlo próximamente.
La fase3b consiste en hacer esto mismo con documentos: txt, rtf, wp5.1, pdfs, docs, etc, etc, etc. Pero esto se dejará para bastante más adelante.