¿Cómo convierto MHTML a HTML?

Si bien un archivo codificado en MHTML contiene partes que son código HTML puro, pueden surgir complicaciones al intentar convertir MHTML a HTML. Varios programas pueden leer archivos y formatos derivados MHTML o Extensiones de correo de Internet multipropósito (MIME) HyperText Markup Language (HTML), pero se requiere un tipo especial de programa para convertir y escribir el contenido del archivo en HTML. Pueden surgir problemas porque los datos digitales del sitio web están codificados dentro del archivo y reconstruir el sitio web con los enlaces correctos a toda la información localmente puede ser una tarea abrumadora. Existen programas para la mayoría de los sistemas operativos que permiten conversiones de MHTML a HTML, aunque el usuario puede requerir trabajo adicional.

El problema principal para convertir archivos de MHTML a HTML son los datos binarios que se escriben en el archivo. Los datos se guardan de una manera que permite que un navegador web lea y muestre el archivo MHTML, pero no facilita la conversión de ese mismo archivo. MHTML se almacena como una especie de código incrustado que utiliza diferentes variables para mantener organizadas las ubicaciones de los archivos digitales. La información binaria, como una imagen que está en línea, se almacena en el sitio web original con enlaces a las ubicaciones en línea. Esta información se elimina y se traduce en variables locales con archivos MHTML, lo que dificulta hacer coincidir los medios binarios con su ubicación y formato adecuados dentro del documento HTML.

Hay pocos programas disponibles que puedan convertir MHTML a HTML. Hay complementos y otros complementos que pueden permitir que un programa cargue, edite y luego vuelva a guardar el archivo en MHTML, pero solo hay un puñado de programas independientes que intentarán convertirlo a HTML. Con frecuencia, estos programas requieren que el usuario mire el código para determinar dónde deben colocarse los archivos binarios en el código, lo que les permite reconstruir la página a partir del archivo.

No todas las páginas web se pueden guardar con precisión como un archivo MHTML. Una variedad de formatos complejos que se pueden incrustar como medios en un sitio web no se guardarán correctamente, en todo caso. Esto incluye subprogramas de Java®, transmisión de medios y muchos scripts que dependen de otros archivos en el servidor a los que la computadora de navegación no tiene acceso.

La forma más efectiva de convertir MHTML a HTML es encontrar programas independientes y complementos que convertirán gradualmente los archivos de un formato a otro y, finalmente, posiblemente a HTML. Ciertos sistemas operativos ni siquiera tienen soporte para archivos MHTML dentro de sus propios navegadores. A falta de todo lo demás, es posible decodificar manualmente la información binaria MIME en el archivo a mano con un decodificador base 64, extraer solo el HTML e intentar reconstruir manualmente el sitio web contenido en el archivo, pero este proceso sería muy laborioso.