En una conversación de hace algunos días, me pedían unos documentos que estaban originalmente en formato DOCX, convertidos en algo así como un “formato no propietario”. Me resultó curioso, por lo que aprovecharé este espacio para aclarar algunos conceptos.
Empezamos por lo que es DOCX, el formato de documentos con el que guarda por defecto Word 2007 y posteriores, en contraposición a DOC, que era el tipo por defecto para Microsoft Word desde la versión 1.0 de 1983, y que sufrió diferentes revisiones a lo largo del tiempo, a pesar de conservar la misma extensión.
¿Qué es un formato propietario?, pues Wikipedia lo define muy bien: Un formato propietario o cerrado es un formato de archivo protegido por una patente o derechos de autor. Tales restricciones típicamente intentan prevenir la ingeniería inversa; si bien la ingeniería inversa en los formatos de archivo con propósitos de interoperabilidad generalmente es legal, según la creencia de quienes la practican. Las posiciones legales difieren conforme al país, entre otras cosas, en lo que se refiere a las patentes de software.
Sin embargo, DOCX, al pertenecer a la famila de formatos de Office Open XML, es en realidad un formato abierto. Es decir, su definición, diseño, estructura y capacidades están documentadas, y puede ser usado por terceros sin restricciones legales. Ello permite que desarrolladores ajenos a Microsoft como Softmaker con su Office, Apache con su OpenOffice, o LibreOffice, sean capaces de leer y escribir esos archivos.
El formato Office Open XML, no deja de ser un archivo ZIP, que contiene archivos XML, y esquemas, como podemos observar, todo muy abierto. Probablemente la confusión venga dada por el hecho que a pesar de ser abiertos en cuanto a especificaciones, lógicamente su implementación no lo es. Word es un software comercial, y además de código cerrado, pero eso no quita que en base a esas especificaciones públicas, pueda tratarse con el formato, que es en todo caso abierto.
Es un caso parecido a ZIP, o HTML, donde la especificación es abierta, pero la implementación original puede no serla.