Comprobación de un PDF accesible
Recordar que los Documentos en portable document format conocido por sus siglas PDF:
- Deben ser accesibles y compatibles con tecnologías de apoyo como los lectores de pantalla.
- No hay que abusar del uso de PDF para proporcionar información, y en su lugar, utilizar formatos como (X)HTML+CSS (páginas web).
Una vez que nos hemos asegurado desde MS Office u otra suite ofimática que hemos generado un PDF accesible, ¿debemos realizar algo más sobre el archivo?
Nuevo problema:
Ciertas características del documento PDF no se definen durante el proceso de generación del PDF, como por ejemplo la identificación del idioma principal del documento, orden de lectura y oras características que veremos a continuación sin profundizar:
Del documento exportado a PDF, si que hemos debido tomar las siguientes medidas:
- Proporcionar texto alternativo para elementos no textuales.
- Especificar claramente el destino de los enlaces.
- Usar elementos estructurales y aplicarles estilos en lugar de modificar visualmente el texto directamente.
- Asegurarse de que toda la información disponible con color también lo esté si el color no está disponible.
- Aplicar suficiente contraste al documento.
Esto es breve resumen de lo visto anteriormente.
Una característica fundamental de un PDF accesible es que sea un PDF etiquetado.
Un PDF etiquetado es una versión de documento que incluye tanto su contenido como información sobre su estructura lógica y el orden de lectura, asegurando que los lectores de pantalla puedan interpretarlo correctamente. Para crear un documento adecuadamente etiquetado, se deben utilizar elementos estructurales como encabezados, pies de página, títulos y listas.
La estructura de un documento etiquetado se representa mediante una estructura lógica en los metadatos en un código conocido como XMP.
Extensible Metadata Platform (XMP) (conocida en español como Plataforma Extensible de Metadatos) es un tipo de lenguaje especificado extensible de marcado (eXtensible Markup Language) usado en los archivos PDF (Portable Document Format - Formato de Documento Portable), fotografía y en aplicaciones de retoque fotográfico. Fue introducido en un principio por Adobe System en abril del 2001 como parte de la versión 5.0 del producto Adobe Acrobat.
Wikipedia, artículo sobre el protocolo XMP
Este lenguaje de marcas se traduce en español como de etiquetas. Las páginas web utilizan un lenguaje conocido como HTML, otro lenguaje de marcado. Y tienen muchas similitudes. Por ejemplo, un título o encabezado de un epígrafe de un texto se marca con una etiqueta del tipo
o que coinciden en ambos lenguajes informáticos.
La estructura de una página de un PDF se representa como un árbol jerárquico de nodos. Cada nodo en este árbol representa un elemento de la página, como un párrafo o una imagen, o un elemento de nivel superior, como una sección o capítulo, que agrupa otros elementos. La etiqueta indica el tipo de elemento que representa cada nodo.
Los documentos PDF etiquetados se pueden crear a partir de documentos de texto, aplicaciones de edición y maquetación, o mediante herramientas de accesibilidad.
Tenemos entonces que repasar estos puntos:
Imágenes, tablas u otros objetos sin texto alternativo:
Si el documento fuente contiene imágenes, tablas u otro tipo de objetos distintos a texto sin textos alternativos, el PDF resultante será inaccesible.
Orden Lógico de Lectura:
Es necesario especificar un orden lógico de lectura en documentos PDF etiquetados para que los lectores de pantalla puedan leer la información de manera eficiente. En principio, la escritura natural del documento respeta ese orden en cualquier programa ofimático. Al exportar a PDF suele fallar en encabezados y pies con lo que es otra razón para no incluir información trascendente ahí, o cuando creamos estilos fuera del orden de lectura natural por cualquier razón. Es muy difícil de corregir sin herramientas profesionales de edición de PDF.
Idioma del documento:
Especificar el idioma del documento para que los lectores de pantalla lo detecten y lean correctamente.
Campos de formulario:
Si el documento PDF contiene campos de formulario, es necesario proporcionar etiquetas a cada campo que describan cuál es su función y proporcionen la información necesaria para cumplimentarlos de forma satisfactoria (indicando campos obligatorios, restricciones en cuanto al formato, etc.).
Títulos de los epígrafes que respeten la jerarquía:
Los títulos o encabezados bien jerarquizados marcan la estructura del documento y van a ser la referencia para el marcado. Por eso al exportar desde Word a PDF se escogía que se hiciese guardando las etiquetas del mismo. Para eso, hemos tenido que respetar que el título principal sea de estilo Título 1, por debajo el siguiente sea Título 2, por debajo este un Título 3, y así seguido cada nivel de profundidad. Al generar el PDF accesible se tienen que generar etiquetas
, , , etcétera.
, etcétera.
Una primera comprobación de que un PDF puede ser accesible es comprobar en el lector de PDF que esa estructura se ha creado y que puede utilizarse como un índice para navegar por el documento de la manera más provechosa por la persona usuaria. Otra manera es utilizar el teclado.