Guia d'accessibilitat de PDF: etiquetes i PDF/UA

Els PDF són el problema silenciós d’accessibilitat dins de gairebé totes les organitzacions. Els llocs web s’auditen, es redissenyen i es proven amb lectors de pantalla — però l’informe anual, el document de polítiques, l’estat de prestacions i el formulari de sol·licitud que viuen darrere d’un enllaç de descàrrega massa sovint es publiquen exactament tal com van sortir del quadre de diàleg d’exportació. Per a un lector vident semblen polits. Per a algú que utilitza un lector de pantalla, un magnificador o navegació només amb teclat, aquest mateix fitxer pot ser un mur impenetrable: cap encapçalament per saltar, imatges sense descripció, taules que es llegeixen com un flux d’absurd de números, i camps de formulari que no es poden emplenar en absolut.

Aquesta guia explica per què els PDF són tan sovint inaccessibles i què fa que un sigui realment utilitzable per la tecnologia d’assistència. Cobreix els blocs estructurals — etiquetes, ordre de lectura, text alternatiu, taules, formularis i metadades — i els estàndards que els regeixen: la WCAG 2.2 i el PDF/UA, l’especificació ISO 14289 per a PDF etiquetats accessibles. Al llarg de tot, l’objectiu és el que QualiBooth aplica a cada document que toquem: un fitxer que funcioni a la pràctica, confirmat amb tecnologia d’assistència real, no només beneït per un verificador automàtic.

Per què els PDF són tan sovint inaccessibles

Un PDF és, en essència, una descripció de com pintar marques en una pàgina. El format es va dissenyar per preservar la fidelitat visual — per fer que un document tingui un aspecte idèntic en qualsevol pantalla o impressora. Aquest objectiu de disseny és exactament el que fa difícil l’accessibilitat. La fidelitat visual no us diu res sobre el significat. Una línia de text en negreta de 18 punts sembla un encapçalament a l’ull humà, però llevat que el fitxer registri explícitament «això és un encapçalament», la tecnologia d’assistència no té cap manera de saber que és res més que uns glifs més grans.

La majoria dels PDF en circulació estan sense etiquetar. Contenen el contingut visual però res de l’estructura subjacent — cap informació sobre què és un encapçalament, un paràgraf, una llista, una taula o una imatge. Un lector de pantalla davant d’un PDF sense etiquetar o bé es nega a llegir-lo de manera significativa o bé recorre a les conjectures, inferint un ordre de lectura a partir de la posició de les marques a la pàgina. Els resultats van des de maldestres fins a inutilitzables: un butlletí de dues columnes llegit de dret a dret per ambdues columnes, un peu de foto llegit abans del paràgraf al qual pertany, o notes a peu de pàgina que interrompen la meitat d’una frase.

Diversos hàbits de producció habituals empitjoren les coses:

Documents escanejats. Un escaneig és només una imatge d’una pàgina. Sense reconeixement òptic de caràcters (OCR), no hi ha cap text real en absolut — res per llegir, cercar o seleccionar.
Exportacions que perden l’estructura. Moltes vies de «Desa com a PDF» i «Imprimeix a PDF» descarten l’estructura d’encapçalaments i llistes que existia al document d’origen.
Maquetacions d’eines de disseny. Els fitxers creats amb programari de maquetació de pàgines poden tenir pàgines visualment correctes l’ordre d’objectes subjacent de les quals no té cap relació amb la seqüència de lectura prevista.
Desordre decoratiu. Les imatges de fons, les regles i els ornaments s’exposen a la tecnologia d’assistència i s’anuncien com si tinguessin significat.

Res d’això és visible a la pantalla, que és precisament per què el problema persisteix. La solució és afegir la capa estructural que el format deixa opcional — la feina de la correcció de PDF.

Etiquetes i estructura del document

Les etiquetes són el fonament d’un PDF accessible. Un PDF etiquetat porta una jerarquia oculta — l’arbre d’estructura — que es troba al costat del contingut visual i descriu què és realment cada part de la pàgina. Això és directament anàleg a l’HTML semàntic darrere d’una pàgina web ben construïda: on l’HTML utilitza <h1>, <p>, <ul> i <table>, un PDF etiquetat utilitza elements d’estructura com <H1>, <P>, <L> (llista) i <Table>.

L’arbre d’etiquetes és el que dona a la tecnologia d’assistència alguna cosa per navegar. Amb ell en el seu lloc, un lector de pantalla pot fer les coses en què confien els seus usuaris:

Saltar per encapçalament. Els usuaris es mouen per un document llarg d’encapçalament a encapçalament en lloc d’escoltar cada paraula en seqüència. Això requereix etiquetes d’encapçalament reals (<H1> fins a <H6>) aplicades en un ordre lògic i niat — sense saltar mai nivells, sense fingir mai un encapçalament posant en negreta un paràgraf.
Comprendre les llistes. Una etiqueta <L> amb els seus elements <LI> indica al lector de pantalla «això és una llista de cinc elements», de manera que l’usuari sap on és i quant queda.
Distingir el contingut de la decoració. El contingut genuí s’etiqueta; les marques purament decoratives es designen com a artefactes perquè s’ometin completament.

Una estructura d’encapçalaments correcta i lògicament niada és l’única cosa de més impacte que podeu encertar en un PDF, perquè transforma una experiència d’escolta lineal en una de navegable. Equivocar-se — o ometre-la — és un dels problemes d’accessibilitat habituals que surten una vegada i una altra en les auditories de documents.

Ordre de lectura

Les etiquetes diuen què és cada element. L’ordre de lectura diu en quina seqüència es presenten aquests elements a algú que no pot veure la pàgina. Tots dos estan relacionats però són diferents, i l’ordre de lectura és on molts PDF altrament ben etiquetats fallen.

Un lector de pantalla anuncia el contingut en l’ordre definit per l’estructura del document, no en l’ordre en què les marques resulten estar al fitxer. En un document d’una sola columna, tots dos solen alinear-se. En qualsevol cosa més complexa — maquetacions de múltiples columnes, barres laterals, cites destacades, peus de foto, text que envolta una imatge — sovint divergeixen. L’ull visual reordena el contingut sense esforç; la tecnologia d’assistència segueix l’ordre que se li dona, i si aquest ordre és incorrecte el significat s’esfondra.

Un bon ordre de lectura significa que el contingut s’anuncia en la seqüència que un lector vident seguiria naturalment: el titular abans del cos, la introducció abans de la barra lateral, un peu de foto després de la figura que descriu. Establir-lo correctament és un judici manual sobre com s’ha de llegir el document, que és per què les eines automàtiques per si soles no ho poden garantir. És un dels lliuraments fonamentals de la correcció de PDF professional, i una de les primeres coses que comproven els verificadors experimentats.

Text alternatiu per a imatges

Cada imatge que transmet informació necessita un equivalent de text perquè es pugui descriure a les persones que no la poden veure. Els principis són els mateixos que per al web, aplicats a través de les etiquetes PDF.

Imatges informatives — gràfics, diagrames, fotografies que transmeten significat, infografies — necessiten un text alternatiu concís i precís que comuniqui la mateixa informació que la imatge. Per a un gràfic, això sovint significa resumir la conclusió («Els ingressos van créixer un 12% interanual») en lloc de descriure el visual («un gràfic de barres en blau»).
Imatges complexes — un diagrama de procés detallat o una figura amb molta densitat de dades — poden necessitar tant un text alternatiu curt com una descripció més llarga, o les dades subjacents presentades de forma accessible en algun altre lloc del document.
Imatges decoratives — vores, textures de fons, separadors ornamentals, un logotip repetit en un peu de pàgina — s’haurien de marcar com a artefactes perquè la tecnologia d’assistència els ometi. Forçar un lector de pantalla a anunciar «imatge, imatge, imatge» per a la decoració és per si mateix un fracàs d’accessibilitat.
Text dins d’imatges — un gràfic d’una cita, una capçalera de carta escanejada, una imatge de botó amb una etiqueta — ha de tenir aquest text capturat, ja sigui com a text alternatiu o, millor, com a text real seleccionable.

Escriure un bon text alternatiu és una tasca de contingut, no tècnica. Requereix entendre per a què serveix la imatge en el seu context — la mateixa habilitat que el nostre equip de consultoria d’accessibilitat aporta al contingut web.

Taules accessibles

Les taules són on l’accessibilitat de PDF es torna genuïnament difícil, i on les exportacions automàtiques fallen més sovint. Una taula de dades comunica significat mitjançant la relació entre una cel·la i els encapçalaments de la seva fila i columna. Els lectors vidents reconstrueixen aquestes relacions visualment mirant cap amunt i cap a l’esquerra. Un usuari de lector de pantalla no pot — depèn que la taula estigui marcada de manera que les associacions d’encapçalament siguin explícites.

Una taula PDF accessible necessita:

Una estructura <Table> adequada que contingui <TR> (files), <TH> (cel·les d’encapçalament) i <TD> (cel·les de dades), en lloc d’una graella solta de text col·locat perquè sembli una taula.
Cel·les d’encapçalament identificades correctament, amb àmbit (fila o columna) on la maquetació de la taula ho requereixi, de manera que mentre un usuari es mou per les dades els encapçalaments rellevants es tornin a anunciar («T3, Ingressos, 1,2 milions»).
Una gestió sensata de les cel·les fusionades o expandides, que compliquen les relacions d’encapçalament i sovint confonen les eines automàtiques.

Un antipatró habitual és la taula de maquetació — una graella utilitzada purament per posicionar contingut visualment, sense relacions de dades reals. Les taules de maquetació no s’haurien d’etiquetar com a taules en absolut, perquè fer-ho obliga la tecnologia d’assistència a anunciar files i columnes fantasma. Distingir una taula de dades d’un artefacte de maquetació, i després codificar les relacions correctes, és una feina manual detallada que es beneficia enormement de la revisió per part de persones que realment utilitzen lectors de pantalla cada dia.

Formularis PDF accessibles

Els formularis són els documents amb més en joc que publica una organització, perquè són transaccionals: una sol·licitud, una reclamació, un consentiment, un registre. Si un formulari PDF no es pot completar amb tecnologia d’assistència, la persona no només s’incomoda — queda exclosa d’un servei.

Un formulari PDF accessible requereix:

Camps etiquetats. Cada camp — entrada de text, casella de selecció, botó d’opció, menú desplegable — necessita un nom accessible (una descripció emergent/etiqueta en termes de PDF) perquè un lector de pantalla anunciï per a què serveix el camp, no només «edita text».
Ordre de tabulació lògic. Els usuaris de teclat es mouen pels camps amb Tab. L’ordre de tabulació ha de seguir el flux visual i lògic del formulari, no l’ordre en què es van afegir els camps a l’editor.
Controls agrupats. Els botons d’opció i les caselles de selecció relacionats s’haurien d’agrupar perquè la seva pregunta compartida s’anunciï una vegada i les opcions s’entenguin com un conjunt.
Camps obligatoris i instruccions. Els camps obligatoris, els requisits de format i la guia d’errors s’han de transmetre en text, no només mitjançant el color o les indicacions visuals.
Operabilitat completa amb teclat. Cada camp ha de ser accessible i operable sense ratolí.

Els formularis se situen a la intersecció de l’estructura, la interacció i el contingut, cosa que els converteix en la part de la feina de PDF on fer-ho bé importa més. La mateixa disciplina s’aplica a altres documents transaccionals — està estretament relacionada amb la cura necessària per al correu electrònic accessible, on l’estructura i l’etiquetatge determinen si un missatge es pot utilitzar realment.

Idioma, títol i metadades

Algunes de les correccions de PDF de més impacte són també les més petites. Un grapat de propietats a nivell de document canvien materialment com la tecnologia d’assistència gestiona un fitxer.

Idioma del document. El PDF ha de declarar el seu idioma principal (per exemple, en-GB) perquè un lector de pantalla utilitzi les regles de pronunciació correctes. Un paràgraf en francès llegit amb fonètica anglesa, o viceversa, és amb prou feines intel·ligible. Els passatges en un idioma diferent del document principal haurien de portar els seus propis marcadors d’idioma.
Títol del document. Les metadades de PDF haurien d’incloure un títol significatiu, i el visor s’hauria de configurar perquè mostri aquest títol en lloc del nom del fitxer. «Informe anual d’accessibilitat 2026» s’anuncia i es mostra; «final_v3_FORWEB.pdf» no.
Navegació per pestanyes i adreces d’interès. Les adreces d’interès (l’esquema del document) donen a tots els usuaris — i especialment a aquells que naveguen de manera no visual — una manera de saltar a les seccions principals d’un document llarg.
Indicadors de PDF etiquetat i metadades netes. El fitxer s’hauria de marcar com a PDF etiquetat i portar metadades coherents i precises.

Aquestes propietats triguen minuts a establir-se i són necessàries per a la conformitat, però s’ometen en la gran majoria dels PDF publicats.

WCAG 2.2 i PDF/UA (ISO 14289)

Dos estàndards regeixen els PDF accessibles, i treballen junts en lloc de competir.

La WCAG 2.2 és la base agnòstica de tecnologia per a l’accessibilitat digital. Els seus criteris d’èxit — alternatives de text, informació i relacions, seqüència significativa, contrast, operabilitat amb teclat i la resta — s’apliquen als PDF igual que s’apliquen a les pàgines web. La WCAG 2.2 és l’estàndard al qual apunten la majoria de les lleis, i el W3C publica tècniques específiques per satisfer la WCAG amb funcions de PDF (etiquetar encapçalaments, proporcionar text alternatiu, definir l’ordre de lectura, etc.). Si esteu treballant per a la conformitat general, la nostra guia sobre com fer el contingut conforme a la WCAG i la visió general de la conformitat WCAG s’apliquen totes dues directament als documents.

El PDF/UA — formalment ISO 14289 — és l’especificació tècnica per al PDF accessible. On la WCAG descriu resultats («proporcioneu alternatives de text»), el PDF/UA prescriu exactament com s’ha de construir un PDF perquè sigui un document accessible correctament etiquetat i llegible per màquina: quins tipus d’estructura utilitzar, com s’ha de formar l’arbre d’etiquetes, com s’han de marcar els artefactes, i com s’han de codificar els formularis i les taules. Tots dos són complementaris — l’enfocament més robust és corregir respecte als requisits tècnics del PDF/UA mentre es validen els resultats de cara a l’usuari respecte a la WCAG 2.2.

La conformitat amb aquests estàndards és el que sustenta les obligacions legals a totes les jurisdiccions. Els PDF publicats per organitzacions cobertes entren de ple dins de la Llei europea d’accessibilitat, l’ADA i la Secció 508, totes les quals tracten els documents descarregables com a part de l’experiència digital que ha de ser accessible.

Corregir PDF existents vs. crear-ne d’accessibles

Hi ha dues vies cap als PDF accessibles, i la majoria de les organitzacions necessiten totes dues.

Corregir PDF existents significa agafar un fitxer acabat — un informe, un catàleg antic d’estats de compte, un formulari escanejat — i afegir o corregir la capa d’accessibilitat: executar OCR on calgui, construir l’arbre d’etiquetes, establir l’ordre de lectura, escriure text alternatiu, corregir taules i etiquetar camps de formulari. La correcció és essencial quan els fitxers d’origen han desaparegut, quan els documents han estat produïts per tercers, o quan teniu un arxiu publicat que cal posar en conformitat. De manera crucial, la correcció canvia l’estructura subjacent, no el disseny visual — el document té un aspecte idèntic i es torna utilitzable per a tothom. Aquest és el nucli del servei de correcció de PDF de QualiBooth, que delimita els lots per importància i abast i prioritza primer els documents que més importen.

Crear PDF accessibles significa incorporar l’accessibilitat al procés de producció perquè els documents neixin accessibles. Això implica utilitzar estils d’encapçalament, estils de llista i text alternatiu reals a l’aplicació d’origen; dissenyar taules com a taules de dades; establir idioma i títol; i triar una via d’exportació que preservi l’arbre d’etiquetes. Crear de manera accessible és dràsticament més barat que reparar el mateix document més tard, i és l’única resposta sostenible per a les organitzacions que publiquen PDF contínuament.

Els dos enfocaments no són excloents. El patró pràctic és corregir els documents que ja estan en circulació mentre s’arregla el procés inicial perquè els documents nous no recreïn el problema. Incorporar aquest canvi és exactament el que aborda la millora del procés d’accessibilitat — convertint la publicació accessible d’un projecte puntual en la manera per defecte de treballar del vostre equip. Una visió més àmplia d’on encaixen junts la feina de documents i la del web s’exposa a la visió general dels nostres serveis d’accessibilitat.

Validar amb lectors de pantalla — i per què els overlays no ajuden

Un PDF només és accessible si realment funciona per a les persones que en depenen. És per això que la validació no es pot aturar en un verificador automàtic. Les eines que escanegen un PDF respecte a les regles del PDF/UA són valuoses — detecten etiquetes que falten, idiomes no definits i errors estructurals a escala — però verifiquen la presència d’estructura, no la seva qualitat. Una eina automàtica pot confirmar que una imatge té text alternatiu; no us pot dir que el text alternatiu és incorrecte. Pot confirmar que existeix un encapçalament; no us pot dir que està niat al nivell equivocat.

La validació real combina totes dues:

Verificació automàtica per detectar errors estructurals i de metadades de manera àmplia i coherent. Programari com la plataforma d’escaneig d’accessibilitat de QualiBooth excel·leix a assenyalar problemes detectables per màquina en grans volums.
Proves manuals amb tecnologia d’assistència — navegant pel document amb un lector de pantalla, movent-se per encapçalament, llegint taules, tabulant per un formulari — per confirmar que l’experiència és coherent. Aquesta és l’única manera de verificar l’ordre de lectura, la qualitat del text alternatiu i la usabilitat del formulari. La nostra metodologia d’auditoria manual explica per què les proves humanes són insubstituïbles, i les auditories realitzades per persones amb discapacitat fan sortir a la llum problemes que cap verificador i cap provador vident notarien mai.

Una paraula de precaució sobre les dreceres. Els overlays d’accessibilitat — scripts o ginys de tercers que afirmen corregir l’accessibilitat automàticament — no resolen l’accessibilitat de PDF, i QualiBooth no els avala. No poden crear un arbre d’etiquetes correcte, jutjar l’ordre de lectura ni escriure text alternatiu significatiu, perquè aquestes tasques requereixen entendre el contingut i la intenció del document. No hi ha cap substitut automàtic per a una correcció adequada. L’accessibilitat genuïna de PDF prové d’una estructura correcta més la verificació humana — l’enfocament darrere de la nostra feina de correcció de PDF.

Preguntes freqüents

És mai acceptable un PDF sense etiquetar? No. Un PDF sense etiquetar és inaccessible per a la tecnologia d’assistència per definició i no compleix ni la WCAG 2.2 ni el PDF/UA. Qualsevol PDF que publiqueu per al públic o per als empleats hauria d’estar etiquetat.

Fer accessible un PDF canvia el seu aspecte? No. La correcció afegeix i corregeix la capa estructural oculta — etiquetes, ordre de lectura, metadades — sense alterar el disseny visual. La pàgina té un aspecte idèntic.

Hauria de proporcionar simplement una versió HTML en lloc d’un PDF accessible? Una alternativa HTML accessible sovint és la millor experiència i val la pena oferir-la. Però si publiqueu el PDF, el mateix PDF ha de ser accessible — una alternativa HTML no eximeix el document dels requisits de conformitat.

Es poden fer accessibles els documents escanejats? Sí, però primer cal aplicar-los OCR per crear text real, després de la qual cosa s’apliquen els passos de correcció normals — etiquetatge, ordre de lectura, text alternatiu, taules.

Com mantinc accessibles els PDF nous sense corregir-los un per un? Arregleu el procés de creació: utilitzeu estils reals i text alternatiu a l’origen, dissenyeu taules de dades adequades, establiu idioma i títol, i exporteu mitjançant una via que preservi les etiquetes. Combinar la correcció amb la millora del procés fa que els documents accessibles siguin la norma per defecte.

Conclusió

L’accessibilitat de PDF no és un pas de poliment opcional — és la diferència entre un document que tothom pot utilitzar i un que exclou silenciosament les persones que depenen de la tecnologia d’assistència. La feina és concreta i ben entesa: etiqueteu l’estructura, establiu un ordre de lectura correcte, descriviu imatges, codifiqueu taules i formularis adequadament, declareu idioma i títol, i valideu el resultat respecte a la WCAG 2.2 i el PDF/UA amb lectors de pantalla reals així com amb eines automàtiques. Corregiu els documents que ja publiqueu, arregleu el procés que en produeix de nous, i ometeu les dreceres d’overlay que prometen accessibilitat sense oferir-la.

Si els vostres informes, estats de compte, fullets o formularis no s’han comprovat mai, aquest és el lloc per començar. Podeu començar amb un escaneig d’accessibilitat gratuït, sol·licitar una demostració de la plataforma QualiBooth, o parlar amb el nostre equip sobre la correcció de PDF per a un únic document crític o un catàleg antic complet.