Dostępność PDF: tagi, kolejność i PDF/UA

Pliki PDF to cichy problem dostępności w niemal każdej organizacji. Strony internetowe są audytowane, przeprojektowywane i testowane z czytnikami ekranu — ale raport roczny, dokument zasad, zestawienie świadczeń i formularz zgłoszeniowy, które żyją za linkiem do pobrania, zbyt często są publikowane dokładnie w takiej postaci, w jakiej wyszły z okna eksportu. Dla widzącego czytelnika wyglądają dopracowane. Dla kogoś korzystającego z czytnika ekranu, powiększalnika lub nawigacji wyłącznie klawiaturą ten sam plik może być nieprzeniknioną ścianą: brak nagłówków, między którymi można skakać, obrazy bez opisu, tabele odczytywane jako bezsensowny strumień liczb oraz pola formularza, których w ogóle nie da się wypełnić.

Ten przewodnik wyjaśnia, dlaczego pliki PDF tak często są niedostępne i co naprawdę sprawia, że dokument staje się użyteczny dla technologii wspomagających. Obejmuje strukturalne elementy składowe — tagi, kolejność czytania, tekst alternatywny, tabele, formularze i metadane — oraz standardy, które nimi rządzą: WCAG 2.2 i PDF/UA, specyfikację ISO 14289 dla dostępnych otagowanych plików PDF. Przez cały czas celem jest ten, który QualiBooth stosuje do każdego dokumentu, którego dotykamy: plik, który działa w praktyce, potwierdzony rzeczywistą technologią wspomagającą, a nie tylko pobłogosławiony przez automatyczny weryfikator.

Dlaczego pliki PDF są tak często niedostępne

PDF jest w istocie opisem tego, jak nanieść znaki na stronę. Format zaprojektowano, by zachować wierność wizualną — by dokument wyglądał identycznie na każdym ekranie czy drukarce. Właśnie ten cel projektowy sprawia, że dostępność jest trudna. Wierność wizualna nie mówi nic o znaczeniu. Wiersz 18-punktowego pogrubionego tekstu wygląda dla ludzkiego oka jak nagłówek, ale dopóki plik wyraźnie nie zapisze „to jest nagłówek”, technologia wspomagająca nie ma jak wiedzieć, że to coś więcej niż kilka większych znaków.

Większość plików PDF w obiegu jest nieotagowana. Zawierają treść wizualną, ale żadnej ze struktur leżących u podstaw — żadnej informacji o tym, co jest nagłówkiem, akapitem, listą, tabelą czy obrazem. Czytnik ekranu skonfrontowany z nieotagowanym plikiem PDF albo odmawia jego sensownego odczytania, albo ucieka się do zgadywania, wyprowadzając kolejność czytania z położenia znaków na stronie. Wyniki sięgają od niewygodnych po bezużyteczne: dwukolumnowy biuletyn czytany w poprzek obu kolumn, podpis odczytany przed akapitem, do którego należy, lub przypisy przerywające środek zdania.

Kilka powszechnych nawyków produkcyjnych pogarsza sprawę:

Dokumenty skanowane. Skan to tylko obraz strony. Bez optycznego rozpoznawania znaków (OCR) nie ma w ogóle rzeczywistego tekstu — nic do odczytania, przeszukania ani zaznaczenia.
Eksporty, które porzucają strukturę. Wiele ścieżek „Zapisz jako PDF” i „Drukuj do PDF” odrzuca strukturę nagłówków i list, która istniała w dokumencie źródłowym.
Układy z narzędzi projektowych. Pliki tworzone w oprogramowaniu do składu mogą mieć wizualnie poprawne strony, których leżąca u podstaw kolejność obiektów nie ma żadnego związku z zamierzoną sekwencją czytania.
Dekoracyjny bałagan. Obrazy tła, linie i ornamenty są udostępniane technologii wspomagającej i odczytywane tak, jakby niosły znaczenie.

Nic z tego nie jest widoczne na ekranie, co jest właśnie powodem, dla którego problem się utrzymuje. Rozwiązaniem jest dodanie warstwy strukturalnej, którą format pozostawia opcjonalną — pracy remediacji PDF.

Tagi i struktura dokumentu

Tagi są fundamentem dostępnego pliku PDF. Otagowany PDF niesie ukrytą hierarchię — drzewo struktury — które towarzyszy treści wizualnej i opisuje, czym faktycznie jest każda część strony. Jest to bezpośrednio analogiczne do semantycznego HTML stojącego za dobrze zbudowaną stroną internetową: tam, gdzie HTML używa <h1>, <p>, <ul> i <table>, otagowany PDF używa elementów struktury takich jak <H1>, <P>, <L> (lista) i <Table>.

Drzewo tagów to coś, co daje technologii wspomagającej coś, po czym można nawigować. Gdy jest na swoim miejscu, czytnik ekranu może robić rzeczy, na których polegają jego użytkownicy:

Przeskakiwanie po nagłówkach. Użytkownicy poruszają się po długim dokumencie od nagłówka do nagłówka, zamiast słuchać każdego słowa po kolei. Wymaga to prawdziwych tagów nagłówków (od <H1> do <H6>) zastosowanych w logicznej, zagnieżdżonej kolejności — nigdy nie pomijając poziomów, nigdy nie udając nagłówka przez pogrubienie akapitu.
Rozumienie list. Tag <L> ze swoimi elementami <LI> mówi czytnikowi ekranu „to jest lista pięciu pozycji”, więc użytkownik wie, gdzie się znajduje i ile pozostało.
Odróżnianie treści od dekoracji. Prawdziwa treść jest tagowana; znaki czysto dekoracyjne są oznaczane jako artefakty, tak aby były całkowicie pomijane.

Poprawna, logicznie zagnieżdżona struktura nagłówków to jedyna rzecz o najwyższym oddziaływaniu, którą można zrobić dobrze w pliku PDF, ponieważ przekształca liniowe doświadczenie słuchania w nawigowalne. Zrobienie tego źle — lub pominięcie — to jeden z powszechnych problemów z dostępnością, który raz po raz wypływa w audytach dokumentów.

Kolejność czytania

Tagi mówią, czym jest każdy element. Kolejność czytania mówi, w jakiej sekwencji te elementy są prezentowane komuś, kto nie widzi strony. Oba są powiązane, lecz odrębne, a kolejność czytania to miejsce, w którym wiele skądinąd dobrze otagowanych plików PDF zawodzi.

Czytnik ekranu ogłasza treść w kolejności określonej przez strukturę dokumentu, a nie w kolejności, w jakiej znaki przypadkiem znajdują się w pliku. W dokumencie jednokolumnowym oba zwykle się pokrywają. W czymkolwiek bardziej złożonym — układy wielokolumnowe, paski boczne, wyróżnione cytaty, podpisy, tekst opływający obraz — często się rozchodzą. Widzące oko reorganizuje treść bez wysiłku; technologia wspomagająca podąża za daną jej kolejnością, a jeśli ta kolejność jest błędna, znaczenie się załamuje.

Dobra kolejność czytania oznacza, że treść jest ogłaszana w sekwencji, za którą widzący czytelnik podążałby naturalnie: nagłówek przed tekstem głównym, wprowadzenie przed paskiem bocznym, podpis po rysunku, który opisuje. Ustawienie jej poprawnie to ręczna ocena tego, jak dokument ma być czytany, dlatego same narzędzia automatyczne nie mogą tego zagwarantować. Jest to jeden z kluczowych rezultatów profesjonalnej remediacji PDF i jedna z pierwszych rzeczy, które sprawdzają doświadczeni testerzy.

Tekst alternatywny dla obrazów

Każdy obraz niosący informację potrzebuje tekstowego odpowiednika, aby można go było opisać osobom, które nie mogą go zobaczyć. Zasady są takie same jak w sieci, zastosowane poprzez tagi PDF.

Obrazy informacyjne — wykresy, diagramy, fotografie przekazujące znaczenie, infografiki — potrzebują zwięzłego, dokładnego tekstu alternatywnego, który przekazuje tę samą informację co obraz. W przypadku wykresu często oznacza to podsumowanie wniosku („Przychody wzrosły o 12% rok do roku”) zamiast opisywania warstwy wizualnej („wykres słupkowy w kolorze niebieskim”).
Obrazy złożone — szczegółowy diagram procesu lub rysunek bogaty w dane — mogą wymagać zarówno krótkiego tekstu alternatywnego, jak i dłuższego opisu, albo leżących u podstaw danych przedstawionych w dostępnej formie gdzie indziej w dokumencie.
Obrazy dekoracyjne — obramowania, tekstury tła, ozdobne separatory, logo powtórzone w stopce — powinny być oznaczone jako artefakty, aby technologia wspomagająca je pomijała. Zmuszanie czytnika ekranu do ogłaszania „obraz, obraz, obraz” dla dekoracji jest samo w sobie porażką dostępności.
Tekst wewnątrz obrazów — grafika cytatu, zeskanowany nagłówek listowy, obraz przycisku z etykietą — musi mieć ten tekst uchwycony, albo jako tekst alternatywny, albo, lepiej, jako rzeczywisty zaznaczalny tekst.

Pisanie dobrego tekstu alternatywnego to zadanie z zakresu treści, a nie techniczne. Wymaga zrozumienia, do czego obraz służy w swoim kontekście — tej samej umiejętności, którą nasz zespół doradztwa w zakresie dostępności wnosi do treści internetowych.

Dostępne tabele

Tabele to miejsce, w którym dostępność PDF staje się naprawdę trudna i w którym automatyczne eksporty zawodzą najczęściej. Tabela danych przekazuje znaczenie poprzez relację między komórką a jej nagłówkami wiersza i kolumny. Widzący czytelnicy odtwarzają te relacje wizualnie, zerkając w górę i w lewo. Użytkownik czytnika ekranu nie może tego zrobić — zależy mu na tym, by tabela była oznaczona tak, aby powiązania nagłówków były jawne.

Dostępna tabela PDF potrzebuje:

Właściwej struktury <Table> zawierającej <TR> (wiersze), <TH> (komórki nagłówkowe) i <TD> (komórki danych), zamiast luźnej siatki tekstu rozmieszczonego tak, by wyglądał jak tabela.
Poprawnie zidentyfikowanych komórek nagłówkowych, z zakresem (wiersz lub kolumna) tam, gdzie wymaga tego układ tabeli, aby w miarę przemieszczania się użytkownika po danych odpowiednie nagłówki były ponownie ogłaszane („Q3, Przychody, 1,2 miliona”).
Rozsądnej obsługi scalonych lub rozciągniętych komórek, które komplikują relacje nagłówków i często dezorientują narzędzia automatyczne.

Powszechnym antywzorcem jest tabela układu — siatka używana wyłącznie do wizualnego rozmieszczania treści, bez rzeczywistych relacji danych. Tabele układu nie powinny być w ogóle tagowane jako tabele, ponieważ zmusza to technologię wspomagającą do ogłaszania widmowych wierszy i kolumn. Odróżnienie tabeli danych od artefaktu układu, a następnie zakodowanie właściwych relacji to szczegółowa praca ręczna, która ogromnie korzysta z przeglądu przez osoby, które rzeczywiście używają czytników ekranu na co dzień.

Dostępne formularze PDF

Formularze to dokumenty o najwyższej stawce, jakie publikuje organizacja, ponieważ są transakcyjne: wniosek, roszczenie, zgoda, rejestracja. Jeśli formularza PDF nie da się wypełnić za pomocą technologii wspomagającej, osoba jest nie tylko narażona na niedogodność — jest wykluczona z usługi.

Dostępny formularz PDF wymaga:

Oznaczonych pól. Każde pole — wprowadzanie tekstu, pole wyboru, przycisk opcji, lista rozwijana — potrzebuje dostępnej nazwy (w terminologii PDF — podpowiedzi/etykiety), aby czytnik ekranu ogłaszał, do czego pole służy, a nie tylko „edytuj tekst”.
Logicznej kolejności tabulacji. Użytkownicy klawiatury przemieszczają się po polach klawiszem Tab. Kolejność tabulacji musi podążać za wizualnym i logicznym przepływem formularza, a nie za kolejnością, w jakiej pola dodano w edytorze.
Pogrupowanych kontrolek. Powiązane przyciski opcji i pola wyboru powinny być pogrupowane, aby ich wspólne pytanie zostało ogłoszone raz, a opcje były rozumiane jako zestaw.
Pól wymaganych i instrukcji. Pola obowiązkowe, wymagania dotyczące formatowania i wskazówki dotyczące błędów muszą być przekazywane tekstem, a nie tylko kolorem czy sygnałami wizualnymi.
Pełnej obsługi z klawiatury. Każde pole musi być osiągalne i obsługiwalne bez myszy.

Formularze leżą na przecięciu struktury, interakcji i treści, co czyni je tą częścią pracy nad PDF, w której zrobienie tego porządnie ma największe znaczenie. Ta sama dyscyplina dotyczy innych dokumentów transakcyjnych — jest ściśle powiązana ze starannością potrzebną dla dostępnej poczty e-mail, gdzie struktura i etykietowanie decydują o tym, czy wiadomość da się rzeczywiście wykorzystać.

Język, tytuł i metadane

Niektóre z najbardziej oddziałujących poprawek PDF są zarazem najmniejsze. Garstka właściwości na poziomie dokumentu istotnie zmienia sposób, w jaki technologia wspomagająca obchodzi się z plikiem.

Język dokumentu. PDF musi zadeklarować swój język główny (na przykład en-GB), aby czytnik ekranu używał poprawnych reguł wymowy. Francuski akapit czytany z angielską fonetyką, lub odwrotnie, jest ledwie zrozumiały. Fragmenty w języku innym niż dokument główny powinny nosić własne znaczniki języka.
Tytuł dokumentu. Metadane PDF powinny zawierać sensowny tytuł, a przeglądarka powinna być ustawiona tak, by wyświetlać ten tytuł zamiast nazwy pliku. „Roczny raport dostępności 2026” jest ogłaszany i wyświetlany; „final_v3_FORWEB.pdf” — nie.
Nawigacja kartami i zakładkami. Zakładki (konspekt dokumentu) dają wszystkim użytkownikom — a zwłaszcza tym nawigującym bez wzroku — sposób na przeskakiwanie do głównych sekcji długiego dokumentu.
Flagi otagowanego PDF i czyste metadane. Plik powinien być oznaczony jako otagowany PDF i nieść spójne, dokładne metadane.

Ustawienie tych właściwości zajmuje minuty i są one wymagane dla zgodności, a mimo to są pomijane w przytłaczającej większości publikowanych plików PDF.

WCAG 2.2 i PDF/UA (ISO 14289)

Dostępnymi plikami PDF rządzą dwa standardy, które współpracują, a nie konkurują.

WCAG 2.2 to neutralna technologicznie podstawa dostępności cyfrowej. Jego kryteria sukcesu — alternatywy tekstowe, informacje i relacje, sensowna sekwencja, kontrast, obsługa z klawiatury i pozostałe — odnoszą się do plików PDF tak samo, jak odnoszą się do stron internetowych. WCAG 2.2 to standard, na który wskazuje większość przepisów, a W3C publikuje konkretne techniki spełniania WCAG za pomocą funkcji PDF (tagowanie nagłówków, dostarczanie tekstu alternatywnego, definiowanie kolejności czytania itd.). Jeśli przerabiasz ogólną zgodność, nasz przewodnik po tworzeniu treści zgodnych z WCAG oraz przegląd zgodności z WCAG odnoszą się oba bezpośrednio do dokumentów.

PDF/UA — formalnie ISO 14289 — to techniczna specyfikacja dostępnego PDF. Tam, gdzie WCAG opisuje rezultaty („zapewnij alternatywy tekstowe”), PDF/UA przepisuje dokładnie, jak PDF musi być zbudowany, by być poprawnie otagowanym, czytelnym maszynowo, dostępnym dokumentem: których typów struktury użyć, jak musi być uformowane drzewo tagów, jak muszą być oznaczone artefakty oraz jak muszą być zakodowane formularze i tabele. Oba są komplementarne — najsolidniejsze podejście to przeprowadzanie remediacji według wymagań technicznych PDF/UA przy jednoczesnym walidowaniu rezultatów skierowanych do użytkownika według WCAG 2.2.

Zgodność z tymi standardami jest tym, co podpiera zobowiązania prawne w różnych jurysdykcjach. Pliki PDF publikowane przez objęte organizacje wpadają wprost w zakres European Accessibility Act, ADA i Section 508, z których wszystkie traktują dokumenty do pobrania jako część doświadczenia cyfrowego, które musi być dostępne.

Remediacja istniejących plików PDF a tworzenie dostępnych

Istnieją dwie drogi do dostępnych plików PDF i większość organizacji potrzebuje obu.

Remediacja istniejących plików PDF oznacza wzięcie gotowego pliku — raportu, archiwalnego zbioru zestawień, zeskanowanego formularza — i dodanie lub poprawienie warstwy dostępności: uruchomienie OCR tam, gdzie potrzeba, zbudowanie drzewa tagów, ustawienie kolejności czytania, napisanie tekstu alternatywnego, naprawienie tabel i oznaczenie pól formularza. Remediacja jest niezbędna, gdy pliki źródłowe przepadły, gdy dokumenty zostały wytworzone przez podmioty trzecie lub gdy masz opublikowane archiwum, które trzeba doprowadzić do zgodności. Co kluczowe, remediacja zmienia leżącą u podstaw strukturę, a nie projekt wizualny — dokument wygląda identycznie i staje się użyteczny dla wszystkich. To rdzeń usługi remediacji PDF QualiBooth, która wyznacza zakres partii według ważności i zasięgu oraz priorytetyzuje najpierw dokumenty, które mają największe znaczenie.

Tworzenie dostępnych plików PDF oznacza wbudowanie dostępności w proces produkcyjny, tak aby dokumenty rodziły się dostępne. Obejmuje to używanie prawdziwych stylów nagłówków, stylów list i tekstu alternatywnego w aplikacji źródłowej; projektowanie tabel jako tabel danych; ustawianie języka i tytułu; oraz wybór ścieżki eksportu, która zachowuje drzewo tagów. Dostępne tworzenie jest drastycznie tańsze niż naprawianie tego samego dokumentu później i jest jedyną zrównoważoną odpowiedzią dla organizacji, które publikują pliki PDF nieustannie.

Te dwa podejścia nie wykluczają się wzajemnie. Praktyczny wzorzec to remediowanie dokumentów już będących w obiegu przy jednoczesnym naprawianiu procesu wcześniejszego, aby nowe dokumenty nie odtwarzały problemu. Zakorzenienie tej zmiany to dokładnie to, czym zajmuje się doskonalenie procesów dostępności — przekształcenie dostępnego publikowania z jednorazowego projektu w domyślny sposób pracy Twojego zespołu. Szerszy obraz tego, jak praca nad dokumentami i nad siecią pasują do siebie, przedstawia nasz przegląd usług dostępności.

Walidacja z czytnikami ekranu — i dlaczego nakładki nie pomagają

PDF jest dostępny tylko wtedy, gdy rzeczywiście działa dla osób, które na nim polegają. Dlatego walidacja nie może zatrzymać się na automatycznym weryfikatorze. Narzędzia, które skanują PDF według reguł PDF/UA, są cenne — wychwytują brakujące tagi, niezdefiniowane języki i błędy strukturalne na dużą skalę — ale weryfikują obecność struktury, a nie jej jakość. Narzędzie automatyczne potrafi potwierdzić, że obraz ma tekst alternatywny; nie powie ci, że ten tekst alternatywny jest błędny. Potrafi potwierdzić, że nagłówek istnieje; nie powie ci, że jest zagnieżdżony na niewłaściwym poziomie.

Prawdziwa walidacja łączy oba:

Sprawdzanie automatyczne, aby szeroko i konsekwentnie wychwytywać usterki struktury i metadanych. Oprogramowanie takie jak platforma do skanowania dostępności QualiBooth świetnie radzi sobie z oznaczaniem problemów wykrywalnych maszynowo w dużych ilościach.
Testowanie ręczne z technologią wspomagającą — nawigowanie po dokumencie czytnikiem ekranu, przemieszczanie się po nagłówkach, czytanie tabel, przechodzenie tabulatorem przez formularz — aby potwierdzić, że doświadczenie jest spójne. To jedyny sposób, by zweryfikować kolejność czytania, jakość tekstu alternatywnego i użyteczność formularza. Nasza metodologia audytu ręcznego wyjaśnia, dlaczego testowanie przez ludzi jest niezastąpione, a audyty prowadzone przez osoby z niepełnosprawnościami ujawniają problemy, których żaden weryfikator i żaden widzący tester nigdy by nie zauważył.

Słowo przestrogi co do dróg na skróty. Nakładki dostępności — skrypty lub widżety firm trzecich, które twierdzą, że automatycznie naprawiają dostępność — nie rozwiązują dostępności PDF, a QualiBooth ich nie popiera. Nie potrafią stworzyć poprawnego drzewa tagów, ocenić kolejności czytania ani napisać sensownego tekstu alternatywnego, ponieważ te zadania wymagają zrozumienia treści i intencji dokumentu. Nie ma automatycznej zastępczości dla porządnej remediacji. Prawdziwa dostępność PDF bierze się z poprawnej struktury plus weryfikacji przez człowieka — z podejścia stojącego za naszą pracą nad remediacją PDF.

Najczęściej zadawane pytania

Czy nieotagowany PDF jest kiedykolwiek akceptowalny? Nie. Nieotagowany PDF jest z definicji niedostępny dla technologii wspomagającej i nie spełnia ani WCAG 2.2, ani PDF/UA. Każdy PDF, który publikujesz dla ogółu lub dla pracowników, powinien być otagowany.

Czy uczynienie PDF dostępnym zmienia jego wygląd? Nie. Remediacja dodaje i poprawia ukrytą warstwę strukturalną — tagi, kolejność czytania, metadane — nie zmieniając projektu wizualnego. Strona wygląda identycznie.

Czy powinienem po prostu udostępnić wersję HTML zamiast dostępnego PDF? Dostępna alternatywa HTML jest często lepszym doświadczeniem i warto ją oferować. Ale jeśli publikujesz PDF, to sam PDF musi być dostępny — alternatywa HTML nie zwalnia dokumentu z wymogów zgodności.

Czy dokumenty skanowane można uczynić dostępnymi? Tak, ale najpierw trzeba je poddać OCR, aby utworzyć rzeczywisty tekst, po czym stosuje się zwykłe kroki remediacji — tagowanie, kolejność czytania, tekst alternatywny, tabele.

Jak utrzymać dostępność nowych plików PDF bez remediowania każdego z osobna? Napraw proces tworzenia: używaj prawdziwych stylów i tekstu alternatywnego w źródle, projektuj właściwe tabele danych, ustawiaj język i tytuł oraz eksportuj ścieżką, która zachowuje tagi. Połączenie remediacji z doskonaleniem procesów sprawia, że dostępne dokumenty stają się domyślne.

Podsumowanie

Dostępność PDF nie jest opcjonalnym etapem szlifowania — jest różnicą między dokumentem, którego wszyscy mogą używać, a takim, który po cichu wyklucza osoby polegające na technologii wspomagającej. Praca jest konkretna i dobrze rozumiana: otaguj strukturę, ustaw poprawną kolejność czytania, opisz obrazy, poprawnie zakoduj tabele i formularze, zadeklaruj język i tytuł oraz zwaliduj rezultat względem WCAG 2.2 i PDF/UA z prawdziwymi czytnikami ekranu, a także narzędziami automatycznymi. Przeprowadź remediację dokumentów, które już publikujesz, napraw proces produkujący nowe i omijaj nakładkowe drogi na skróty, które obiecują dostępność, nie dostarczając jej.

Jeśli Twoje raporty, zestawienia, broszury czy formularze nigdy nie były sprawdzane, to jest miejsce, by zacząć. Możesz rozpocząć od bezpłatnego skanu dostępności, poprosić o demo platformy QualiBooth lub porozmawiać z naszym zespołem o remediacji PDF dla pojedynczego krytycznego dokumentu lub całego archiwum.