Достъпност на PDF: тагове и PDF/UA

PDF файловете са тихият проблем с достъпността в почти всяка организация. Уебсайтовете се одитират, преработват и тестват с екранни четци, но годишният отчет, документът с политики, извлечението за обезщетения и формулярът за кандидатстване, които живеят зад линк за изтегляне, твърде често се публикуват точно така, както са излезли от диалога за експортиране. За зрящ читател изглеждат изпипани. За някого, който използва екранен четец, лупа или навигация само с клавиатура, същият този файл може да бъде непроходима стена: няма заглавия, между които да се прескача, изображения без описание, таблици, които се четат като безсмислен поток от числа, и полета на формуляр, които изобщо не могат да бъдат попълнени.

Това ръководство обяснява защо PDF файловете толкова често са недостъпни и какво всъщност прави един файл използваем от помощните технологии. То обхваща структурните градивни елементи — тагове, ред на четене, алтернативен текст, таблици, формуляри и метаданни — и стандартите, които ги управляват: WCAG 2.2 и PDF/UA, спецификацията ISO 14289 за достъпни тагнати PDF. През цялото време целта е същата, която QualiBooth прилага към всеки документ, до който се докосваме: файл, който работи на практика, потвърден с реална помощна технология, а не само благословен от автоматичен проверяващ инструмент.

Защо PDF файловете толкова често са недостъпни

По същество PDF е описание на това как да се нарисуват знаци върху страница. Форматът е проектиран да запазва визуалната точност — така че документът да изглежда идентично на всеки екран или принтер. Точно тази цел на проектирането прави достъпността трудна. Визуалната точност не казва нищо за смисъла. Ред от 18-пунктов получер текст изглежда като заглавие за човешкото око, но освен ако файлът изрично не записва „това е заглавие”, помощната технология няма как да знае, че това е нещо различно от няколко по-големи знака.

Повечето PDF файлове в обращение са нетагнати. Те съдържат визуалното съдържание, но никаква от подлежащата структура — никаква информация за това какво е заглавие, абзац, списък, таблица или изображение. Екранен четец, изправен пред нетагнат PDF, или отказва да го прочете смислено, или прибягва до догадки, извеждайки реда на четене от позицията на знаците върху страницата. Резултатите варират от неудобни до неизползваеми: бюлетин в две колони, прочетен напряко през двете колони, надпис, прочетен преди абзаца, към който принадлежи, или бележки под линия, прекъсващи средата на изречение.

Няколко често срещани производствени навика влошават нещата:

Сканирани документи. Сканът е просто изображение на страница. Без оптично разпознаване на знаци (OCR) изобщо няма реален текст — нищо за четене, търсене или избиране.
Експортирания, които изхвърлят структурата. Много пътища „Запази като PDF” и „Принтирай в PDF” отхвърлят структурата на заглавията и списъците, която е съществувала в изходния документ.
Оформления от инструменти за дизайн. Файлове, създадени в софтуер за оформление на страници, може да имат визуално коректни страници, чийто подлежащ ред на обектите няма никаква връзка с предвидената последователност на четене.
Декоративен безпорядък. Фонови изображения, линии и орнаменти се излагат на помощната технология и се обявяват, сякаш носят смисъл.

Нищо от това не е видимо на екрана, което е точно причината проблемът да продължава. Решението е да се добави структурният слой, който форматът оставя по избор — работата по поправка на PDF.

Тагове и структура на документа

Таговете са основата на достъпния PDF. Тагнатият PDF носи скрита йерархия — структурното дърво — която стои редом с визуалното съдържание и описва какво всъщност е всяка част от страницата. Това е пряко аналогично на семантичния HTML зад добре изградена уеб страница: където HTML използва <h1>, <p>, <ul> и <table>, тагнатият PDF използва структурни елементи като <H1>, <P>, <L> (списък) и <Table>.

Дървото на таговете е това, което дава на помощната технология нещо, по което да навигира. С него на място екранният четец може да прави нещата, на които разчитат потребителите му:

Прескачане по заглавие. Потребителите се движат през дълъг документ от заглавие на заглавие, вместо да слушат всяка дума поред. Това изисква реални тагове за заглавия (от <H1> до <H6>), приложени в логичен, вложен ред — никога без прескачане на нива, никога без имитиране на заглавие чрез получерен абзац.
Разбиране на списъци. Таг <L> с неговите елементи <LI> казва на екранния четец „това е списък от пет елемента”, така че потребителят знае къде се намира и колко остава.
Разграничаване на съдържание от декорация. Истинското съдържание се тагва; чисто декоративните знаци се обозначават като артефакти, така че да бъдат напълно пропуснати.

Правилната, логически вложена структура на заглавията е единственото нещо с най-голямо въздействие, което можете да направите правилно в един PDF, защото превръща линейно изживяване със слушане в навигируемо. Да го направите грешно — или да го пропуснете — е един от честите проблеми с достъпността, които изплуват отново и отново при одитите на документи.

Ред на четене

Таговете казват какво е всеки елемент. Редът на четене казва в каква последователност тези елементи се представят на някого, който не може да види страницата. Двете са свързани, но различни, и редът на четене е мястото, където много иначе добре тагнати PDF се провалят.

Екранният четец обявява съдържанието в реда, определен от структурата на документа, а не в реда, в който знаците случайно се намират във файла. В документ с една колона двете обикновено съвпадат. При каквото и да е по-сложно — многоколонни оформления, странични ленти, акцентни цитати, надписи, текст, обвиващ изображение — те често се разминават. Зрящото око пренарежда съдържанието без усилие; помощната технология следва реда, който ѝ е даден, и ако този ред е грешен, смисълът се срива.

Добрият ред на четене означава, че съдържанието се обявява в последователността, която зрящ читател би следвал естествено: заглавието преди основния текст, въведението преди страничната лента, надпис след фигурата, която описва. Правилното му задаване е ръчна преценка за това как документът е предвиден да бъде четен, поради което автоматичните инструменти сами по себе си не могат да го гарантират. Той е един от основните резултати на професионалната поправка на PDF и едно от първите неща, които опитните тестери проверяват.

Алтернативен текст за изображения

Всяко изображение, което носи информация, се нуждае от текстов еквивалент, за да може да бъде описано на хора, които не могат да го видят. Принципите са същите като за уеб, приложени чрез PDF тагове.

Информативните изображения — графики, диаграми, фотографии, които предават смисъл, инфографики — се нуждаят от кратък, точен алтернативен текст, който съобщава същата информация като изображението. За графика това често означава да се обобщи основното заключение („Приходите нараснаха с 12% спрямо предходната година”), вместо да се описва визуалното („стълбовидна графика в синьо”).
Сложните изображения — детайлна процесна диаграма или фигура, наситена с данни — може да се нуждаят както от кратък алтернативен текст, така и от по-дълго описание, или подлежащите данни, представени в достъпна форма другаде в документа.
Декоративните изображения — рамки, фонови текстури, орнаментни разделители, лого, повторено в долен колонтитул — трябва да се маркират като артефакти, така че помощната технология да ги пропуска. Да принуждавате екранен четец да обявява „изображение, изображение, изображение” за декорация е сам по себе си провал в достъпността.
Текстът вътре в изображения — графика на цитат, сканирана бланка, изображение на бутон с етикет — трябва да има този текст уловен, или като алтернативен текст, или, по-добре, като реален избираем текст.

Писането на добър алтернативен текст е задача за съдържание, а не техническа. То изисква разбиране за какво служи изображението в неговия контекст — същото умение, което нашият екип за консултации по достъпност внася в уеб съдържанието.

Достъпни таблици

Таблиците са там, където достъпността на PDF става истински трудна и където автоматичните експортирания се провалят най-често. Таблицата с данни предава смисъл чрез връзката между клетка и заглавията на нейния ред и колона. Зрящите читатели реконструират тези връзки визуално, поглеждайки нагоре и наляво. Потребителят на екранен четец не може — той зависи от това таблицата да е маркирана така, че асоциациите на заглавията да са изрични.

Достъпната PDF таблица се нуждае от:

Правилна <Table> структура, съдържаща <TR> (редове), <TH> (заглавни клетки) и <TD> (клетки с данни), вместо хлабава решетка от текст, позициониран да изглежда като таблица.
Правилно идентифицирани заглавни клетки, с обхват (ред или колона), където оформлението на таблицата го изисква, така че докато потребителят се движи през данните, съответните заглавия да се обявяват отново („Q3, Приходи, 1,2 милиона”).
Разумно боравене със слети или разпрострени клетки, които усложняват връзките между заглавията и често объркват автоматичните инструменти.

Често срещан антишаблон е таблицата за оформление — решетка, използвана чисто за визуално позициониране на съдържание, без реални връзки между данни. Таблиците за оформление изобщо не бива да се тагват като таблици, защото това принуждава помощната технология да обявява фантомни редове и колони. Разграничаването на таблица с данни от артефакт за оформление и след това кодирането на правилните връзки е детайлна ръчна работа, която печели огромно от прегледа от хора, които всъщност използват екранни четци всеки ден.

Достъпни PDF формуляри

Формулярите са документите с най-висок залог, които една организация публикува, защото са транзакционни: заявление, претенция, съгласие, регистрация. Ако PDF формуляр не може да бъде попълнен с помощна технология, лицето не е просто затруднено — то е изключено от услуга.

Достъпният PDF формуляр изисква:

Етикетирани полета. Всяко поле — текстово въвеждане, отметка, радиобутон, падащ списък — се нуждае от достъпно име (в термините на PDF — подсказка/етикет), за да обяви екранният четец за какво служи полето, а не просто „редактиране на текст”.
Логичен ред на табулация. Потребителите на клавиатура се движат през полетата с Tab. Редът на табулация трябва да следва визуалния и логичен поток на формуляра, а не реда, в който полетата са били добавени в редактора.
Групирани контроли. Свързаните радиобутони и отметки трябва да бъдат групирани, така че споделеният им въпрос да се обяви веднъж и опциите да се разберат като набор.
Задължителни полета и инструкции. Задължителните полета, изискванията за форматиране и насоките за грешки трябва да бъдат предадени чрез текст, а не само чрез цвят или визуални сигнали.
Пълна управляемост с клавиатура. Всяко поле трябва да е достижимо и управляемо без мишка.

Формулярите се намират в пресечната точка на структура, взаимодействие и съдържание, което ги прави частта от работата с PDF, в която правилното изпълнение има най-голямо значение. Същата дисциплина се прилага към други транзакционни документи — тя е тясно свързана с грижата, нужна за достъпен имейл, където структурата и етикетирането определят дали едно съобщение всъщност може да бъде използвано.

Език, заглавие и метаданни

Някои от най-въздействащите поправки на PDF са също и най-малките. Шепа свойства на ниво документ съществено променят начина, по който помощната технология борави с файл.

Език на документа. PDF трябва да декларира основния си език (например en-GB), за да използва екранният четец правилните правила за произношение. Френски абзац, прочетен с английска фонетика, или обратно, е почти неразбираем. Пасажите на език, различен от основния документ, трябва да носят собствени езикови маркери.
Заглавие на документа. Метаданните на PDF трябва да включват смислено заглавие, а четецът трябва да е настроен да показва това заглавие вместо името на файла. „Годишен отчет за достъпността 2026” се обявява и показва; „final_v3_FORWEB.pdf” — не.
Навигация с табулация и отметки. Отметките (структурата на документа) дават на всички потребители — и особено на тези, които навигират невизуално — начин да прескочат към основните раздели на дълъг документ.
Флагове за тагнат PDF и чисти метаданни. Файлът трябва да е маркиран като тагнат PDF и да носи последователни, точни метаданни.

Тези свойства отнемат минути за задаване и са необходими за съответствие, но въпреки това се пропускат в огромното мнозинство от публикуваните PDF.

WCAG 2.2 и PDF/UA (ISO 14289)

Два стандарта управляват достъпните PDF и работят заедно, вместо да се конкурират.

WCAG 2.2 е технологично неутралната основа за дигитална достъпност. Неговите критерии за успех — текстови алтернативи, информация и връзки, смислена последователност, контраст, управляемост с клавиатура и останалите — се прилагат към PDF точно както към уеб страниците. WCAG 2.2 е стандартът, към който сочат повечето закони, и W3C публикува конкретни техники за удовлетворяване на WCAG с функциите на PDF (тагване на заглавия, предоставяне на алтернативен текст, дефиниране на реда на четене и т.н.). Ако работите по общото съответствие, нашето ръководство за привеждане на съдържание в съответствие с WCAG и прегледът на съответствие с WCAG се прилагат и двата пряко към документите.

PDF/UA — формално ISO 14289 — е техническата спецификация за достъпен PDF. Където WCAG описва резултати („предоставяне на текстови алтернативи”), PDF/UA предписва точно как трябва да бъде конструиран един PDF, за да бъде правилно тагнат, машинночетим, достъпен документ: кои структурни типове да се използват, как трябва да бъде образувано дървото на таговете, как трябва да се маркират артефактите и как трябва да се кодират формулярите и таблиците. Двата са допълващи се — най-надеждният подход е да се прави поправка спрямо техническите изисквания на PDF/UA, докато се валидират насочените към потребителя резултати спрямо WCAG 2.2.

Съответствието с тези стандарти е това, което подкрепя правните задължения в различните юрисдикции. PDF, публикувани от обхванати организации, попадат изцяло в рамките на European Accessibility Act, ADA и Section 508, всички от които третират документите за изтегляне като част от дигиталното изживяване, което трябва да е достъпно.

Поправка на съществуващи PDF спрямо създаване на достъпни

Има два пътя към достъпни PDF и повечето организации се нуждаят и от двата.

Поправката на съществуващи PDF означава да се вземе завършен файл — отчет, архив от извлечения, сканиран формуляр — и да се добави или коригира слоят на достъпност: изпълнение на OCR където е нужно, изграждане на дървото на таговете, задаване на реда на четене, писане на алтернативен текст, поправяне на таблици и етикетиране на полета на формуляр. Поправката е съществена, когато изходните файлове ги няма, когато документите са произведени от трети страни или когато имате публикуван архив, който трябва да бъде приведен в съответствие. От решаващо значение е, че поправката променя подлежащата структура, а не визуалния дизайн — документът изглежда идентично и става използваем за всички. Това е сърцевината на услугата поправка на PDF на QualiBooth, която обхваща партиди по важност и обхват и приоритизира първо документите, които имат най-голямо значение.

Създаването на достъпни PDF означава вграждане на достъпност в производствения процес, така че документите да се раждат достъпни. Това включва използване на реални стилове за заглавия, стилове за списъци и алтернативен текст в изходното приложение; проектиране на таблиците като таблици с данни; задаване на език и заглавие; и избор на път за експортиране, който запазва дървото на таговете. Достъпното създаване е драстично по-евтино от поправянето на същия документ по-късно и е единственият устойчив отговор за организации, които публикуват PDF непрекъснато.

Двата подхода не са взаимно изключващи се. Практичният модел е да се поправят документите, които вече са в обращение, докато се поправя предшестващият процес, така че новите документи да не пресъздават проблема. Вкореняването на тази промяна е точно това, което адресира подобряването на процесите за достъпност — превръщане на достъпното публикуване от еднократен проект в начина по подразбиране, по който екипът ви работи. По-широк поглед върху това как работата с документи и уеб се вписват заедно е изложен в нашия преглед на услуги за достъпност.

Валидиране с екранни четци — и защо наслагванията не помагат

Един PDF е достъпен само ако наистина работи за хората, които зависят от него. Ето защо валидирането не може да спре до автоматичен проверяващ инструмент. Инструментите, които сканират PDF спрямо правилата на PDF/UA, са ценни — те улавят липсващи тагове, недефинирани езици и структурни грешки в мащаб — но проверяват наличието на структура, а не нейното качество. Автоматичен инструмент може да потвърди, че изображение има алтернативен текст; не може да ви каже, че алтернативният текст е грешен. Може да потвърди, че заглавие съществува; не може да ви каже, че е вложено на грешно ниво.

Истинското валидиране комбинира и двете:

Автоматична проверка за улавяне на структурни и метаданни грешки широко и последователно. Софтуер като платформата за сканиране на достъпност на QualiBooth се отличава в маркирането на машинно откриваеми проблеми в големи обеми.
Ръчно тестване с помощна технология — навигиране в документа с екранен четец, движение по заглавие, четене на таблици, табулиране през формуляр — за потвърждаване, че изживяването е свързано. Това е единственият начин да се провери редът на четене, качеството на алтернативния текст и използваемостта на формуляра. Нашата методология за ръчен одит обяснява защо човешкото тестване е незаменимо, а одитите, провеждани от хора с увреждания, извеждат на повърхността проблеми, които никакъв проверяващ инструмент и никакъв зрящ тестер не биха забелязали никога.

Една дума на предпазливост относно преките пътища. Наслагванията (overlays) за достъпност — скриптове или джаджи от трети страни, които твърдят, че поправят достъпността автоматично — не решават достъпността на PDF, и QualiBooth не ги одобрява. Те не могат да създадат правилно дърво на таговете, да преценят реда на четене или да напишат смислен алтернативен текст, защото тези задачи изискват разбиране на съдържанието и намерението на документа. Няма автоматичен заместител на правилната поправка. Истинската достъпност на PDF идва от правилна структура плюс човешка проверка — подходът зад нашата работа по поправка на PDF.

Често задавани въпроси

Приемлив ли е изобщо някога нетагнат PDF? Не. Нетагнатият PDF по дефиниция е недостъпен за помощната технология и не покрива нито WCAG 2.2, нито PDF/UA. Всеки PDF, който публикувате за обществеността или за служители, трябва да бъде тагнат.

Променя ли направата на PDF достъпен начина, по който изглежда? Не. Поправката добавя и коригира скрития структурен слой — тагове, ред на четене, метаданни — без да променя визуалния дизайн. Страницата изглежда идентично.

Трябва ли просто да предоставя HTML версия вместо достъпен PDF? Достъпна HTML алтернатива често е по-доброто изживяване и си заслужава да се предложи. Но ако публикувате PDF, самият PDF трябва да е достъпен — HTML алтернатива не освобождава документа от изискванията за съответствие.

Могат ли сканираните документи да бъдат направени достъпни? Да, но първо трябва да минат през OCR, за да се създаде реален текст, след което се прилагат нормалните стъпки на поправка — тагване, ред на четене, алтернативен текст, таблици.

Как поддържам новите PDF достъпни, без да поправям всеки един? Поправете процеса на създаване: използвайте реални стилове и алтернативен текст в източника, проектирайте правилни таблици с данни, задайте език и заглавие и експортирайте по път, който запазва таговете. Съчетаването на поправката с подобряване на процесите прави достъпните документи стандарт по подразбиране.

Заключение

Достъпността на PDF не е незадължителна стъпка за лустро — тя е разликата между документ, който всеки може да използва, и такъв, който тихо изключва хората, разчитащи на помощна технология. Работата е конкретна и добре разбрана: тагнете структурата, задайте правилен ред на четене, опишете изображенията, кодирайте таблиците и формулярите правилно, декларирайте език и заглавие и валидирайте резултата спрямо WCAG 2.2 и PDF/UA с реални екранни четци, както и с автоматични инструменти. Поправете документите, които вече публикувате, поправете процеса, който произвежда нови, и пропуснете преките пътища с наслагвания, които обещават достъпност, без да я предоставят.

Ако вашите отчети, извлечения, брошури или формуляри никога не са били проверявани, това е мястото да започнете. Можете да започнете с безплатно сканиране за достъпност, да заявите демо на платформата QualiBooth, или да говорите с нашия екип за поправка на PDF за единичен критичен документ или цял архив.