PDF 无障碍访问:让文档对所有人可用
· 12分钟阅读
PDF 无障碍访问不仅仅是一个锦上添花的功能——它是创建包容性数字内容的基本要求。当 PDF 被正确结构化和标记时,它们就能被所有人使用,包括数百万依赖屏幕阅读器、键盘导航或放大软件等辅助技术的人。
这份综合指南将带您了解关于 PDF 无障碍访问的所有知识,从理解技术要求到实施实用解决方案,使您的文档真正无障碍。
目录
什么使 PDF 无障碍
无障碍 PDF 是指残障人士可以阅读、导航和理解的 PDF。这包括盲人或低视力者、无法使用鼠标的运动障碍者、认知障碍者以及色盲用户。
PDF 无障碍访问的基础建立在几个关键技术要求上,这些要求共同为所有用户创造无缝体验。
| 要求 | 含义 | 帮助对象 | 优先级 |
|---|---|---|---|
| 标记结构 | 标题、段落、列表和表格的逻辑层次结构 | 屏幕阅读器用户 | 关键 |
| 阅读顺序 | 内容按正确顺序流动 | 屏幕阅读器用户、键盘导航者 | 关键 |
| 替代文本 | 图像和图形的文本描述 | 盲人和低视力用户 | 关键 |
| 文档语言 | 设置语言属性(例如,"en"表示英语) | 屏幕阅读器(发音) | 高 |
| 颜色对比度 | 普通文本最小 4.5:1 比率,大文本 3:1 | 低视力用户、色盲用户 | 高 |
| 书签 | 长文档的导航大纲 | 所有用户,尤其是键盘导航者 | 中 |
| 表格标题 | 数据表中标记的行/列标题 | 导航表格的屏幕阅读器用户 | 高 |
| 链接文本 | 描述性链接文本(不是"点击这里") | 屏幕阅读器用户 | 高 |
| 表单字段 | 交互元素的标签、工具提示和 Tab 键顺序 | 屏幕阅读器和键盘用户 | 关键 |
使用我们的 PDF 无障碍检查器检查您的文档,自动识别问题。
专业提示:无障碍访问使每个人受益,而不仅仅是残障用户。清晰的结构、逻辑阅读顺序和描述性链接改善了所有读者的体验,包括移动设备用户或使用搜索引擎的用户。
理解标记的 PDF 结构
标记是 PDF 无障碍访问的无形支柱。它们创建一个结构树,告诉辅助技术每个元素是什么以及内容如何与页面上的其他元素相关。
将标记视为 PDF 的语义 HTML。就像 Web 开发人员使用 <h1>、<p> 和 <table> 标记为 Web 内容赋予意义一样,PDF 标记为屏幕阅读器和其他辅助技术提供相同的语义信息。
常见的 PDF 标记及其用途
| PDF 标记 | 用途 | HTML 等效 | 使用示例 |
|---|---|---|---|
<Document> |
包含所有内容的根元素 | <html> |
包装整个文档 |
<H1> - <H6> |
文档层次结构的标题级别 | <h1> - <h6> |
章节标题、节标题 |
<P> |
正文段落 | <p> |
常规文本内容 |
<L>、<LI> |
列表容器和列表项 | <ul>/<ol>、<li> |
项目符号或编号列表 |
<Table>、<TR>、<TD>、<TH> |
表格结构元素 | 与 HTML 相同 | 带标题的数据表 |
<Figure> |
带替代文本的图像或图形 | <figure> |
照片、图表、图表 |
<Link> |
指向另一个位置的超链接 | <a> |
URL、交叉引用 |
<Span> |
具有特定样式的内联文本 | <span> |
强调或样式化文本 |
<Artifact> |
屏幕阅读器忽略的装饰性内容 | aria-hidden="true" |
页码、装饰性边框 |
为什么标记很重要
没有适当的标记,PDF 只是文本和图像的集合,没有语义意义。屏幕阅读器将尝试按视觉顺序(从左到右、从上到下)阅读内容,这在多列布局或带侧边栏的文档中通常会产生无意义的结果。
考虑一个两列布局的新闻通讯。未标记的 PDF 可能会读取左列的第一行,然后跳到右列的第一行,然后返回到左列的第二行——创建一个令人困惑的文本混乱。
适当的标记确保内容按逻辑顺序阅读,无论视觉布局如何。它还允许屏幕阅读器用户按标题导航、跳到表格或在列表项之间跳转——就像视力正常的用户可以直观地扫描文档一样。
快速提示:您可以通过打开标记面板(视图 > 显示/隐藏 > 导航窗格 > 标记)在 Adobe Acrobat 中查看标记结构。这揭示了辅助技术使用的隐藏结构树。
无障碍标准:PDF/UA 和 WCAG
PDF 无障碍访问由两个主要标准管理,它们共同确保文档对每个人都可用。
PDF/UA (ISO 14289)
PDF/UA(通用无障碍访问)是专门针对无障碍 PDF 的国际标准。作为 ISO 14289-1 于 2012 年发布,它定义了创建无障碍 PDF 文档的技术要求。
关键的 PDF/UA 要求包括:
- 所有内容必须被标记或标记为工件
- 标记必须遵循逻辑结构层次
- 所有图像必须有替代文本(除非是装饰性的)
- 必须指定文档语言
- 安全设置不得干扰辅助技术
- 字体必须嵌入或使用标准字体
- 必须存在 Unicode 字符映射
PDF/UA 合规性是二元的——文档要么满足所有要求,要么不满足。没有部分合规。
WCAG 2.1 和 2.2
Web 内容无障碍指南(WCAG)适用于所有数字内容,包括 PDF。虽然 WCAG 最初是为 Web 内容设计的,但其原则直接转化为 PDF 文档。
WCAG 围绕四个原则(POUR)组织:
- 可感知:信息必须以用户可以感知的方式呈现(替代文本、颜色对比度、字幕)
- 可操作:界面组件必须可操作(键盘导航、充足时间、无癫痫诱发内容)
- 可理解:信息和操作必须可理解(可读文本、可预测行为、输入帮助)
- 健壮:内容必须足够健壮以与当前和未来的技术一起工作(有效标记、兼容性)
WCAG 有三个合规级别:
- A 级:最低无障碍访问(基本)
- AA 级:推荐的无障碍访问(大多数法律要求的标准)
- AAA 级:增强的无障碍访问(理想但并非总是可实现)
大多数组织的目标是 WCAG 2.1 AA 级合规性,这是全球大多数无障碍法律中引用的标准。
专业提示:文档可以符合 PDF/UA 但仍然不符合 WCAG 要求(如颜色对比度),反之亦然。为了完全无障碍,目标是满足两个标准。
常见的无障碍问题和障碍
即使是善意的 PDF 创建者也经常在不知不觉中引入无障碍障碍。了解这些常见问题可以帮助您从一开始就避免它们。
1. 缺失或不正确的标记
这是最基本的无障碍问题。通过扫描文档、使用"打印为 PDF"或从没有无障碍设置的应用程序导出创建的 PDF 通常是未标记的。
即使存在标记,它们通常也是不正确的——标题标记为段落、列表结构不正确或阅读顺序与逻辑流程不匹配。
2. 图像没有替代文本
每个有意义的图像都需要描述性替代文本。屏幕阅读器用户依靠这些描述来理解视觉内容。
常见错误包括:
- 根本没有替代文本
- 通用替代文本,如"图像"或"照片"
- 文件名作为替代文本("IMG_2847.jpg")
- 替代文本太长或太短
- 装饰性图像未标记为工件
3. 颜色对比度差
与背景对比度不足的文本对于低视力或色盲用户来说难以或不可能阅读。
WCAG 要求:
- 普通文本(18pt 以下或 14pt 粗体以下)4.5:1 对比度
- 大文本(18pt+ 或 14pt+ 粗体)3:1 对比度
- UI 组件和图形 3:1 对比度
白色背景上的浅灰色文本是常见的违规者,彩色文本组合对视力正常的用户看起来不错,但不符合对比度要求。
4. 不可访问的表格
表格对于组织数据很有用,但没有适当的结构就会变得混乱。常见的表格问题包括:
- 没有标记标题行或列
- 具有合并单元格且没有范围属性的复杂表格
- 用于布局而不是数据的表格
- 复杂数据缺少表格摘要
5. 非描述性链接文本
说"点击这里"、"阅读更多"或"下载"的链接在乱序阅读时不提供上下文。屏幕阅读器用户经常通过在链接之间跳转来导航,因此每个链接都需要自我描述。
不好:"有关更多信息,点击这里。"
好:"阅读我们的PDF 无障碍访问完整指南。"
6. 扫描文档(仅图像 PDF)
通过扫描纸质文档创建的 PDF 本质上是没有可选文本的图像。除非应用 OCR(光学字符识别)并正确标记文档,否则这些对屏幕阅读器完全不可访问。
7. 表单字段没有标签
交互式 PDF 表单需要适当的标签、工具提示和 Tab 键顺序。没有这些,用户无法识别每个字段中应填写什么信息,也无法使用键盘有效地导航表单。
8. 缺少文档属性
文档语言、标题和元数据帮助辅助技术正确呈现内容。缺少语言属性会导致屏幕阅读器使用错误的发音规则。
快速提示:使用我们的 PDF 验证器在发布文档之前自动检测许多这些常见问题。
如何测试和检查 PDF 无障碍访问
测试对于确保您的 PDF 真正无障碍至关重要。结合自动化工具和手动测试的多层方法提供最全面的结果。
自动化测试工具
Adobe Acrobat Pro 无障碍检查器
Adobe Acrobat Pro 中的内置检查器是使用最广泛的工具。它检查:
- 文档结构和标记
- 图像的替代文本
- 颜色对比度(有限)
- 安全设置
- 文档属性
运行它:工具 > 辅助功能