PDF 압축: 품질 손실 없이 파일 크기를 줄이는 방법

· 12분 읽기

PDF 파일은 특히 고해상도 이미지, 임베디드 폰트 또는 복잡한 그래픽이 포함된 경우 다루기 힘든 크기로 커지는 것으로 유명합니다. 문서를 이메일로 보내거나, 크기 제한이 있는 웹 포털에 업로드하거나, 단순히 저장 공간을 절약하려는 경우, PDF를 효과적으로 압축하는 방법을 이해하는 것이 필수적입니다.

이 종합 가이드는 PDF를 크게 만드는 요인을 이해하는 것부터 품질을 유지하는 실용적인 압축 전략을 구현하는 것까지 PDF 압축의 기술적 세부 사항을 안내합니다. 다양한 압축 알고리즘, 명령줄 도구, 그리고 손실 압축과 무손실 압축 기술을 언제 사용해야 하는지 배우게 됩니다.

목차

PDF가 커지는 이유

PDF는 기본적으로 여러 유형의 콘텐츠를 담을 수 있는 컨테이너 형식입니다: 텍스트, 이미지, 폰트, 벡터 그래픽, JavaScript, 멀티미디어 요소 및 광범위한 메타데이터. 파일 크기에 기여하는 요소를 이해하는 것이 효과적인 압축을 위한 첫 번째 단계입니다.

PDF 사양은 놀라운 유연성을 허용하지만, 이는 대가가 따릅니다. 추가하는 각 요소는 파일 크기를 증가시키며, 적절한 최적화 없이는 간단한 문서도 놀라울 정도로 커질 수 있습니다.

원인 일반적인 영향 예시 해결책
고해상도 이미지 파일 크기의 60-90% 단일 300 DPI 사진은 5-15 MB가 될 수 있음 화면 보기용으로 150 DPI로 다운샘플링
임베디드 폰트 폰트당 200 KB - 5 MB CJK 폰트는 각각 10 MB를 초과할 수 있음 사용된 글리프만 포함하도록 폰트 서브셋팅 사용
압축되지 않은 스트림 필요한 것보다 2-5배 큼 Flate 압축 없는 텍스트 및 벡터 데이터 PDF 생성 중 스트림 압축 적용
중복 리소스 가변적 모든 페이지에 임베디드된 동일한 이미지 리소스를 한 번 참조하고 페이지 전체에서 재사용
메타데이터 및 썸네일 100 KB - 2 MB 페이지 썸네일, XMP 메타데이터, 편집 기록 불필요한 메타데이터 및 썸네일 제거
증분 저장 10-50% 오버헤드 각 저장은 다시 쓰는 대신 변경 사항을 추가함 전체 PDF 구조를 선형화하거나 다시 작성

파일에서 정확히 무엇이 공간을 소비하고 있는지 분석하려면 PDF 정보 도구를 사용하세요. 이 진단 단계는 압축을 적용하기 전에 중요하며, 최적화 노력을 어디에 집중해야 하는지 알려줍니다.

전문가 팁: 이미지는 거의 항상 주요 원인입니다. PDF가 5 MB를 초과하는 경우, 폰트나 메타데이터를 걱정하기 전에 이미지 해상도 및 압축 설정을 먼저 검토하세요.

압축 방법 이해하기

PDF 압축은 단일 기술이 아니라 문서 내의 다양한 콘텐츠 유형에 적용되는 전략의 모음입니다. 각 콘텐츠 유형—이미지, 텍스트, 폰트, 벡터 그래픽—은 다른 접근 방식이 필요합니다.

이미지 다운샘플링

다운샘플링은 이미지가 많은 PDF에 가장 효과적인 압축 기술입니다. 픽셀 수를 줄여 이미지 해상도를 낮추어 파일 크기를 직접적으로 줄입니다. 300 DPI 이미지를 150 DPI로 다운샘플링하면 픽셀 수가 약 4분의 1로 줄어듭니다.

세 가지 주요 다운샘플링 방법이 있습니다:

선택하는 해상도는 문서의 의도된 용도에 전적으로 달려 있습니다. 화면 보기는 거의 150 DPI 이상을 필요로 하지 않으며, 전문 인쇄는 일반적으로 300 DPI 이상이 필요합니다.

이미지 재압축

다운샘플링 후, 더 효율적인 코덱으로 이미지를 재압축하여 크기를 더 줄일 수 있습니다. 다양한 이미지 유형은 다양한 압축 알고리즘의 이점을 받습니다.

형식 유형 최적 용도 품질 참고사항 일반적인 압축 비율
JPEG 손실 사진, 스캔 문서 품질 75-85에서 양호 10:1 ~ 20:1
JPEG2000 손실/무손실 고품질 사진 동일한 크기에서 JPEG보다 우수 15:1 ~ 30:1
JBIG2 손실/무손실 흑백 텍스트/스캔 CCITT보다 10-30배 작음 50:1 ~ 100:1
Flate (ZIP) 무손실 스크린샷, 다이어그램 완벽한 품질, 중간 압축 2:1 ~ 4:1
CCITT Group 4 무손실 흑백 팩스 품질 스캔 1비트 이미지에 완벽 10:1 ~ 20:1

JPEG는 컬러 사진에 가장 널리 지원되고 효과적인 형식으로 남아 있습니다. JPEG2000은 더 나은 압축을 제공하지만 일부 PDF 리더에서 제한적인 지원을 받습니다. 흑백 문서의 경우 JBIG2는 놀라울 정도로 효율적이지만 전문 도구가 필요합니다.

손실 압축 vs 무손실 압축

손실 압축과 무손실 압축의 차이를 이해하는 것은 PDF 최적화에 대한 정보에 입각한 결정을 내리는 데 기본입니다.

무손실 압축

무손실 압축은 정보를 버리지 않고 파일 크기를 줄입니다. 파일의 압축을 풀면 시작한 것과 정확히 동일한 것을 비트 단위로 얻습니다. 이는 정확성이 중요한 문서에 필수적입니다.

일반적인 무손실 기술은 다음과 같습니다:

무손실 압축은 일반적으로 텍스트 및 벡터 콘텐츠에 대해 2:1 ~ 4:1 압축 비율을 달성합니다. 이미지의 경우 비율은 이미지 특성에 크게 의존합니다—스크린샷은 잘 압축되지만 사진은 그렇지 않습니다.

손실 압축

손실 압축은 인간의 시각에 덜 인지되는 정보를 영구적으로 버려 훨씬 높은 압축 비율을 달성합니다. 일단 적용되면 원본 데이터를 복구할 수 없습니다.

핵심은 파일 크기가 크게 감소하지만 사용 사례에 대해 품질이 허용 가능한 최적의 지점을 찾는 것입니다. JPEG 품질 설정 85는 일반적으로 압축되지 않은 것과 비교하여 파일 크기를 80-90% 줄이면서 우수한 시각적 품질을 제공합니다.

빠른 팁: 동일한 이미지에 손실 압축을 여러 번 적용하지 마세요. 각 압축 패스는 품질을 더욱 저하시킵니다. 재압축이 필요한 경우 가능하면 항상 원본 압축되지 않은 소스에서 시작하세요.

각 유형을 사용해야 하는 경우

다음과 같은 경우 무손실 압축을 선택하세요:

다음과 같은 경우 손실 압축을 선택하세요:

이미지 최적화 기술

이미지는 일반적으로 PDF 파일 크기의 60-90%를 차지하므로 이미지를 최적화하면 가장 큰 영향을 미칩니다. 다음은 이미지 최적화에 대한 체계적인 접근 방식입니다.

해상도 가이드라인

적절한 해상도는 PDF가 사용되는 방식에 전적으로 달려 있습니다:

화면 보기용 대부분의 PDF는 인지 가능한 품질 손실 없이 150 DPI를 안전하게 사용할 수 있습니다. 이것만으로도 300 DPI 이미지에 비해 파일 크기를 75% 줄일 수 있습니다.

색 공간 최적화

컬러 이미지는 그레이스케일 또는 흑백보다 훨씬 많은 데이터를 사용합니다. 문서에 색상이 필요하지 않은 경우 그레이스케일로 변환하면 이미지 크기를 60-70% 줄일 수 있습니다.

주로 텍스트이고 가끔 컬러 요소가 있는 문서의 경우 다음을 고려하세요:

PDF를 이미지로 변환 도구를 사용하여 개별 페이지를 추출하고 분석하여 실제로 색상이 필요한 페이지를 결정할 수 있습니다.

JPEG 품질 설정

JPEG 품질은 일반적으로 0-100 척도로 지정되지만 정확한 의미는 구현에 따라 다릅니다. 다음은 실용적인 가이드입니다:

대부분의 비즈니스 문서 및 프레젠테이션의 경우 80-85의 품질 설정이 파일 크기와 시각적 품질 사이의 최상의 균형을 제공합니다.

폰트 서브셋팅 및 임베딩

폰트는 특히 여러 서체 또는 비라틴 스크립트를 사용할 때 PDF 파일 크기에 크게 기여할 수 있습니다. 폰트 임베딩 및 서브셋팅을 이해하는 것은 최적화에 중요합니다.

폰트 임베딩 작동 방식

PDF를 만들 때 폰트를 처리하는 세 가지 옵션이 있습니다:

전체 폰트 파일에는 여러 언어 및 특수 문자를 포함하는 수천 개의 글리프가 포함되어 있습니다. 문서에서 50개의 문자만 사용하는 경우 서브셋팅은 사용하지 않는 글리프를 제거합니다. 2 MB 폰트는 서브셋팅 후 30 KB로 줄어들 수 있습니다.

폰트 서브셋팅 모범 사례

최신 PDF 생성 도구는 기본적으로 폰트를 자동으로 서브셋하지만, 특히 오래된 소프트웨어로 작업하거나 다른 형식에서 변환할 때 이를 확인해야 합니다.

주요 고려 사항:

전문가 팁: 프로그래밍 방식으로 PDF를 생성하는 경우 라이브러리 구성에서 항상 폰트 서브셋팅을 활성화하세요. 이 단일 설정은 텍스트가 많은 문서에서 파일 크기를 수 메가바이트 줄일 수 있습니다.

표준 폰트

PDF는 모든 PDF 리더가 지원해야 하는 14개의 "표준 폰트"를 정의합니다: Times, Helvetica, Courier(각각 일반, 굵게, 기울임꼴 및 굵은 기울임꼴), Symbol 및 ZapfDingbats. 이러한 폰트를 사용하면 임베딩이 완전히 필요하지 않습니다.

그러나 표준 폰트에는 제한 사항이 있습니다:

다양한 사용 사례에는 다양한 압축 전략이 필요합니다. 여기