·5분 읽기
PDF 글자수 세기 — Word 한글 PDF 파일 글자수 확인 5가지 방법
PDF 파일의 글자수·단어수·바이트를 정확히 세는 5가지 방법. Adobe Acrobat·Word 변환·온라인 도구·Python·OCR까지 한글 PDF에 맞는 방법별 정확도 비교.

✏️
글자수 세기 바로 사용하기
글자수, 단어수, 바이트를 실시간으로 세어보세요
→
PDF 글자수, 왜 정확히 세야 할까?
자기소개서·논문·과제·계약서를 PDF로 받았는데 '5,000자 이내' 요건이 있으면 글자수를 세야 해요. PDF는 워드처럼 자동 글자수 표시가 없어서 따로 작업 필요.
언제 필요해.
1. **자기소개서·논문 글자수 검증** — '4,000자 이내' 같은 제출 규정
2. **번역 견적** — 글자당·단어당 단가 계산
3. **계약서 검토** — 분량 비교, 변경 추적
4. **저작권·표절 검사** — 분량 기준 인용 한도 판단
5. **인쇄 비용 산정** — 페이지·글자 단위 견적
오늘은 5가지 방법을 정확도·편의성으로 비교해 드릴게요. 한글 PDF에서 정확도 차이가 크니까 끝까지 읽으세요.
방법 1) Adobe Acrobat — 가장 정확
유료지만 가장 정확. PDF 표준 만든 회사라 텍스트 추출이 깔끔.
사용법.
1. Adobe Acrobat Pro 또는 DC 열기
2. PDF 파일 열기
3. 메뉴 → 편집 → 모두 선택 (Ctrl+A)
4. 복사 (Ctrl+C)
5. 워드·메모장에 붙여넣기
6. 워드 글자수 기능으로 카운트
또는 Acrobat 자체 기능.
1. 메뉴 → 도구 → 통계
2. 글자수·단어수·문자수 표시
장점.
- 한글·영어·특수문자 정확
- 페이지·열 구분 인식
- 표·각주 포함
단점.
- 유료 (월 19,000원)
- 이미지 PDF는 OCR 필요
전문가용. 회사·연구실에서 자주 쓰면 가성비 좋아요.
방법 2) Word 변환 — 무료, 한글 정확
PDF를 Word(.docx)로 변환 후 글자수 자동 표시. 한컴오피스도 동일.
사용법 (MS Word).
1. Word 열기 → 파일 → 열기 → PDF 선택
2. '문서로 변환' 알림 나오면 확인
3. 메뉴 → 검토 → 글자 수 (또는 단어 수)
4. 글자수·단어수·문장수·줄수·문단수 표시
사용법 (한컴오피스).
1. 한글 → 파일 → PDF 가져오기
2. 메뉴 → 도구 → 글자 수
3. 한글·영문·숫자·특수문자별 분석
장점.
- 무료 (Office·한컴 라이선스 있으면)
- 한글 인식 정확
- 공백 포함·제외 둘 다
단점.
- 변환 시 레이아웃 깨질 수 있음
- 표·이미지 안 텍스트 누락 가능
- 100페이지 이상이면 변환 시간 김 (5~10분)
학생·일반 사용자에게 가장 무난.
방법 3) 온라인 도구 — 빠른 확인
PDF 업로드만으로 글자수 분석. 짧은 문서·즉석 확인에 편리.
주요 도구.
- **PDF24 Tools**: 무료, EU 서버, 한글 OK
- **Smallpdf**: 월 2회 무료, 그 후 유료
- **iLovePDF**: 무료, 회원가입 필요
- **Online2PDF**: 회원가입 X, 한 번에 5MB 제한
사용법 (PDF24).
1. tools.pdf24.org 접속 → 'PDF에서 텍스트 추출'
2. PDF 업로드
3. 추출된 텍스트 다운로드
4. [Toolkio 글자수 세기](https://toolkio.com/tools/character-counter)에 붙여넣기 → 글자수·바이트 한 번에
장점.
- 설치 불필요
- 모바일에서도 가능
- 빠름 (1분 내)
단점·주의.
- **민감 문서는 업로드 X** — 회사 계약서·개인정보 포함 PDF는 절대 안 됨
- 무료 버전 파일 크기 제한 (보통 5~10MB)
- OCR 필요한 스캔 PDF는 추출 안 됨
간단한 자기소개서·블로그 글이면 적합.
방법 4) Python pdfplumber — 자동화
Python으로 글자수 자동 계산. 여러 PDF 일괄 처리에 유리.
설치.
```
pip install pdfplumber
```
코드.
```
import pdfplumber
with pdfplumber.open('document.pdf') as pdf:
text = ''
for page in pdf.pages:
text += page.extract_text() or ''
# 글자수
print(f'전체 글자수: {len(text)}')
print(f'공백 제외: {len(text.replace(chr(32), "").replace(chr(10), ""))}')
# 단어수
print(f'단어수: {len(text.split())}')
# 한글만
import re
hangul = re.findall(r'[가-힣]', text)
print(f'한글 글자수: {len(hangul)}')
# 바이트
print(f'UTF-8 바이트: {len(text.encode("utf-8"))}')
```
결과 예시.
```
전체 글자수: 12,345
공백 제외: 9,876
단어수: 2,345
한글 글자수: 8,765
UTF-8 바이트: 35,678
```
장점.
- 100개 PDF 일괄 처리 가능
- 정확도 90%+ (텍스트 PDF)
- 무료
단점.
- Python 설치·코드 작성 필요
- 스캔 이미지 PDF는 OCR 추가 필요
개발자·연구자가 다량 처리할 때 추천.
방법 5) OCR — 스캔 이미지 PDF
복사·붙여넣기 안 되는 PDF는 이미지 형태. OCR(광학 문자 인식)로 텍스트화 후 글자수 카운트.
주요 도구.
- **Adobe Acrobat OCR**: 가장 정확, 한글 지원, 유료
- **Tesseract** (오픈소스): 무료, 한글 학습 데이터 다운로드 필요
- **네이버 클로바 OCR**: 한글 정확도 95%+, 월 1000건 무료
- **Google Cloud Vision**: 정확 95%+, 월 1000건 무료
- **ABBYY FineReader**: 상용, 정확도 가장 높음
Tesseract 사용법 (Python).
```
pip install pytesseract pdf2image Pillow
```
```
from pdf2image import convert_from_path
import pytesseract
images = convert_from_path('scanned.pdf')
text = ''
for img in images:
text += pytesseract.image_to_string(img, lang='kor+eng')
print(f'글자수: {len(text)}')
```
주의.
- 한글 OCR은 영어보다 정확도 낮음 (90~95%)
- 손글씨·낮은 해상도 스캔은 정확도 70%
- 처음 OCR 결과 검토 후 보정 권장
공무원 시험 답안지·계약서 스캔본 분석에 필수.
방법별 정확도·편의성 비교
한글 PDF 100페이지 자기소개서 기준 비교.
| 방법 | 정확도 | 비용 | 시간 | 추천 |
| --- | --- | --- | --- | --- |
| Adobe Acrobat | 99% | 월 19,000원 | 1분 | 회사·전문가 |
| Word 변환 | 97% | 무료(라이선스) | 5분 | 일반 사용자 |
| 온라인 도구 | 95% | 무료 | 1분 | 비민감 문서 |
| Python | 98% | 무료 | 코딩 30분, 실행 10초 | 다량 처리 |
| OCR | 92% | 다양 | 5분/페이지 | 스캔 PDF |
빠른 가이드.
- **자기소개서 PDF 한 번 확인**: 온라인 도구 → Toolkio 글자수
- **회사 보고서**: Word 변환
- **민감 문서**: Adobe Acrobat (오프라인)
- **100개 이상**: Python
- **스캔본**: OCR
어떤 방법이든 결과를 [Toolkio 글자수 세기](https://toolkio.com/tools/character-counter)에 붙여넣어 검증하면 글자수·공백 제외·바이트 한 번에 비교 가능.
Toolkio 글자수 세기로 마무리
PDF에서 텍스트 추출했으면 [Toolkio 글자수 세기](https://toolkio.com/tools/character-counter)에 붙여넣어 정확한 통계 확인.
표시 정보.
1. **전체 글자수**: 한글·영어·숫자·특수문자
2. **공백 제외 글자수**: 자기소개서 기준
3. **단어수**: 영어 띄어쓰기 기준
4. **문장수**: 마침표·물음표 기준
5. **문단수**: 줄바꿈 기준
6. **바이트**: UTF-8 기준 (DB 컬럼·SMS 검증)
사용 흐름.
1. PDF에서 텍스트 추출 (위 5가지 방법 중 하나)
2. Toolkio에 붙여넣기
3. 모든 통계 즉시 표시
4. 자기소개서 요건 (예: 5,000자 이내)와 비교
주의. PDF에 표·각주가 많으면 추출 시 순서 뒤바뀔 수 있어요. 추출된 텍스트 한 번 읽어보고 누락·중복 확인.
더 자세한 글자수 활용은 [엑셀 LEN/LENB 함수 활용](/blog/excel-len-lenb-character-count-korean)에서, 자기소개서 글자수는 [한국어 자기소개서 글자수](/blog/korean-resume-char-count)에서 이어 보세요.