업무를 하다 보면 자료 공유나 보관을 위해 PDF 파일을 워드(Word) 문서로 변환해야 하는 상황이 빈번하게 발생합니다. 하지만 단순히 변환 프로그램을 돌렸을 때, 글자가 외계어처럼 깨지거나 표의 줄이 맞지 않고 그림이 텍스트를 가리는 등 레이아웃이 완전히 무너지는 경험을 해보셨을 겁니다. 이는 폰트 데이터의 누락이나 PDF 내부의 객체 구조가 워드의 서식과 호환되지 않기 때문입니다.
이러한 문제는 문서의 신뢰도를 떨어뜨릴 뿐만 아니라, 이를 수정하기 위해 수동으로 타이핑을 다시 해야 하는 등 엄청난 시간 낭비를 초래합니다. 본 포스팅에서는 별도의 유료 프로그램 없이도 깨짐 현상을 최소화하고 원본에 가까운 서식을 유지하며 PDF를 워드로 변환하는 가장 확실한 단계별 가이드를 정리해 드립니다.
| 핵심 요약: PDF 변환 시 발생하는 글자 깨짐은 OCR(광학 문자 인식) 설정 미비와 내장 폰트 부재가 주된 원인입니다. 구글 드라이브의 문서 변환 기능을 활용하거나, MS 워드의 자체 PDF 가져오기 기능을 사용하면 서식 유지율을 90% 이상 높일 수 있습니다. 특히 복잡한 표가 포함된 경우 온라인 변환 툴보다는 오프라인 소프트웨어 설정을 조정하는 것이 유리합니다. |
문제 원인
PDF 파일이 워드로 변환될 때 서식이 망가지는 이유는 크게 4가지로 분류할 수 있습니다.
- 폰트 임베딩 미흡: PDF 제작 당시 폰트 정보가 파일에 포함(Embedding)되지 않아, 변환 시 시스템에 해당 폰트가 없으면 기본 폰트로 대체되며 자간과 행간이 뒤틀립니다.
- 이미지 기반 PDF: 스캔한 문서의 경우 텍스트가 아닌 '그림'으로 인식됩니다. 일반 변환기로는 텍스트 추출이 불가능하여 깨진 이미지로 표시됩니다.
- 복잡한 레이아웃 구조: 다단 구성, 텍스트 상자 겹침, 복잡한 표(Table)는 PDF의 좌표 기반 방식과 워드의 흐름 기반 방식 간의 충돌을 일으킵니다.
- 인코딩 방식 차이: 조합형과 완성형 한글 인코딩의 차이로 인해 자음과 모음이 분리되어 보이는 현상이 발생합니다.
해결 방법 1: MS 워드 자체 기능 활용 (가장 추천)
최신 버전의 마이크로소프트 워드(MS Word)는 자체적으로 PDF를 워드 문서로 리플로우(Reflow)하는 강력한 기능을 갖추고 있습니다. 별도의 사이트를 이용하는 것보다 보안상 안전하며 한글 깨짐이 적습니다.
- MS 워드 프로그램을 실행합니다.
- 상단 메뉴에서 [파일] > [열기] > [찾아보기]를 클릭합니다.
- 변환하고자 하는 PDF 파일을 선택하고 열기를 누릅니다.
- "워드에서 PDF를 편집 가능한 Word 문서로 변환합니다. 이 작업은 다소 시간이 걸릴 수 있습니다..."라는 안내창이 뜨면 확인을 클릭합니다.
- 변환이 완료되면 레이아웃을 확인하고 [다른 이름으로 저장]을 통해 .docx 확장자로 저장합니다.
해결 방법 2: 구글 드라이브 및 문서(Docs) 활용 (OCR 방식)
만약 PDF가 스캔된 이미지 형태라 글자 선택이 되지 않는다면, 구글의 강력한 OCR 기능을 활용해야 합니다.
- 구글 드라이브에 접속하여 PDF 파일을 업로드합니다.
- 업로드된 파일 위에서 마우스 오른쪽 버튼을 클릭합니다.
- [연결 앱] > [구글 문서]를 차례대로 선택합니다.
- 구글 인공지능이 이미지 내의 텍스트를 분석하여 텍스트 형태로 변환해 줍니다. (이때 상단에는 원본 이미지가, 하단에는 추출된 텍스트가 배치됩니다.)
- 변환된 구글 문서에서 [파일] > [다운로드] > [Microsoft Word(.docx)]를 선택하여 저장합니다.
해결 방법 3: 온라인 전문 변환 사이트 설정 최적화
Smallpdf나 iLovePDF 같은 사이트를 이용할 때도 단순히 파일만 올리는 것이 아니라 설정을 확인해야 합니다.
- 변환 사이트에 접속하여 파일을 업로드합니다.
- 가능하다면 'OCR로 변환' 옵션을 선택합니다. (무료 버전에서도 제한적으로 제공되는 경우가 많습니다.)
- 변환 전 언어 설정이 'Korean(한국어)'으로 되어 있는지 반드시 확인합니다. 언어 설정이 영어로 되어 있으면 한글 자모 분리 현상이 발생합니다.
- 변환된 파일을 내려받은 후, MS 워드에서 [전체 선택(Ctrl+A)] 후 맑은 고딕 등 표준 폰트로 일괄 변경하면 깨진 글자가 복구되는 경우가 많습니다.
그래도 해결되지 않을 때
위 방법들로도 표가 완전히 깨지거나 글자가 복구되지 않는다면 다음의 대안을 시도해 보세요.
- Adobe Acrobat Pro 활용: PDF의 종가인 어도비 정식 프로그램의 '내보내기' 기능은 가장 정교한 알고리즘을 사용합니다. 체험판을 통해 1회성으로 해결할 수 있습니다.
- 텍스트만 추출: 서식은 포기하되 내용이 중요하다면, PDF에서 텍스트를 전체 복사하여 메모장에 붙여넣어 인코딩을 정리한 뒤 다시 워드로 옮깁니다.
- 화면 캡처 후 OCR: 특정 부분의 표가 너무 복잡하다면 해당 부분만 고화질 캡처하여 'OneNote'나 '구글 렌즈'의 텍스트 추출 기능을 사용하는 것이 빠릅니다.
문제 예방 방법
향후 본인이 직접 PDF를 만들 때 다른 사람이 변환하기 쉽게 하려면 다음 수칙을 지키는 것이 좋습니다.
- PDF 저장 시 '모든 폰트 포함(Embed all fonts)' 옵션을 체크합니다.
- 이미지 형태의 PDF보다는 텍스트 정보가 살아있는 '벡터 방식'의 PDF로 저장합니다.
- 표(Table) 기능을 사용할 때는 셀 병합을 최소화하는 것이 변환 호환성을 높이는 길입니다.
자주 묻는 질문
Q. 변환 후 표의 테두리가 사라졌어요. 어떻게 하나요?
A. 텍스트는 넘어왔으나 표 속성이 투명하게 설정된 경우입니다. 워드에서 해당 영역을 드래그한 뒤 [표 디자인] 탭에서 [테두리] > [모든 테두리]를 선택하면 다시 나타납니다.
Q. '비밀번호가 걸려 있는 파일'이라 변환이 안 됩니다.
A. 편집 권한이 제한된 PDF는 변환이 불가능합니다. 먼저 PDF 잠금 해제 툴을 이용해 권한을 푼 뒤 변환 과정을 진행해야 합니다.
마무리 요약
PDF 워드 변환 시 글자 깨짐 방지를 위해서는 1) MS 워드의 자체 열기 기능 우선 사용, 2) 스캔 문서는 구글 문서 OCR 활용, 3) 변환 후 폰트 일괄 변경 세 가지만 기억하시면 됩니다. 대부분의 서식 오류는 폰트 치환 과정에서 발생하므로, 변환 직후 표준 폰트로 설정을 바꿔주는 것만으로도 가독성을 크게 높일 수 있습니다. 이제 일일이 타이핑하지 마시고 스마트한 도구 활용으로 업무 효율을 높여보시기 바랍니다.
