마이일타 로고
TECH

HWP, HWPX, HML 차이 완벽 정리: 한글 파일은 어떤 형식으로 저장해야 할까?

게시일: 2026-05-07 11:03

Key Takeaways

이 글을 읽고 나면

8
  • 01HWP는 오래된 한글 문서 호환성이 강한 형식이지만, 내부 구조가 사람과 AI에게 바로 보이지 않는 "잠긴 상자"에 가깝습니다
  • 02HWPX는 문제, 답, 해설, 수식, 그림, 메타 정보를 구조화하면서도 사용자가 익숙한 한글 파일 편집 경험을 유지하기 좋습니다
  • 03HML은 한글 문서를 XML처럼 풀어 놓은 HWPML 문서로, 일반 배포용보다는 변환, 보조 저장, 레거시 연동에 가깝습니다
  • 04AI 자동화와 대량 문서 처리는 HWP보다 HWPX가 유리합니다
  • 05마이일타는 HWPX를 통해 문제·답·해설·메타 정보를 DB화하면서도 강사가 한글에서 바로 편집할 수 있는 결과물을 남깁니다

한글 파일을 주고받다 보면 .hwp, .hwpx, .hml 확장자가 섞여 나옵니다. 셋 다 "한글 파일"처럼 보이지만, 실제로는 저장 구조와 쓰임새가 꽤 다릅니다.

한 줄 요약: HWP는 오래된 한글 문서 호환성에 강하지만 자동화에는 무겁고, HWPX는 문서 내용을 정리된 구조로 담아 AI와 자동화가 다루기 쉬우며, HML은 일반 사용자용보다는 특정 변환·연동에 가까운 형식입니다.

교육 현장에서는 이 차이가 단순한 파일 확장자 문제가 아닙니다. 시험지 PDF를 한글로 바꾸거나, 수식과 표가 많은 교재를 자동으로 만들거나, 여러 강사와 문서를 주고받을 때 어떤 형식으로 저장하느냐에 따라 후편집 시간이 달라집니다.

먼저 어려운 용어를 쉽게 풀어보겠습니다#

이 글에는 XML, 바이너리, OWPML, HWPML 같은 말이 나옵니다. 개발자가 아니라면 낯설 수밖에 없습니다. 그래서 먼저 비유로 정리하겠습니다.

용어쉬운 비유실제 의미
바이너리잠긴 상자프로그램이 빠르게 읽도록 압축·정리된 형식입니다. 사람이 열어 구조를 바로 보기 어렵습니다.
XML라벨이 붙은 서류 봉투"여기는 제목", "여기는 표", "여기는 수식"처럼 내용에 이름표가 붙은 글자 기반 구조입니다.
OWPMLHWPX의 설계 규칙HWPX 문서를 어떤 방식으로 정리할지 정한 공개 문서 규칙입니다.
HWPMLHML의 설계 규칙예전 한글 문서를 XML처럼 풀어내기 위한 문서 규칙입니다.

즉, 소비자 입장에서 핵심은 하나입니다. HWP는 한글 프로그램이 잘 여는 형식이고, HWPX는 한글 파일로 편집 가능하면서도 문서 안의 문제, 답, 해설, 수식, 그림 같은 정보를 구조화하기 좋은 형식입니다. HML은 일반 사용자가 일부러 고를 형식이라기보다, 특정 서비스나 변환 과정에서 쓰이는 기술 형식에 가깝습니다. 생성된 이미지 1.png

HWP, HWPX, HML 한눈에 비교#

구분HWPHWPXHML
정체한컴 한글의 전통 문서 형식구조가 공개된 최신 한글 문서 형식한글 문서를 XML처럼 풀어 놓은 형식
쉬운 비유잠긴 상자정리된 서류 봉투개발자용 설계도
내부 구조바이너리, CFB 구조ZIP 패키지 안의 XML 파일 구조HWPML 기반 XML 문서
대표 용도기존 한글 문서 보관, 구버전 사용자와 공유최신 한글 문서 작성, 공공/학교 제출, 자동화보조 저장, 변환, 레거시 연동
사람/AI가 읽기 쉬운가낮음높음비교적 높음
호환성구버전 한글 사용자에게 유리최신 한글/뷰어 환경에 유리일반 배포용으로는 덜 익숙함
추천 상황상대가 오래된 한글을 쓸 때새 문서 제작, AI 변환, 대량 처리특정 시스템이 HML을 요구할 때

결론부터 말하면, 새로 만드는 교육 자료는 HWPX를 기본값으로 두는 것이 좋습니다. 다만 상대방의 한글 버전이 오래되었거나, 기관에서 HWP를 요구한다면 마지막 단계에서 HWP로 변환해 전달하면 됩니다.

HWP: 오래된 호환성은 강하지만 자동화에는 무겁습니다#

HWP는 국내 교육, 공공, 학원 현장에서 오랫동안 쓰인 한글 문서 형식입니다. 한컴 공식 기술 자료에 따르면 HWP는 바이너리 형식이며, 내부적으로 여러 스트림을 담는 Compound File Binary 구조를 사용합니다.

쉽게 말하면 HWP는 "잘 포장된 택배 상자"에 가깝습니다. 한글 프로그램은 이 상자를 여는 방법을 정확히 알고 있습니다. 그래서 한글에서는 자연스럽게 열립니다. 하지만 AI나 서버 프로그램 입장에서는 상자 안의 물건이 어떤 순서로 들어 있는지 바로 보이지 않습니다. 본문, 표, 그림, 수식, 미주, 서식이 어디에 어떤 방식으로 들어 있는지 해석하는 과정이 필요합니다.

HWP의 장점은 분명합니다.

  • 오래된 한글 프로그램에서도 열릴 가능성이 높습니다
  • 기존 기관, 학원, 강사 문서 자산과 잘 맞습니다
  • 이미 만들어진 서식, 양식, 템플릿이 많습니다

하지만 자동화 관점에서는 불리합니다. 바이너리 구조라서 텍스트, 표, 수식, 그림을 읽고 수정하려면 포맷 스펙을 정확히 이해해야 합니다. 사람에게는 그냥 한글 파일이지만, AI나 서버 프로그램에게는 "바로 읽히는 문서"가 아닙니다.

그래서 HWP는 최종 전달용이나 구버전 호환용으로는 여전히 유용하지만, 새 문서를 자동 생성하거나 대량 변환하는 엔진의 기준 형식으로 삼기에는 부담이 큽니다.

실제로 HWP를 읽을 수 있어도, 대량 편집은 여전히 어렵습니다#

최근 ChatGPT 같은 AI 도구는 다양한 파일을 업로드해 요약하거나 분석하는 기능을 제공합니다. OpenAI 공식 도움말은 PDF, DOCX, PPTX, TXT 등 일반적인 문서 파일 업로드를 안내합니다. 다만 해당 도움말에서 HWP를 명시 지원 형식으로 적고 있지는 않습니다.

그렇다고 HWP가 아예 분석 불가능한 파일이라는 뜻도 아닙니다. 실제 테스트 환경에서는 HWP에서 문제 본문, 답, 풀이, 문항 번호, 출처 태그 같은 일반 텍스트를 어느 정도 추출할 수 있습니다. 예를 들어 [광주21], [필수13.1.3], (1), (2), [답], [풀이]처럼 텍스트로 들어간 구조는 비교적 잘 잡힙니다.

하지만 여기서 중요한 점은 "읽기"와 "원본 편집"이 다르다는 것입니다.

  • HWP 원본의 표, 수식, 그림, 미주, 문단 서식을 그대로 이해하기
  • 100문제짜리 시험지의 문항 구조를 깨지지 않게 수정하기
  • 수식 일부만 고치고 한글 수식 객체로 다시 저장하기
  • 여러 파일을 한꺼번에 변환하고 같은 서식을 적용하기
  • 최종 HWP 파일을 사람이 열었을 때 레이아웃이 그대로 유지되게 만들기

이런 작업은 단순 요약이 아니라 문서 편집 엔진의 영역입니다. 한컴 자동화 도구를 쓰면 HWP 편집 자체는 가능합니다. 하지만 설치형 한글파일 자동 생성 프로그램, 왜 느리고 불안정할까?에서 정리했듯, 한글 프로그램을 실제로 켜고 명령을 하나씩 보내는 방식은 대량 작업에 부적절합니다. 보조 편집 도구로는 쓸 수 있지만, 수십~수백 페이지 교재를 빠르게 만들어내는 서버형 자동화에는 맞지 않습니다.

생성된 이미지 2.png

AI가 발전해도 이 문제는 쉽게 사라지지 않습니다. HWP 내부를 풀어서 AI에게 모두 설명하고, AI가 다시 수정 지시를 만들고, 자동화 도구가 한글 창을 조작하는 방식은 단계가 많습니다. 문서가 길수록 토큰도 많이 쓰고, 비용도 늘고, 중간 오류 지점도 많아집니다. 말 그대로 "토큰값이 더 나오는" 구조입니다.

그래서 실무적으로는 HWP를 AI에게 억지로 맡기는 것보다, 처음부터 HWPX처럼 구조가 열린 문서로 만들고 필요한 경우에만 HWP로 변환하는 방식이 더 안정적입니다.

HWPX: XML 기반이라 검색, 추출, 자동 생성에 강합니다#

HWPX는 OWPML을 기반으로 하는 개방형 한글 문서 형식입니다. 쉽게 말하면 HWPX는 "상자 안에 물건을 대충 넣어둔 파일"이 아니라, "서류 봉투 여러 개에 제목표를 붙여 정리한 파일"입니다.

생성된 이미지 4.png

HWPX 파일의 핵심은 "문서가 구조화되어 있다"는 점입니다. HWPX는 하나의 파일처럼 보이지만 내부적으로는 ZIP 패키지에 가깝고, 그 안에 Contents/header.xml, Contents/section0.xml, BinData/ 같은 구성 요소가 들어 있습니다.

여기서 XML은 문서 내용을 글자로 풀어 쓰면서 각 부분에 이름표를 붙이는 방식입니다. 예를 들어 "이 부분은 문단", "이 부분은 표", "이 부분은 그림", "이 부분은 수식"처럼 컴퓨터가 구분하기 쉬운 구조로 정리됩니다. 그래서 AI와 자동화 도구가 문서 내용을 찾고, 바꾸고, 다시 조립하기가 HWP보다 쉽습니다.

한컴 공식 FAQ는 OWPML을 XML 기반의 개방형 워드프로세서 마크업 언어이며 KS X 6101 표준으로 설명합니다. 한컴이 현재 기본 포맷으로 사용하는 HWPX도 이 OWPML을 기반으로 합니다.

이 구조는 교육 자료 제작에서 큰 장점이 됩니다.

  • 본문 텍스트를 XML 태그 기준으로 추출할 수 있습니다
  • 문단, 표, 그림, 수식 같은 요소를 구조적으로 다룰 수 있습니다
  • 서버에서 한글 프로그램을 켜지 않고 문서를 만들 수 있습니다
  • 버전 관리와 검수, 자동 비교에 유리합니다
  • AI가 문서의 의미와 구조를 함께 이해하기 쉽습니다

예를 들어 수학 시험지 PDF를 HWPX로 변환한다는 것은 단순히 글자를 OCR로 뽑는 일이 아닙니다. 문항 번호, 보기, 표, 수식, 그림 위치, 해설 미주 연결까지 한글 문서 구조 안에 다시 배치해야 합니다. 이때 HWPX는 XML 기반이기 때문에 자동화 엔진이 각 요소를 더 정밀하게 제어할 수 있습니다.

마이일타의 일타조교가 결과물을 HWPX로 제공하는 이유도 여기에 있습니다. 교육 문서 자동화에서는 "열리는 파일"보다 "후편집 가능한 구조"가 더 중요하기 때문입니다.

정부도 HWPX 전환을 가속화하고 있습니다#

HWPX가 단순히 "새 확장자"에 그치지 않는다는 점은 공공 문서 정책 흐름에서도 확인할 수 있습니다. 연합뉴스 2026년 4월 24일 보도에 따르면, 국가인공지능전략위원회는 행정안전부, 문화체육관광부와 함께 공공 문서 유통 채널에서 AI 인식 효율이 낮은 HWP 파일 첨부를 제한하겠다고 밝혔습니다.

보도 내용의 핵심은 세 가지입니다.

  • 온나라시스템은 2026년 5월 18일부터 지방정부까지 개방형 파일 전환을 확대 적용합니다
  • 온메일은 2026년 10월까지 개방형 전환을 추진합니다
  • 공직자통합메일은 유예기간을 거쳐 2026년 10월부터 HWP 첨부 제한을 본격 시행합니다

또한 행정안전부는 기존 HWP 파일도 재작성하거나 수정 저장할 때 HWPX로 변환 저장되도록 유도할 방침으로 보도됐습니다. 즉, 공공 문서 환경에서도 HWPX는 "호환 가능한 대체 포맷"을 넘어 AI 시대의 문서 데이터 활용을 위한 기본 포맷으로 이동하고 있습니다.

학원과 학교 자료 제작에서도 이 흐름은 그대로 적용됩니다. 앞으로 문서를 AI로 검색하고, 문제를 DB화하고, 수식·표·그림을 재사용하려면 HWP보다 HWPX 원본을 보관하는 쪽이 훨씬 유리합니다.

HML: HWPX와 헷갈리지만 일반 배포용 주력 형식은 아닙니다#

HML은 HWPML 문서의 확장자입니다. 한컴 도움말에서는 HWPML 1.x 문서와 HWPML 2.x 문서가 .hml 형식으로 열릴 수 있다고 안내하고, HWP 문서를 HWPML 2.1 문서로 함께 저장하는 옵션도 설명합니다.

쉽게 말하면 HML은 한글 문서를 XML처럼 풀어놓은 옛 방식의 설계도에 가깝습니다. 그래서 HML도 XML 계열이라는 점에서는 HWPX와 닮았습니다. 하지만 실무에서는 역할이 다릅니다.

HWPX가 최신 한글 문서의 개방형 표준 포맷에 가깝다면, HML은 특정 변환 흐름이나 레거시 시스템 연동, 보조 저장에 가까운 형식입니다. 일반 강사, 학생, 학부모에게 파일을 전달할 때 HML을 기본값으로 쓰는 경우는 많지 않습니다.

공개 웹에서 확인되는 사례도 이 방향과 맞습니다. 수학비서의 제품 소개 페이지는 문제를 "편집 기능이 지원되는 한글 파일"로 다운로드할 수 있다고 설명하고, 웹에 공개된 일부 샘플에서는 HWPMLAUTHOR>수학비서가 들어간 .hml 문서 흔적이 확인됩니다. 다만 이는 공식 기능 문서라기보다 공개 샘플 기준이므로, "수학비서가 내부 또는 출력 과정에서 HML/HWPML 계열을 활용한 사례가 보인다" 정도로 보는 것이 안전합니다.

픽시노트는 공개 공식 페이지에서 PDF 출력과 HWP, Word 다운로드 지원을 안내합니다. 그러나 공개 페이지 기준으로는 HML을 직접 표기한 근거는 확인되지 않았습니다. 따라서 픽시노트에 대해서는 "한글 다운로드를 제공한다"까지는 말할 수 있지만, HML을 사용한다고 단정하는 것은 피하는 편이 좋습니다.

정리하면 HML은 "알아두면 좋은 기술 형식"이지, 교육 자료를 일반적으로 배포할 때 우선 선택할 형식은 아닙니다. 특별히 HML을 요구하는 시스템이 없다면 HWPX 또는 HWP 중에서 선택하는 편이 안전합니다.

그럼 실제로는 무엇으로 저장해야 할까?#

상황별로 나누면 선택이 명확해집니다.

상황추천 형식이유
새 시험지, 교재, 해설지를 제작할 때HWPX구조화된 문서라 후편집과 자동화에 유리합니다
AI 변환, OCR, 대량 문서 생성이 필요할 때HWPX텍스트, 수식, 표, 그림을 XML 구조로 다루기 좋습니다
오래된 한글 버전 사용자와 파일을 주고받을 때HWP상대방 환경에서 열릴 가능성이 높습니다
공공/학교 제출용 문서를 만들 때HWPX 우선OWPML 기반 개방형 문서 형식이라 표준 문서 흐름에 적합합니다
특정 시스템이 HML을 요구할 때HML일반 선택이 아니라 요구 조건이 있을 때 사용합니다
최종 배포만 하고 편집은 막고 싶을 때PDF 병행편집 가능 문서는 HWPX/HWP, 열람용은 PDF가 적합합니다

마이일타 관점에서는 "HWPX로 만들고, 필요하면 HWP/PDF로 변환"하는 흐름을 권장합니다. 원본 작업물은 HWPX로 보관해야 이후 수정, 재활용, 문제 DB화, 해설 연결, 서식 일괄 변경이 쉬워집니다.

생성된 이미지 5.png

HWPX 파일이 안 열릴 때 체크할 것#

HWPX 자체가 잘못된 파일이라기보다, 대부분은 사용 환경 문제입니다.

  1. 한컴오피스 또는 한컴 뷰어가 최신 버전인지 확인합니다.
  2. 파일 연결 프로그램이 한글 또는 한컴 뷰어로 되어 있는지 확인합니다.
  3. 상대방이 오래된 한글만 쓴다면 HWP로 다시 저장해 전달합니다.
  4. 편집이 아니라 확인만 필요하면 PDF도 함께 전달합니다.

학원 실무에서는 HWPX와 PDF를 같이 보내는 방식이 가장 무난합니다. 편집 담당자는 HWPX를 열고, 검토자나 학부모는 PDF로 확인할 수 있기 때문입니다.

마이일타가 HWPX를 기본으로 쓰는 이유: AX와 한글 편집성을 동시에 잡기 위해서입니다#

일타조교는 PDF나 스캔 이미지 속 시험 문제를 편집 가능한 한글 파일로 바꾸는 서비스입니다. 이때 핵심은 단순히 "파일이 열린다"가 아닙니다. 마이일타가 HWPX를 쓰는 이유는 AX, 즉 강사의 자료 제작 업무를 AI가 실제로 바꿔주기 위해서입니다.

문제를 DB화한다고 하면 많은 분이 먼저 JSON이나 엑셀 같은 표 형태를 떠올립니다. 물론 그런 데이터베이스도 필요합니다. 하지만 교육 현장의 최종 작업물은 여전히 한글 파일입니다. 강사는 한글에서 문제를 고치고, 수식을 손보고, 표를 조정하고, 그림 위치를 바꾸고, 해설을 붙입니다. JSON만 있으면 데이터는 남지만, 강사가 바로 편집할 수 있는 "한글 교재"와는 1대1로 이어지지 않습니다.

HWPX는 이 사이를 연결합니다. 문제, 답, 해설, 단원, 난이도, 출처, 그림 의존도 같은 메타 정보는 구조화해 DB화할 수 있고, 동시에 결과물은 사용자가 가장 익숙한 한글 파일로 남습니다. 즉, HWPX는 "AI가 읽는 데이터"와 "강사가 편집하는 한글 파일" 사이의 접점입니다.

수식은 한글 문서 안에서 편집 가능해야 하고, 표는 표 객체로 남아 있어야 하며, 그림은 위치와 크기를 조정할 수 있어야 합니다. 문제와 해설은 미주로 연결되어야 하고, 필요하면 단원별로 다시 섞어 교재를 만들 수 있어야 합니다. 이런 AX에는 HWPX가 적합합니다.

작업HWPX가 유리한 이유
문제 DB화문제, 답, 해설, 출처, 단원 같은 정보를 구조화해 관리할 수 있습니다
한글 편집성결과물이 강사에게 익숙한 한글 파일로 남아 직접 수정할 수 있습니다
수식 변환수식, 문단, 줄바꿈을 구조적으로 제어하면서 한글 안에서 편집 가능하게 남길 수 있습니다
표·그림 복원표와 그림을 교재 편집 가능한 객체로 남길 수 있습니다
해설 미주 연결문제-해설 관계를 문서 구조와 한글 편집 경험 안에 함께 담을 수 있습니다

그래서 마이일타는 HWPX를 "최신 확장자"라서 쓰는 것이 아닙니다. 문제와 답을 DB화하면서도, 강사가 가장 익숙한 한글 파일에서 그대로 편집 가능한 형태로 남기기 위해 HWPX를 씁니다. 이것이 단순 문서 변환과 AX의 차이입니다.

결론: 작업 원본은 HWPX, 호환 필요 시 HWP#

세 형식을 한 문장씩 정리하면 이렇습니다.

  • HWP는 오래된 한글 생태계와의 호환성이 강한 전통 문서 형식입니다.
  • HWPX는 AI, 자동화, 표준 문서 흐름에 적합한 XML 기반 개방형 한글 문서 형식입니다.
  • HML은 HWPML 계열의 XML 문서로, 일반 배포용보다는 보조 저장과 특정 연동에 가까운 형식입니다.

선생님이 새로 시험지나 교재를 만든다면 HWPX를 기본값으로 두세요. 상대방이 구버전 한글을 쓰면 HWP로 한 번 더 저장해 보내면 됩니다. 그리고 검토용으로는 PDF를 함께 전달하면 현장 호환성까지 챙길 수 있습니다.

마이일타는 PDF, 스캔 이미지 속 시험 문제를 AI가 편집 가능한 한글(HWPX) 파일로 변환하는 에듀테크 서비스입니다. 문제·답·해설·메타 정보는 DB화하고, 결과물은 강사가 가장 익숙한 한글 파일에서 바로 편집할 수 있게 남깁니다.

자주 묻는 질문

최신 한글 환경, 공공/학교 제출, AI 자동화, 데이터 추출까지 고려하면 HWPX가 더 적합합니다. 다만 파일 전송 시 상대방이 구버전 한글만 쓴다면 HWP로 저장하는 것이 안전합니다.

네. 2026년 4월 24일 보도에 따르면 국가인공지능전략위원회, 행정안전부, 문화체육관광부는 온나라시스템 등 공공 문서 유통 채널에서 HWP 첨부를 제한하고 HWPX 전환을 추진한다고 밝혔습니다.

아닙니다. 일부 환경에서 HWP 본문 텍스트와 문항 구조를 읽는 사례는 있지만, 한글 수식 객체·그림·레이아웃까지 안정적으로 복원·대량 편집하는 것은 다른 문제입니다.

둘 다 XML 계열이지만 용도가 다릅니다. HWPX는 최신 한글 문서용 표준 포맷에 가깝고, HML은 HWPML 문서 형식으로 보조 저장이나 레거시 연동 성격이 강합니다.

마이일타가 지향하는 AX는 문제·답·해설·메타 정보를 DB화하면서도, 사용자가 가장 익숙한 한글 파일에서 그대로 편집 가능한 결과물을 남기는 것입니다. HWPX는 이 두 요구를 동시에 만족시키기 좋습니다.

네. 한컴오피스에서 HWPX 파일을 연 뒤 다른 이름으로 저장에서 HWP 형식을 선택하면 됩니다.

에디터 추천 글

직접 경험해보세요

My1ta와 함께 새로운 교육을 시작하세요