캣툴을 통해 번역 가능한 주요 파일 형식
캣툴은 번역을 보조하기 위한 도구인 만큼 현존하는 대부분의 텍스트 형식 파일을 지원합니다. 여기에서는 그 중 번역에 가장 빈번하게 사용하는 파일을 중심으로 설명하겠습니다. 이 글에서 설명한 형식 외에도 많은 텍스트 형식을 지원하니 각자의 공부를 통해 파일 형식에 대한 이해를 넓히시길 권장합니다.
.doc, .docx
Microsoft Word용 파일입니다. 문서 작성용으로 개발된 프로그램이라 번역용 파일을 준비할 때 까다로운 점은 많지 않습니다. 다만, 변경 내용 추적 기능이 활성화되어 있을 경우 파일 임포트(번역할 파일을 캣툴에 집어 넣는 과정)가 되지 않는 경우가 발생합니다. 반드시 변경 내용 추적 기능을 해제하고 임포트하십시오. 버전 2007부터 docx 형식을 사용하기 시작했으며 doc는 이전 형식입니다. 두 파일 확장자 모두 같은 프로그램에서 편집할 수 있는 형식이지만 확장자에 따라 문서 내에서 지원하는 기능의 차이가 일부 존재합니다. 번역 이전 및 이후에 항상 파일 확장자를 확인하여 처음 의뢰한 파일과 동일한 확장자로 최종 번역 파일을 완성해야 합니다.
Tip. 파일 확장자 변경 방법
파일 확장자 변경 시 반드시 해당 파일을 편집할 수 있는 프로그램에서 파일을 열고 [다른 이름으로 저장]하는 방식으로 확장자를 변경해야 합니다. 탐색기에서 해당 파일의 확장자 이름만 변경하면 파일 확장자는 바뀌지만 실제 속성은 바뀌기 전과 동일하기 때문에 확장자를 변경하지 않은 것과 같습니다.
.ppt, .pptx
Microsoft PowerPoint용 파일입니다. 주로 발표용 자료를 제작할 때 많이 쓰는 프로그램입니다. 이미지 또는 텍스트가 레이어(Layer) 형태로 되어 있어서 예전에는 번역용 파일로 변환할 때 오류가 많이 발생하는 파일 중 하나였습니다. 하지만 요즘은 대부분의 캣툴에서 이 형식을 지원하기 때문에 손쉽게 번역용 파일을 준비할 수 있습니다. 다만, PPT 파일(PowerPoint를 줄여서 PPT라고 부름)의 경우 최종 파일의 레이아웃(Layout)이 기존과 달라지는 경우가 많아 클린업(clean-up) 이후에 원본과 달라진 부분을 확인하고 수정해야 합니다. 이 파일 형식도 ppt(2007 이전), pptx(2007 이후)의 두 가지가 존재하니 최종본의 확장자에 주의해야 합니다.
.xls, xlsx
Microsoft Excel용 파일입니다. 이 프로그램은 수식을 만들고 숫자를 계산하여 여러 가지 회계 자료나 기타 마케팅용 서류를 작성하는 용도로 개발되었으나 셀을 활용한 정렬, 편집, 텍스트 추출 등 여러 편의성으로 인해 현재는 게임 개발자들 사이에서 인게임 텍스트(In-game Text)를 저장하는 용도로 널리 사용되고 있습니다. 게임 현지화 담당자라면 그 어떤 파일 형식보다 가장 빈번하게 만날 수 있는 형식입니다. Excel에서 지원하는 몇 가지 함수를 활용하면 텍스트를 좀 더 쉽게 다룰 수 있으니 공부해 두시면 업무에 많은 도움을 받을 수 있습니다. 이 파일 형식도 xls, xlsx의 두 가지가 있습니다.
.csv
csv는 comma-separated values의 약자입니다. 데이터와 데이터 사이를 쉼표로 구분해 놓은 파일입니다. 텍스트를 데이터 형태로 저장하고 있기 때문에 다른 파일로 변환하기가 쉽습니다. 게임 개발자들 사이에서도 데이터를 주고 받는 매체 파일로 많이 활용되고 있으며 Excel에서도 편집이 가능합니다.
.xml, .htm, .html
Mark-up Language라는 프로그래밍 언어로 구성된 파일 형식입니다. xml은 주로 웹(Web)에서 활용하는 텍스트 형태의 데이터 보관용으로 사용하며 html(또는 htm)은 웹을 구성하는 뼈대(frame)가 되는 파일입니다. 이 파일에는 실제로 전달해야 하는 내용과 해당 내용을 효과적으로 전달하기 위한 여러 장치들이 혼재되어 있습니다.
위 그림에서 검은색을 제외한 나머지 색으로 표현된 텍스트는 모두 번역 대상이 아닙니다. 모든 파일이 이렇게 번역 대상과 그렇지 않은 내용이 함께 뒤섞여 있기 때문에 캣툴을 사용하지 않는다면 번역가가 직접 전체 내용 중 번역이 필요한 부분만 확인하여 번역해야 하는 불편이 있습니다. 하지만 대부분의 캣툴에서 해당 부분을 자동 또는 수동으로 비번역 처리가 가능합니다. 비번역 처리와 관련해서는 다음에 좀 더 자세히 다루겠습니다.
.xliff, .xlz, .xlif, .xlf, .mxliff, .mqxlz
xml을 기반으로 하는 번역 데이터 파일입니다. 우리가 캣툴을 사용해서 원문과 번역문이 함께 담긴 내용을 저장하면 이와 같은 형식의 파일로 저장됩니다. 캣툴에 따라 사용하는 확장자가 다를 수 있습니다. 예를 들어 가장 많은 사용자를 확보하고 있는 SDL Trados Studio의 파일은 .sdlxliff로 저장되며 게임 현지화에 주로 사용하는 memoQ의 파일은 .mqxlz로 저장됩니다. 확장자에 따라 사용하는 캣툴은 달라지지만 동일한 역할을 하는 파일입니다.
.pdf 파일은 Adobe Acrobat, 알PDF 등 PDF 작성 전용 프로그램으로 작성할 수 있습니다. 대부분의 문서 편집 프로그램이 PDF로 내보내는 기능을 지원하기도 합니다. PDF 파일의 주요 목적은 내용을 변경할 수 없는 형태의 전자 문서를 만들어 보안성을 높이는 것이었지만 최근 들어 PDF 문서도 일부 편집이 가능한 프로그램이 보급되면서 그러한 장점은 많이 퇴색되는 분위기입니다. 하지만 번역가의 입장에서 PDF 파일은 불편하기 짝이 없습니다. 고객이 제공하는 PDF 파일 중에는 전체 텍스트가 이미지로 되어 있는 경우도 있으며, 그렇지 않더라도 번역용 파일로 변환하는 과정에서 불필요한 줄바꿈이 매 줄마다 생성되거나 텍스트를 분리하는 레이어(layer) 등이 발생하여 별도의 보완 작업을 진행해야 합니다. 고객이 번역용 파일을 PDF 형식으로 제공했다면 PDF 파일을 만들기 위해서 처음 생성한 원본 파일이 있는지 문의하는 것이 좋습니다. 예를 들어, 처음 문서 제작은 Microsoft Word로 하였으나 보관 및 전달 편의를 위해 PDF 형식으로 된 만들었다면 원본인 Word용 파일을 전달 받는 것이 번역하기에는 훨씬 수월하며 시간을 절약할 수 있습니다.
Tip. OCR 기능
OCR(Optical Character Recognition) 기능은 PDF 제작 전용 프로그램에 포함되어 있는 기능이며 요즘은 온라인으로 OCR을 수행할 수 있는 웹 사이트도 많이 보급되어 있습니다. PDF 제작 전용 프로그램인 Adobe Acrobat Pro의 경우 화면 우측의 [도구] 메뉴에서 [텍스트 인식] 메뉴를 선택하고 해당 옵션 중 하나를 선택하여 작업을 실행하면 됩니다. 전용 프로그램이 없을 때는 구글에서 온라인 OCR을 검색하여 진행하는 방법도 있습니다.
OCR은 말 그대로 광학적으로 글자를 인식하는 시스템을 통해 글자를 판별하고, 시스템이 판별한 그대로 글자를 만들어 주는 방식이기 때문에 사람이 보는 것과 다른 결과가 나오는 경우도 많습니다. 글꼴이나 글자의 크기에 따라서도 많은 영향을 받기 때문에 OCR 작업 후에는 텍스트가 정상적으로 인식되었는지 반드시 확인하고, 그렇지 않은 부분은 모두 수작업으로 수정해 주어야 합니다.
Tip. PDF 파일 변환 프로그램
PDF를 Word나 기타 파일로 변환해 주는 프로그램도 많이 있습니다. 하지만 이 방법도 OCR을 적용한 것과 크게 다르지 않은 결과를 제공하기 때문에 완전히 믿고 번역을 진행하는 것은 곤란합니다. 예상치 못한 레이어가 추가되어 오히려 번역에 방해가 되는 경우도 많으므로 개인적으로는 추천하고 싶지 않은 방법입니다.
.json
.json은 JavaScript Object Notation의 약자입니다. JavaScript라는 프로그래밍 언어에서 사용하는 데이터용 파일이라고 생각하시면 됩니다. 이 파일도 xml이나 html 파일처럼 번역할 내용과 프로그래밍에 해당하는 내용이 함께 있기 때문에 비번역 처리가 파일 관리의 핵심입니다. 다행히 최근 출시되는 캣툴에서는 json 파일 형식도 지원하는 경우가 많아 생각보다는 관리가 편합니다. memoQ도 이 형식을 지원합니다.
.rtf
.rtf는 Rich Text Format의 약자입니다. 서식이 담긴 docx 파일이라고 생각하시면 됩니다. 실제 번역을 진행할 때도 docx 파일 처리와 다른 점이 없기 때문에 크게 주의해야 할 파일 형식은 아닙니다. 최종본에서 파일 형식을 유지하는 것만 신경 써 주십시오.
.psd
Adobe PhotoShop용 파일입니다. 캣툴에서 번역이 가능하도록 도와주는 필터를 제공합니다. 이 파일은 이미지 편집용 파일이기 때문에 번역 용도로 활용하기에는 불편한 점이 많지만 최근 급성장한 웹툰 번역 시장으로 인해 주목받고 있는 파일 형식입니다. 웹툰 번역의 경우 PSD 파일 형식으로 진행하는 경우도 있습니다.
.txt
텍스트를 저장하는 용도로는 가장 평범한 파일 형식입니다. 현재는 상대적으로 개발자의 사용 빈도가 높다고 볼 수 있으며 텍스트 단순 저장, 글꼴 변경, 크기 변경 외에 서식을 추가하기 어려운 제약 때문에 일반인들이 자주 사용하지는 않는 형식입니다. 번역을 할 때도 추가 정보를 저장하기는 쉽지 않은 편이라 선호도가 낮습니다.
'번역이야기' 카테고리의 다른 글
memoQ로 단일 언어 프로젝트 생성 및 비번역 처리하기 (28) | 2024.10.04 |
---|---|
번역가를 위한 정규표현식 활용 가이드 (31) | 2024.10.03 |
매치레이트와 TM: 번역가를 위한 필수 도구 이해하기 (20) | 2024.10.01 |
효율적인 번역 비용 절감을 위한 로그 분석 방법 (12) | 2024.09.28 |
LanguageWire의 RAG 기술: AI 번역 품질의 새로운 도약 - 번역 이야기 (84) | 2024.07.22 |
댓글