로그 분석 방법
로그 분석을 위해 가장 먼저 알아야 하는 것은 유사율입니다. 매치레이트(match rate) 또는 퍼지 매치(fuzzy match)라고 부르는 유사율은 번역하고자 하는 세그먼트(문장 또는 문단 기준)의 내용을 기존 번역문 세그먼트와 비교하여 서로의 비슷한 정도를 백분율(%)로 표현하는 것입니다. 실제로 memoQ에서 분석한 로그를 살펴보면서 설명하겠습니다.
로그를 보면 Source words 열에 표시되는 숫자가 분석한 단어 수입니다. 견적을 위한 분석에서는 단어 수와 매치레이트만 확인하면 되므로 Type 열과 Source words 열만 설명하겠습니다.
Type 열 설명(Source words를 기준으로)
All: 전체 단어 수를 말합니다.
X-translated / double context: 기존 TM이나 MT(Machine Translation)를 통해 사전 번역된 단어 수를 의미합니다.
Repetition: 분석한 파일 중에서 반복되는 세그먼트가 있을 경우, 해당 세그먼트들의 단어 수를 의미합니다.
101%: TM에 이미 저장되어 있는 세그먼트 기준으로 앞뒤 문맥까지 일치하는 세그먼트들의 단어 수를 의미합니다.
100%: TM에 이미 저장되어 있는 세그먼트와 100% 일치하는 세그먼트들의 단어 수를 의미합니다.
95%-99%: TM에 이미 저장되어 있는 세그먼트와 95% 이상 99% 이하로 일치하는 세그먼트들의 단어 수를 의미합니다.
85%-94%: TM에 이미 저장되어 있는 세그먼트와 85% 이상 94% 이하로 일치하는 세그먼트들의 단어 수를 의미합니다.
75%-84%: TM에 이미 저장되어 있는 세그먼트와 75% 이상 84% 이하로 일치하는 세그먼트들의 단어 수를 의미합니다.
50%-74%: TM에 이미 저장되어 있는 세그먼트와 50% 이상 74% 이하로 일치하는 세그먼트들의 단어 수를 의미합니다.
No match: TM에 이미 저장되어 있는 세그먼트와 전혀 일치하지 않는 세그먼트들의 단어 수를 의미합니다.
이렇게 매치레이트에 따라 단어 수를 구분하는 이유는 각 유사율 구간에 따라 비용을 정하는 기준이 다르기 때문입니다. 기본적인 논리는 이렇습니다. 하나의 문장을 번역한다고 가정할 때, 아무 것도 없이 완전 새로 번역을 하는 것과 기존 번역을 활용해서 일부만 수정하면 번역이 완성되는 경우가 있다면, 후자의 경우 상대적으로 시간을 절약할 수 있습니다. 그러므로 후자에 대해서는 번역에 대한 비용이 상대적으로 적게 들어가는 것으로 판단할 수 있고, 이를 통해 비용을 절감할 수 있다는 것입니다. 즉, 매치레이트가 높을수록 적은 비용(=적은 시간)으로 번역을 할 수 있다는 것입니다. 현재 기술 번역 업계에서는 이것을 기본 원리로 받아들이고 있으며 이를 통한 비용 절감을 위해 캣툴을 도입하는 것이 일반화되어 있습니다.
매치레이트에 따른 비용 할인은 번역 회사마다 기준이 다릅니다. 본 예제에서는 아래와 같은 기준으로 견적서 작성 예시를 보여드리겠습니다.
Fuzzy Match Rate | Charge Rate |
Repetition | 20% of Word/Character rate |
100% & 101% | 20% of Word/Character rate |
75 ~ 99% | 50% of Word/Character rate |
0 ~ 74% | 100% of Word/Character rate |
번역 단가가 단어당 100원이라고 가정할 때 위 퍼지 매치레이트(fuzzy match rate)를 활용해서 비용을 분석하면 다음과 같습니다.
Repetition = 100원 x 3,393 단어(Source words) x 0.2(Repetition에 대한 fuzzy match rate 20%)
= 67,860원
No match = 100원 x 6,434 단어(Source words) x 1.0(Repetition에 대한 fuzzy match rate 100%)
= 643,400원
Grand Total = Repetition(67,860원) + No match(643,400원)
= 711,260원
단어 수를 기준으로 단순 계산했다면 100원 x 9,827(All) 단어 = 982,700원이 되었을 비용이 20만원 이상 절감된 셈입니다.
'번역이야기' 카테고리의 다른 글
번역가를 위한 정규표현식 활용 가이드 (31) | 2024.10.03 |
---|---|
번역가를 위한 필수 가이드: 캣툴 지원 파일 형식 (29) | 2024.10.02 |
매치레이트와 TM: 번역가를 위한 필수 도구 이해하기 (20) | 2024.10.01 |
LanguageWire의 RAG 기술: AI 번역 품질의 새로운 도약 - 번역 이야기 (84) | 2024.07.22 |
현지화 트렌드 알아보기 - RWS 그룹의 뉴스레터 번역 (85) | 2024.07.21 |
댓글