Internet Explorer 7.0 출시와 유니코드 문제, 그리고 팔리어 출력

어제 일자로 한글판 IE 7.0이 출시됨으로써 웹브라우저와 관련한 몇 가지 주목할 사항이 생겼다. ActiveX을 사용하는 웹사이트 이외에는 Firefox를 이용하여 웹서핑을 하는 나로서는 IE 7.0의 출시로 인하여 그간의 행태에 특별히 변경될 것은 없다. IE 7.0의 새로운 기능들은 이미 Firefox에서 구현이 되었던 것들인데다가, 아직도 여전히 여러모로 IE 7.0이 Firefox에 못 미치는 까닭이다.

그러나 반가웠던 점은, IE 7.0이 마침내 Firefox, Opera와 마찬가지로 CSS2, HTML 4.01 등의 표준을 지원하는 대열에 가담했다는 것이다. 이 사실은 웹프로그래머들에게 획기적인 변화가 다가오기 시작했다는 신호이지만, 내게는 무엇보다도 희랍어, 팔리어, 산스크리트어, 라틴어 장모음 등을 블로그에 마음껏 출력할 수 있게 되었다는 것을 의미한다.

예전의 글에서 라틴어 장모음, 팔리어와 희랍어의 출력 문제를 다루면서 언급한 적이 있지만, IE 6과 그 이하 버전에서는 ‘Arial Unicode MS’ 폰트가 설치된 경우에만 그 언어들이 제대로 출력되었다. 그러나 ‘Arial Unicode MS’는 윈도우즈 설치시 기본적으로 설치되는 폰트가 아니라 사용자설치를 통해서만 설치되는 폰트인 까닭에, 대부분의 웹사이트에서는 기본적인 라틴문자 이외의 확장문자나 기타 언어를 사용할 수가 없었다. 그래서 가령 로마자-팔리어를 위한 폰트를 별도로 제공하여 설치하게 하거나, 아니면 로마자-팔리어 표기법을 대신하는 Velthuis 표기법에 따라 팔리어를 표기하기도 했다.
 

그러나, 이제 IE 7.0이 출시됨으로써 그러한 고민스러운 상황이 사라질 운명이 되었다. 즉, 웹사이트에서 모든 문자를 마음껏 사용해도 되는 상황이 만들어지고 있다. 물론 IE 7.0이 윈도우즈 정품사용자들만 다운로드 받을 수 있는 프로그램이므로, IE 7.0이 IE 6이하의 버전을 언제 얼마나 대체하게 될지는 모르는 상황이지만, 앞일을 멀리 내다보자면, 유니코드를 이용한 언어입력은 이제 필연이자 대세이자 현실이 되었다.

이것은 곧 여러 언어를 사용하길 원하는 웹사이트에서는 예외없이 문자셋을 “utf-8″로 인코딩해야 한다는 것을 의미하기도 한다. (우리나라의 대부분 웹사이트는 “euc-kr” 인코딩을 하고 있다. 네이버도 다음도 그렇게 하고 있다. 그러나 다음에서는 부분적으로 “utf-8″로 이행하는 작업을 하고 있다.)

아무튼 이런 대단위에서의 변화는 내가 관심을 기울이는 분야가 아니다. 다름아닌 이 대단위 변화와 더불어 오는 팔리어, 산스크리트어, 희랍어의 출력 문제가 관심사다. 이제 유니코드를 통한 문자 입력이 자유로와지는 상황을 즈음하여, “utf-8” 인코딩을 하는 블로그나 웹사이트에서 로마자-팔리어, 로마자-산스크리트어를 입력하고 출력하는 방법에 대한 간단한 정보를 제공하고 싶은 것이다.

 

1. 팔리어의 브라우저별 출력 정보

각자의 브라우저가 아래의 예문을 정상적으로 출력하는지 확인해 보자:

Firefox Opera IE7 IE6 IE6 + Arial Unicode MS
O O O X
‘Lucida Sans’ 폰트
Sīho va saddesu asantasanto
vāto va jālamhi asajjamāno
padumaṃ va toyena alippamāno
eko care khaggavisāṇakappo
‘Arial Unicode MS’ 폰트
Sīho va saddesu asantasanto
vāto va jālamhi asajjamāno
padumaṃ va toyena alippamāno
eko care khaggavisāṇakappo

위 팔리어 인용문은 Firefox, Opera, IE 7에서는 왼편 오른편 양쪽 다 정상출력이 되며, IE 6이하 버전에서는 정상출력이 안 된다. 다만, 웹사이트에서 폰트를 ‘Arial Unicode MS’로 지정하고 클라이언트의 시스템에 ‘Arial Unicode MS’ 폰트가 설치되어 있을 경우에는 IE 6이하에서도 정상출력이 된다. 그러므로, 오른쪽만 정상출력이면 자신의 컴퓨터에 ‘Arial Unicode MS’ 폰트가 설치된 경우이다.

그러나 양쪽 다 정상출력이 아니라면 ‘Arial Unicode MS’ 폰트가 설치되지 않은 경우로서, IE 대신에 Firefox나 Opera를 택하거나, 아니면 현 IE 6이하 버전을 IE 7로 업그레이드해야 한다. 그러면 양쪽 다 정상출력이 된다. (아래에 언급될 산스크리트어-팔리어 알파벳은 Firefox, Opera, IE 7에서만 정상출력이 되므로 유의하길 바란다.)
 

2. Velthuis 표기법

Velthuis 표기법은 IE 6이하 버전에서 유니코드를 제대로 지원하지 못하는 상황을 타개하기 위해 고안되었으며, 현재 산스크리트어와 팔리어 학인들 사이에서 폭넓게 사용되고 있다. 다시 말해, Velthuis 표기법은 ASCII 문자셋에 포함된 문자로만 산스크리트어를 표기하기 위해 고안된 것이다. (팔리어 알파벳은 산스크리트어 알파벳의 범위 안에 포함되므로 팔리어는 별도로 논할 필요가 없다.)

로마자-산스크리트어
a ā i ī u ū ṛ ṝ ḷ ḹ
e ai o au
ṃ ḥ
k kh g gh ṅ
c ch j jh ñ
ṭ ṭh ḍ ḍh ṇ
t th d dh n
p ph b bh m
y r l v
ś ṣ s h
Velthuis 표기
a aa i ii u uu .r .rr .l .ll
e ai o au
.m .h
k kh g gh "n
c ch j jh ~n
.t .th .d .dh .n
t th d dh n
p ph b bh m
y r l v
"s .s s h
(로마자-산스크리어는 유니코드를 지원하는 브라우저에서만 제대로 출력됨)

이제 IE 7.0이 유니코드를 제대로 지원하게 됨으로써 Velthuis 표기법도 쓰임새가 많이 줄어들게 되었다. 그러나 IE 6이하 버전 사용자 때문에, 그리고 “utf-8” 인코딩을 하지 않고 있는 웹사이트에서는, Velthuis 표기법이 여전히 유용할 것이다.
 

3. Velthuis-Unicode 변환

Velthuis 표기에 따른 팔리어나 산스크리트어 문장은 원래의 유니코드 문자로 자동변환할 수 있다. 다음 프로그램을 이용하기 바란다. 이 변환기 역시 Firefox, Opera, IE 7에서만 정상출력이 된다.

벨투이스-유니코드 변환기(Velthuis-Unicode Converter)
 

4. 관련사이트 안내

The Unicode Character Code Charts By Script
유니코드 문자코드 값. 모든 언어의 유니코드 문자코드 값을 확인할 수 있다.

Unicode for Romanised Pali Scripts
로마자-팔리어의 알파벳과 그것의 유니코드 값을 일일이 확인해 볼 수 있다.

Sutta Pitaka
유니코드로 제공되는 팔리어 대장경. 현재 네티즌의 자발적인 참여로 진행 중이며 BJT 편집본과 PTS 편집본의 페이지가 병기되어 있다. 이것은 Firefox, Opera 라는 웹브라우저의 활발한 사용과 함께 의욕적으로 추진하는 유니코드 텍스트화 작업이라고 할 수 있다. 이제 IE 7.0이 출시되었으니 이러한 유니코드 텍스트화 작업은 여러 분야로 확산될 것이다.

Internet Explorer 7.0 출시와 유니코드 문제, 그리고 팔리어 출력”에 대한 2개의 댓글

  • Velthuis가 네델란드 분이군요. 가르쳐 주셔서 고맙습니다.

    이제는 유니코드가 일반화되어서 펠트하위스 표기법의 효용이 많이 줄어들었지만, 불과 몇 년 전만 해도 아주 유용한 표기법이었지요.

    고싱가
  • Leave a Reply

    Your email address will not be published. Required fields are marked *