행위

유령 문자

조무위키

imported>위키유동닉님의 2020년 11월 13일 (금) 13:08 판
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)
이 문서는 한자 및 한자어에 대해 다룹니다.
주의! 이 글이 다루는 대상은 존나 미스터리합니다.
씨ㅡ발 뭐가 뭔지 몰?루겟소요. 무섭습니다. ㅠㅠ
이 문서에서 다루는 대상이 너무나도 무섭습니다.
성님, 무서워서 아주 지려버리겄소?
이 문서는 이해하기 어려운 대상을 다룹니다.
이 문서는 일반적인 뇌를 가지고도 이해하기 어려운 대상에 대해 다룹니다. 두뇌를 풀가동해도 아마 이해하기 어려울 것입니다.
주의. 이 문서는 심히 진지하여 노잼일 수 있습니다.
이 글은 놀랍게도 조무위키에서 진지를 빨고 있습니다. 노잼이다 싶으시면 여기를 클릭하시어 이 문서를 탈출할 수 있습니다.

👻

개요[편집]

일본 컴퓨터 환경에서 입력할 수 있는 한자들 중에서 그 유래나 출처, 상세한 쓰임이 밝혀지지 않은 한자들을 유령 문자라고 한다.

왜 생겼는가?[편집]

1978년 일본의 통상산업성(지금은 경제산업성)에서 일본어에 쓰이는 한자들을 컴퓨터에서 표시하기 위해 문자 체계인 JIS C 6226(현 JIS X 0208, JIS 제1수준과 제2수준의 6,349자)을 제정하면서 이를 JIS 기본한자로 지정했다. 이때 전거로써 총 4군데(1. 표준 코드용 한자표(시안) - 정보처리학회 한자코드위원회, 2. 국토행정총람지 - 국토지리협회, 3. 일본생명수용인명한자 - 일본생명(현재는 없어짐), 4. 행정정보처리용기본한자 - 행정관리청)의 한자표에 포함되는 한자들이 채용되었다.

그런데 제정 당시에는 각 문자의 전거가 규격 내에서 명시되지 않아서 '음(音), 의미나 역사는 물론 어디서 쓰이는지 알 수 없는 한자'들이 많이 섞여 들어갔다는 지적을 받았다. 이것들이 유령 문자에 해당되며 당시에는 약 60자 정도로 추산되었다.

대표적으로는 妛이나 彁 등이 있으며 이 한자들은 강희자전에도 없고 일본 국자(國字) · 신자체 등을 추가한 모로하시 데쓰지대한화사전(2000년에 JIS 기본한자 중 일부를 보충한 보권(補卷) 제외)에도 없었다.

이러한 상황에 입각해 1997년 제정된 개정 규격에서는 원안작성위원회 위원장 시바노 코지, 국립국어연구소의 사사하라 히로유키 등을 중심으로 해서 1978년 규격의 원안 작성에 참조한 문헌 조사에 들어갔다. 그 결과 유령 문자로 지정된 한자들 중 대다수가 지명이나 실제로 사용 중인 한자였던 것으로 밝혀졌다.

하지만 조사를 하고 나서도 12개의 한자가 여전히 전거 불명으로 판명되었다. 이들 중에서 옛날 자서와 우연히 자형이 똑같은 문자들이 나오거나 자료를 잘못 등사하면서 나온 문자로 짐작되는 등 실마리가 발견된 것들도 있었지만 오직 彁만은 어디에도 전거나 단서가 없었다. 따라서 현재 유령 문자로 간주되는 것들은 전술한 12개의 한자, 좁게는 彁 하나뿐이다.

종류[편집]

본 문단은 일본어 위키피디아의 유령 문자 문서를 바탕으로 작성되었다.

전거가 불분명한 한자들[편집]

문자 JIS 구분점 전거 우연히 일치한 예
52-55 대응 분석 결과에 없음. 『집운』 초본(鈔本)에 있으나 오자, 또는 의 이체자로 추정
52-63 대응 분석 결과에 없음, 㕓의 오자로 추정. 『왜옥편』에 등장
54-12 국토행정총람지에 등장. 𡚴의 오자로 추정. 『자경집』 등에 있으나 오자로 추정
55-27 대응 분석 결과에 없음. 彊의 오자로 추정. 없음
57-43 국토행정총람지에 등장. 栩의 오자로 추정. 『중화자해』 등에 등장
58-83 국토행정총람지에 등장. 杲 등의 오자로 추정. 『법화삼대부 난자기』에 등장
59-91 국토행정총람지에 등장. 橳의 오자로 추정. 『일체경음의 (현응)』에 등장
60-57 국토행정총람지에 등장. 橦의 오자로 추정. 『송원이래속자보』 등에 등장
74-12 행정정보처리용기본한자(메이지 생명보험
상호회사한자 코드표)에 등장.
『신찬자경』에 등장
74-57 국토행정총람지에 등장. 祢의 오자로 추정. 『신찬자경』, 『유취명의초』 등에 등장
79-64 국토행정총람지에 등장. 閏의 오자로 추정. 송나라판 『광운』의 일부에 등장했으나 오자로 추정
81-50 일본생명인명표에 등장했지만 원전(原典) 부재. 『유취명의초』에 등장

이 중 壥은 대응 분석 결과에 있는 㕓이 JIS 기본한자에 없기 때문에 이것을 잘못 베낀 자형을 등록했을 가능성이 있다고 추정되었다. 그러나 후에 몽구집주(蒙求集注)에서 밭을 세는 단위로 사용된 것이 밝혀졌다. 한때 짱깨의 위키피디아 위키문헌에 몽구집주가 수록되어 있었고 거기서 壥을 찾을 수 있었지만 지금은 문서가 삭제되었다. 그 문서

妛은 시가현 이누카미군 다가정 가와치의 𡚴原(あけんばら)𡚴(山女(あけび)의 합자(合字))가 JIS 기본한자에 없기 때문에 이것을 잘못 베낀 자형을 등록했을 가능성이 있다고 추정된다. 이후 𡚴는 JIS X 0213에 수록되었다.

椦은 군마현 마에하시시에 있는 橳島(ぬでしま)의 橳이 JIS 기본한자에 없기 때문에 이것을 잘못 베낀 자형을 등록했을 가능성이 있다고 추정된다. 이후 橳은 JIS X 0213에 수록되었다.

전거가 밝혀진 한자들[편집]

JIS X 0208:1997의 부속서(부록) 7에서는 전거가 밝혀진 문자들 중 모로하시의 대한화사전, 카도카와(씹덕들이 얘기하는 그 8좆)의 신자원(新字源) 어느 쪽에도 게재되지 않은 것들을 중심으로 총 72자의 출전을 상세히 정리하고 있다. 아래 표는 그 중 일부에 해당된다.

문자 JIS 구분점 전거와 용례
[1] 52-18 국토행정총람지에 용례 있음. 藤垈(ふじぬた) · 相垈(あいぬた) · 大垈(おんた)/야마나시현
52-21 국토행정총람지에 용례 있음. 垉六(ほうろく)/아이치현
54-19 국토행정총람지에 용례가 있으나 현존하지 않음. 広岾町(ひろやまちょう)→広町(こうちょうちょう)/교토부
55-78 일본생명인명표에 등장. NTT(일본전신전화의 약칭) 전화번호부에서 인명용 예가 나왔다고 한다.
60-81 일본지명대사전에 용례 있음. 石橸(いしだる)/시즈오카현
61-73 국토행정총람지에 용례가 있으나 오자로 밝혀짐. 汢の川→の川(ぬたのかわ)[2]/고치현
66-83 일본생명인명표에 등장. NTT 전화번호부에서 인명용 예가 나왔다고 한다.
67-46 국토행정총람지에 용례가 있으나 오자로 밝혀짐. 穃原原(ようばる)/오키나와현
68-68 국토행정총람지에 용례 있음. 粐蒔沢(ぬかまきざわ)[3]/아키타현
68-70 국토행정총람지에 용례 있음. 粭島(すくもじま)/야마구치현
68-72 국토행정총람지에 용례가 있으나 오자로 밝혀짐. 粫田(うるちだ)田(もちだ)/후쿠시마현
68-84 국토행정총람지에 용례 있음. 糘尻(すくもじり)/히로시마현
71-19 국토행정총람지에 용례 있음. 膤割(ゆきわり)/구마모토현
77-32 국토행정총람지에 용례가 있으나 현존하지 않음. 軅飛(たかとぶ)飛(たかとび)/후쿠시마현
78-93 국토행정총람지에 용례 있음. 小鍄(こがすがい)/야마가타현
82-94 국토행정총람지에 용례가 있으나 원전 오자로 밝혀짐. 鵈沢沢(みさごさわ)[4]/후쿠시마현

유령 문자가 아직도 남아있는 이유[편집]

사사하라 히로유키 등에 의한 유령 문자 조사가 진행되었지만 이는 JIS X 0208의 제4차 규격(1997년) 개정의 일환에 불과했다. 제2차 규격(1983년)의 83JIS 개정에서는 구분점의 교체를 주로 한 비호환 개변이 행해지며 문자 체계에 심대한 혼란을 야기했던 일이 있다 보니 같은 문제를 다시 일으킬 수는 없었기 때문이다.

다른 이유로는 유니코드와의 호환성을 유지할 필요도 있었다. 조사 시점에서 1993년 제정된 유니코드 1.1에는 이미 JIS 기본한자들이 전부 들어가 버린지라 이 시국에 와서 변경을 시도하면 일본 국내만에서의 문제로 끝날 일도 아니게 되었기 때문이다. 또 유니코드는 source separation rule(원(原) 규격 분리 규칙, 예를 들면 JIS X 0208에서 따로따로 수록된 것들은 계속 분리시켜 두는 것 등)이라는 원칙도 있고, CJK 통합한자(한국, 일본, 홍콩, 대만, 짱깨 등 한자문화권 국가들이 자주 쓰는 한자들을 모아 수록한 집합)에서는 그 규칙을 깨지 않는 범위 내에서 포섭(한자를 예로 들면 책받침 점 1개짜리(辶)와 2개짜리(辶)나 초두머리 3획짜리(艹)와 4획짜리(艹)로 근소한 자형 차이가 있는 한자들(道나 草 같은 거)을 떨어뜨리지 않고 한 부호에 포섭시키는 것)을 행하는 복잡한 경위를 거쳤고 그 이후에도 유니코드에 수록된 문자들을 토대로 짱깨의 GB 16500-1995와 대만의 CNS 11643-2004 등 타 국가의 규격까지 추가 확장도 끝냈는데, 여기에서도 유령 문자가 득실거리는 상황이었다. 이렇게 복잡한 상황 내에서 변경이라는 모양으로의 대처는 사실상 불가능했던 것이다.

그래서 유령 문자는 현대에도 JIS 기본한자와 유니코드에 남겨져 대응하는 폰트만 있다면 세계 곳곳의 정보기관에서 이용할 수 있게 되었다.

사용 예[편집]

유령 문자는 원래 출전 불명으로 과거의 용례가 밝혀지지 않았지만 규격 제정 이후 그 보급에 따라 유령 문자의 용례가 나타나고 있다.

일단 규격에 수록되어 있다 보니 유령 문자와 닮은 자형의 한자와 헷갈려 오용하기 쉬운데, 대표적인 예로 , とちだに, 로 잘못 쓰는 것 등이 있다. 사사하라 히로유키는 이러한 오용 예를 '유령 용법(幽霊用法)'이라고 부르며 애매한 용례의 부주의한 인용으로 인해 정보가 멋대로 돌아가는 것에 대해 주의를 환기하고 있다.

오자의 가능성이 높은 것 중에서 본래의 문자가 JIS X 0208에 수록되지 않은 것들은 유령 문자를 대용하는 예도 있다(𡚴原→妛原, 橳島→椦島 등). 규격상으로는 이러한 것들도 오용의 범주에 들어가지만 JIS X 0213에서는 다른 부호 위치에 본래에 문자들이 등록되고 JIS X 0213가 보급되면서 점차 이러한 용례는 줄어들 것이라고 예상된다.

같이 보기[편집]

각주

  1. 한국에서는 집터라는 고유한 뜻으로 쓰이고 있다. 한국에서는 한국 국자로 취급하며 일본에서는 일본 국자로 취급한다.
  2. 현지 관청에 의하면 본래는 이수변(冫)이었다고 한다. 하지만 2002년 1월 1일에 편의성과 용례를 고려하여 汢로 바꾸었다고 한다. 꺼무위키 나뮈병들은 표의 화살표만 보고 잘못 알아들었는지 과거에 汢를 썼고 현재 를 쓰고 있다며 반대로 서술하고 있다.
  3. JIS X 0208:1997 부속서 7의「区点位置詳説」에서는 로 잘못 표기하고 있다. 蒔(모종 시)를 薪(섶 신)으로 착각한 것이다.
  4. 이것 말고도 암합(暗合)되는 예가 있으며 신찬자경(新撰字鏡)과 편목차제(篇目次第)에서도 용례가 발견되었다고 한다.