반응형

 

유니코드에서는 한글은 물론이고, 다양한 언어의 다양한 기능을 폭넓게 제공하고 있다.

그리고, 언제나 그렇듯 종종 과유불급 상황이 벌어지곤 한다.

 

한글과 같은 비영어권 문자는 물론이고, 심지어 영어권 문자 영역에서도 이런 현상을 볼 수 있다.

 

유니코드에서 U+0085NEL(Next Line)으로 정의되어 있다.

이게 뭐냐면... EBCDIC 코드에서 기원한 New Line으로... 그냥 CR/LF와 비슷한 것이다[각주:1]...

그리고, U+00A0NBSP(No-Break Space)로 정의되어 있다.

SAMI 자막에서 흔히 볼 수 있는  가 바로 이 문자를 의미한다.

 

적어도 자막으로 한정해서 보면, 사실 이 문자들은 쓸 일이 없다.

NBSP가 SAMI에서 사용되는 건 SAMI가 HTML에 기반했기 때문이지 No-Break한 공백[각주:2]으로 쓰이진 않는다.

 

하지만, 최근에 자막 파일들을 뒤적거리다보니, 이 문자들이 실제로 적용된 자막들을 볼 수 있었다.

NEL은 메모장2로 보면 그나마 화면에 코드가 표시나 되지, NBSP는 알아보는 것 자체부터 쉽지 않았다.

 

어쨌거나, 이런 문자가 SRT 자막에 적용되면 NEL이든 NBSP든 그냥 공백으로 표시되는 것 같다[각주:3].

NBSP야 원래 공백이니 별 문제 없지만, NEL은 CR/LF과 동일하게 동작하는 게 더 자연스럽다. (Unicode TR 참조)

 

그나저나, 실제 기능으로 동작하지도 않고, 이미 멀쩡한 해당 문자가 있는데 이 문자들을 왜 입력했는지는 도저히 모르겠다...

 

 

  1. ASCII 쪽에선 여기에 대응되는 정확한 문자는 없음 [본문으로]
  2. HTML은 연속된 공백이 등장하면 하나만 인식하는 구조로 되어있기 때문에 연속된 공백을 위해 별도의 문자를 정의해둠 [본문으로]
  3. 팟 플레이어에서만 확인했지만, 다른 플레이어도 거의 같을 거라 예상함 [본문으로]
반응형

공유하기

facebook twitter kakaoTalk kakaostory naver band