유니코드에서는 한글은 물론이고, 다양한 언어의 다양한 기능을 폭넓게 제공하고 있다.
그리고, 언제나 그렇듯 종종 과유불급 상황이 벌어지곤 한다.
한글과 같은 비영어권 문자는 물론이고, 심지어 영어권 문자 영역에서도 이런 현상을 볼 수 있다.
유니코드에서 U+0085는 NEL(Next Line)으로 정의되어 있다.
이게 뭐냐면... EBCDIC 코드에서 기원한 New Line으로... 그냥 CR/LF와 비슷한 것이다...
그리고, U+00A0은 NBSP(No-Break Space)로 정의되어 있다.
SAMI 자막에서 흔히 볼 수 있는 가 바로 이 문자를 의미한다.
적어도 자막으로 한정해서 보면, 사실 이 문자들은 쓸 일이 없다.
NBSP가 SAMI에서 사용되는 건 SAMI가 HTML에 기반했기 때문이지 No-Break한 공백으로 쓰이진 않는다.
하지만, 최근에 자막 파일들을 뒤적거리다보니, 이 문자들이 실제로 적용된 자막들을 볼 수 있었다.
NEL은 메모장2로 보면 그나마 화면에 코드가 표시나 되지, NBSP는 알아보는 것 자체부터 쉽지 않았다.
어쨌거나, 이런 문자가 SRT 자막에 적용되면 NEL이든 NBSP든 그냥 공백으로 표시되는 것 같다.
NBSP야 원래 공백이니 별 문제 없지만, NEL은 CR/LF과 동일하게 동작하는 게 더 자연스럽다. (Unicode TR 참조)
그나저나, 실제 기능으로 동작하지도 않고, 이미 멀쩡한 해당 문자가 있는데 이 문자들을 왜 입력했는지는 도저히 모르겠다...