유니코드에서는 한글은 물론이고, 다양한 언어의 다양한 기능을 폭넓게 제공하고 있다.
그리고, 언제나 그렇듯 종종 과유불급 상황이 벌어지곤 한다.
한글과 같은 비영어권 문자는 물론이고, 심지어 영어권 문자 영역에서도 이런 현상을 볼 수 있다.
유니코드에서 U+0085는 NEL(Next Line)으로 정의되어 있다.
이게 뭐냐면... EBCDIC 코드에서 기원한 New Line으로... 그냥 CR/LF와 비슷한 것이다[각주:1]...
그리고, U+00A0은 NBSP(No-Break Space)로 정의되어 있다.
SAMI 자막에서 흔히 볼 수 있는 가 바로 이 문자를 의미한다.
적어도 자막으로 한정해서 보면, 사실 이 문자들은 쓸 일이 없다.
NBSP가 SAMI에서 사용되는 건 SAMI가 HTML에 기반했기 때문이지 No-Break한 공백[각주:2]으로 쓰이진 않는다.
하지만, 최근에 자막 파일들을 뒤적거리다보니, 이 문자들이 실제로 적용된 자막들을 볼 수 있었다.
NEL은 메모장2로 보면 그나마 화면에 코드가 표시나 되지, NBSP는 알아보는 것 자체부터 쉽지 않았다.
어쨌거나, 이런 문자가 SRT 자막에 적용되면 NEL이든 NBSP든 그냥 공백으로 표시되는 것 같다[각주:3].
NBSP야 원래 공백이니 별 문제 없지만, NEL은 CR/LF과 동일하게 동작하는 게 더 자연스럽다. (Unicode TR 참조)
그나저나, 실제 기능으로 동작하지도 않고, 이미 멀쩡한 해당 문자가 있는데 이 문자들을 왜 입력했는지는 도저히 모르겠다...
이제는 안드로메다로 가버리는 SAMI 자막... (8) | 2022.08.23 |
---|---|
인텔이 공개한 SVT-AV1의 성능 테스트 결과 (1) | 2022.04.27 |
아마 영원히 어려울 Exif, ICC Profile 처리... (3) | 2022.01.09 |
ffmpeg으로 VirtualDub과 동일한 무압축 RGB 비디오를 만드는 법 (0) | 2021.11.10 |
MainConcept HEVC 인코더가 2.0으로 업데이트됨 (0) | 2021.10.18 |
댓글