code character encoding

코드 문자 인코딩

나루 위키
둘러보기로 가기 검색하러 가기

나루 코드시작 바이트열로부터 문자 인코딩이 결정되어 유니코드 스칼라 값의 열로 변환된다.

시작 바이트열 패턴 인코딩
FE FF ... UTF-16BE
FF FE ... UTF-16LE
기타 UTF-8 (RFC 3629)

해당 문자 인코딩에서 잘못된 바이트열(UTF-16BE D8 00이나, UTF-8 F4 90 80 80 같은)은 치명적인 오류이다.

시작 바이트열은 무시되지 않고 해당 문자 인코딩으로 그대로 읽힌다. 그 결과로 나타나는 U+FEFF ZERO WIDTH NO-BREAK SPACE, 통칭 바이트 순서 마크(BOM)는 가로 공백 문자이므로 해석에 영향을 미치지 않는다.