code character encoding

코드 문자 인코딩

나루 위키
Lifthrasiir (토론 | 기여)님의 2019년 7월 26일 (금) 03:29 판 (영문 표기 추가)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)
둘러보기로 가기 검색하러 가기

나루 코드시작 바이트열로부터 문자 인코딩이 결정되어 유니코드 스칼라 값의 열로 변환된다.

시작 바이트열 패턴 인코딩
FE FF ... UTF-16BE
FF FE ... UTF-16LE
기타 UTF-8 (RFC 3629)

해당 문자 인코딩에서 잘못된 바이트열(UTF-16BE D8 00이나, UTF-8 F4 90 80 80 같은)은 치명적인 오류이다.

시작 바이트열은 무시되지 않고 해당 문자 인코딩으로 그대로 읽힌다. 그 결과로 나타나는 U+FEFF ZERO WIDTH NO-BREAK SPACE, 통칭 바이트 순서 마크(BOM)는 가로 공백 문자이므로 해석에 영향을 미치지 않는다.