code character encoding
코드 문자 인코딩
둘러보기로 가기
검색하러 가기
나루 코드는 시작 바이트열로부터 문자 인코딩이 결정되어 유니코드 스칼라 값의 열로 변환된다.
시작 바이트열 패턴 | 인코딩 |
---|---|
FE FF ... |
UTF-16BE |
FF FE ... |
UTF-16LE |
기타 | UTF-8 (RFC 3629) |
해당 문자 인코딩에서 잘못된 바이트열(UTF-16BE D8 00
이나, UTF-8 F4 90 80 80
같은)은 치명적인 오류이다.
시작 바이트열은 무시되지 않고 해당 문자 인코딩으로 그대로 읽힌다. 그 결과로 나타나는 U+FEFF ZERO WIDTH NO-BREAK SPACE, 통칭 바이트 순서 마크(BOM)는 가로 공백 문자이므로 해석에 영향을 미치지 않는다.