code character

코드 문자

나루 위키
Lifthrasiir (토론 | 기여)님의 2019년 7월 26일 (금) 03:23 판 (영문 표기 추가)
(차이) ← 이전 판 | 최신판 (차이) | 다음 판 → (차이)
둘러보기로 가기 검색하러 가기

코드 문자는 나루 코드를 이루는 유니코드 스칼라 값이다. 물론 모든 코드는 내부적으로 바이트열로 해석되겠지만, 토큰화 과정에서 무조건 코드 문자열로 변환되어야 한다.

모든 문자는 그 용도에 따라 다음 중 하나로 분류할 수 있다.

분류 용도 예제
이름 시작 문자 이름의 맨 앞이나 중간에 올 수 있음 A..Z, a..z, _,
이름 계속 문자 이름의 중간에만 올 수 있음 U+00B7 ·
십진 자리 문자 숫자 리터럴 맨 앞이나 이름의 중간에 올 수 있음 0..9
기호 문자 기호를 이룸 !, &, <
여는 구획 문자 구획의 시작을 이룸 (, {, [
닫는 구획 문자 구획의 끝을 이룸 ), }, ]
여는 따옴표 문자 토큰화시 따옴표 모드를 켬 ,
닫는 따옴표 문자 토큰화시 따옴표 모드를 끔 ,
여닫는 따옴표 문자 토큰화시 따옴표 모드를 반전함 ', ", `
가로 공백 문자 연속되어 공백을 이룸 U+0009, U+0020, U+FEFF
세로 공백 문자 개행으로 해석됨 U+000A, U+000D
기타 문자 오류 토큰으로 해석됨 U+0000, U+20A9