HTML

HTML / (48) 인코딩 (문자 집합)

Mr.sheep 2023. 2. 27. 13:10

▶ 올바른 HTML 페이지를 표시하려면 웹 Browser에서 사용할 문자 집합을 알아야 한다.

 

■ ASCII 에서 UTF-8

▶ ASCII는 최초의 문자 인코딩 표준이였다.

▶ ASCII는 인터넷에서 사용할 수 있는 128개의 서로 다른 문자를 정의했다.

▶ 숫자(0-9), 영문자(A-Z) 및 ! $ + - ( ) @ < > .

 

▶ ISO-8859-1은 HTML 4의 기본 문자 집합이였다.

▶ 문자 집합은 256개의 서로 다른 문자 코드를 지원했다.

 

▶ ANSI(Windows-1252)는 원래 Windows 문자 집합이였다.

▶ ANSI는 ANSI에 32개의 추가 문자가 있다는 점을 제외하면 ISO-8859-1과 동일하다.

 

▶ HTML5 사양은 웹 개발자가 UTF-8 문자 집합을 사용하도록 권장한다.

▶ UTF-8 문자 집합은 전 세계의 거의 모든 문자와 기호를 포함한다.

 

■ HTML charset 속성

▶ 올바른 HTML 페이지를 표시하려면 웹 Browser가 페이지에 사용된 문자 집합을 알아야 한다.

▶ <meta> 태그에 지정된다.

<meta charset="UTF-8">

 

■ 문자 집합 간의 차이점

▶ 다음 표는 위에서 설명한 문자 집합 간의 차이점이다.

▶ 추가 문자 집합 차이 : https://www.w3schools.com/html/html_charset.asp

 

■ ASCII 문자 집합

▶ ASCII는 제어 문자에 0에서 31 (및 127) 까지의 값을 사용한다.

▶ ASCII는 문자, 숫자 및 기호에 대해 32에서 126까지의 값을 사용한다.

▶ ASCII는 128에서 255 사이의 값을 사용하지 않는다.

 

■ ANSI 문자 집합 (Windows-1252)

▶ ANSI는 0에서 127까지의 값에 대해 ASCII와 동일하다.

▶ ANSI에는 128에서 159까지의 값에 대한 독점 문자 세트가 있다.

▶ ANSI는 160에서 255까지의 값에 대해 UTF-8과 동일하다.

 

■ ISO-8859-1 문자 집합

▶ ISO-8859-1은 0에서 127까지의 값에 대해 ASCII와 동일하다.

▶ ISO-8859-1은 128에서 159까지의 값을 사용하지 않는다.

▶ ISO-8859-1은 160에서 255가지의 값에 대해 UTF-8과 동일하다.

 

■ UTF-8 문자 집합

▶ UTF-8은 0에서 127까지의 값에 대해 ASCII와 동일하다.

▶ UTF-8은 128에서 159까지의 값을 사용하지 않는다.

▶ UTF-8은 160에서 255까지의 값에 대해 ANSI 및 8859-1과 동일하다.

▶ UTF-8은 값 256에서 10,000개 이상의 다른 문자로 이어진다.

▶ 자세한 내용 : https://www.w3schools.com/charsets/default.asp

 

출처 : https://www.w3schools.com/html/html_charset.asp

 

HTML Charset

W3Schools offers free online tutorials, references and exercises in all the major languages of the web. Covering popular subjects like HTML, CSS, JavaScript, Python, SQL, Java, and many, many more.

www.w3schools.com