▶ URL은 웹 주소의 다른 단어이다

▶ URL은 단어(예시 : w3school.com) 혹은 인터넷 프로토콜 (IP) 주소 (예시 : 192.168..20.50)으로 구성될 수 있다.

▶ 대부분의 사람들은 인터넷 서핑할 때 이름으로 검색한다. 왜냐함ㄴ 이름이 숫자보다 기억하기 더 쉽기 때문이다.

 

■ URL - Uniform Resource Locator

▶ 웹 Browser는 URL을 사용하여 웹 서버로 부터 페이지를 요청한다.

▶ URL은 웹에서 문서(또는 기타 데이터)의 주소를 지정하는 데 사용된다.

https://www.w3schools.com/html/default.asp와 와 같은 웹 소는 다음 구문 규칙을 따른다.

scheme://prefix.domain:port/path/filename

▶ 설명 :

▷ scheme - 인터넷 서비스의 유형을 정의한다. ( 대부분 일반적으로 http 혹은 https 이다 )

▷ prefix - 도메인 접두사를 정의한다. ( http의 기본은 www 이다 )

▷ domain - 인터넷 도메인 이름은 정의한다. ( w3schhols.com )

▷ port - 호스트의 포트 번호를 정의한다.  ( http의 기본은 80이다 )

▷ path - 서버의 경로를 정의한다. ( 생략된 경우 : 사이트의 루트 디렉터리 )

▷ filename - 리소스 혹은 문서의 이름을 정의한다.

 

■ 일반적인 URL 스키마

▶ 아래 표에는 몇 가지 일반적인 구성표가 나열되어 있다.

▷ http (HyperText Transfer Protocol) : 일반적인 웹 페이지. 암호화 되지 않는다.

▷ https (Secure HyperText Transfer Protocol) : 보안 웹 페이지. 암호화된다.

▷ ftp (File Transfer Protocol) : 파일 다운로드 혹은 업로드

▷ file : 컴퓨터의 파일

 

■ URL 인코딩

▶ URL은 ASCII 문자 집합을 사용하여 인터넷을 통해서만 보낼 수 있다.

▶ URL에 ASCII 집합 이외의 문자가 포함되어 있으면 URL을 변환해야 한다.

▶ URL 인코딩은 ASCII가 아닌 문자를 인터넷을 통해 전송할 수 있는 형식으로 변환한다.

▶ URL 인코딩은 ASCII가 아닌 문자를 "%" 뒤에 16진수로 대체한다.

▶ URL은 공백을  포함할 수 없다.

▶ URL 인코딩은 일반적으로 공백을 더하기(+) 기호 또는 "%20"으로 대체한다.

 

■ ASCII 인코딩 예시

▶ Browser는 페이지에서 사용된 문자 집합에 따라 입력을 인코딩한다.

▶ HTML5의 기본 문자 집합은 UTF-8 이다.

 

출처 : https://www.w3schools.com/html/html_urlencode.asp

 

HTML URL Encoding

W3Schools offers free online tutorials, references and exercises in all the major languages of the web. Covering popular subjects like HTML, CSS, JavaScript, Python, SQL, Java, and many, many more.

www.w3schools.com

 

'HTML' 카테고리의 다른 글

HTML / (51) Forms  (0) 2023.02.28
HTML / (50) HTML vs XHTML  (0) 2023.02.27
HTML / (48) 인코딩 (문자 집합)  (0) 2023.02.27
HTML / (47) 이모티콘 사용하기  (0) 2023.02.27
HTML / (46) 기호  (0) 2023.02.27

▶ 올바른 HTML 페이지를 표시하려면 웹 Browser에서 사용할 문자 집합을 알아야 한다.

 

■ ASCII 에서 UTF-8

▶ ASCII는 최초의 문자 인코딩 표준이였다.

▶ ASCII는 인터넷에서 사용할 수 있는 128개의 서로 다른 문자를 정의했다.

▶ 숫자(0-9), 영문자(A-Z) 및 ! $ + - ( ) @ < > .

 

▶ ISO-8859-1은 HTML 4의 기본 문자 집합이였다.

▶ 문자 집합은 256개의 서로 다른 문자 코드를 지원했다.

 

▶ ANSI(Windows-1252)는 원래 Windows 문자 집합이였다.

▶ ANSI는 ANSI에 32개의 추가 문자가 있다는 점을 제외하면 ISO-8859-1과 동일하다.

 

▶ HTML5 사양은 웹 개발자가 UTF-8 문자 집합을 사용하도록 권장한다.

▶ UTF-8 문자 집합은 전 세계의 거의 모든 문자와 기호를 포함한다.

 

■ HTML charset 속성

▶ 올바른 HTML 페이지를 표시하려면 웹 Browser가 페이지에 사용된 문자 집합을 알아야 한다.

▶ <meta> 태그에 지정된다.

<meta charset="UTF-8">

 

■ 문자 집합 간의 차이점

▶ 다음 표는 위에서 설명한 문자 집합 간의 차이점이다.

▶ 추가 문자 집합 차이 : https://www.w3schools.com/html/html_charset.asp

 

■ ASCII 문자 집합

▶ ASCII는 제어 문자에 0에서 31 (및 127) 까지의 값을 사용한다.

▶ ASCII는 문자, 숫자 및 기호에 대해 32에서 126까지의 값을 사용한다.

▶ ASCII는 128에서 255 사이의 값을 사용하지 않는다.

 

■ ANSI 문자 집합 (Windows-1252)

▶ ANSI는 0에서 127까지의 값에 대해 ASCII와 동일하다.

▶ ANSI에는 128에서 159까지의 값에 대한 독점 문자 세트가 있다.

▶ ANSI는 160에서 255까지의 값에 대해 UTF-8과 동일하다.

 

■ ISO-8859-1 문자 집합

▶ ISO-8859-1은 0에서 127까지의 값에 대해 ASCII와 동일하다.

▶ ISO-8859-1은 128에서 159까지의 값을 사용하지 않는다.

▶ ISO-8859-1은 160에서 255가지의 값에 대해 UTF-8과 동일하다.

 

■ UTF-8 문자 집합

▶ UTF-8은 0에서 127까지의 값에 대해 ASCII와 동일하다.

▶ UTF-8은 128에서 159까지의 값을 사용하지 않는다.

▶ UTF-8은 160에서 255까지의 값에 대해 ANSI 및 8859-1과 동일하다.

▶ UTF-8은 값 256에서 10,000개 이상의 다른 문자로 이어진다.

▶ 자세한 내용 : https://www.w3schools.com/charsets/default.asp

 

출처 : https://www.w3schools.com/html/html_charset.asp

 

HTML Charset

W3Schools offers free online tutorials, references and exercises in all the major languages of the web. Covering popular subjects like HTML, CSS, JavaScript, Python, SQL, Java, and many, many more.

www.w3schools.com

 

'HTML' 카테고리의 다른 글

HTML / (50) HTML vs XHTML  (0) 2023.02.27
HTML / (49) URL (Uniform Resource Locators)  (0) 2023.02.27
HTML / (47) 이모티콘 사용하기  (0) 2023.02.27
HTML / (46) 기호  (0) 2023.02.27
HTML / (45) 엔티티  (0) 2023.02.27

+ Recent posts