유니 코드와 UTF-8의 차이점

Anonim

유니 코드 대 UTF -8

유니 코드의 개발은 오늘날 사용되는 대다수의 언어에서 문자를 매핑하는 새로운 표준을 만드는 데 그 목적이 있습니다.이 표준은 텍스트 작성에 필수적 일 수있는 다른 문자와 함께 사용됩니다. UTF-8은 파일 내부의 문자를 유니 코드로 인코딩 할 수있는 여러 가지 방법이 있기 때문에 파일을 인코딩 할 수있는 많은 방법 중 하나 일뿐입니다.

UTF-8은 호환성을 염두에두고 개발되었습니다. ASCII는 매우 중요한 표준이었고 ASCII 표준에 이미 파일을 갖고있는 사람들은 현재 시스템을 손상시킬 수 있기 때문에 유니 코드 채택에 주저 할 수 있습니다. UTF-8은 ASCII 문자로 설정된 파일 만 인코딩하면 마치 ASCII로 인코딩 된 것처럼 동일한 파일이되므로이 문제를 해결했습니다. 이로 인해 사람들은 파일을 변환하거나 유니 코드 표준을 인식하지 못했던 현재의 레거시 소프트웨어를 변경하지 않고도 유니 코드를 채택 할 수있었습니다. 유니 코드에 대한 다른 매핑 방법은 ASCII와의 호환성을 깨고 사람들이 시스템을 변환하도록합니다.

UTF-8의 ASCII에 대한 호환성 준수는 부작용을 유발하여 대부분의 경우에 사용되는 모든 문자가 ASCII 문자 세트에 포함되는 워드 프로세싱에 이상적입니다. UTF-8은 바이트를 사용하여 모든 코드 포인트를 나타냅니다. 파일 크기는 UT-16으로 인코딩 된 파일의 절반 인 2 바이트이며, 4 분의 1은 UTF-32로 인코딩 된 동일한 파일에 4를 사용합니다.

UTF-8은 공간 효율적이고 바이트 지향적이기 때문에 World Wide Web에서 채택되었습니다. 웹 페이지는 대개 ASCII 문자 세트 외부에있는 문자를 포함하지 않는 단순한 텍스트 파일입니다. 다른 인코딩 방법을 사용하면 아무런 이점도없이 네트워크로드가 증가합니다. 전자 메일 전송 시스템에서도 UTF-8은 아직도 사용되고있는 오래된 인코딩 시스템을 대체하기 위해 천천히 그러나 확실히 채택되고 있습니다.

요약:

1. 유니 코드는 컴퓨터에서 텍스트를 표시하고 조작하는 표준으로, UTF-8은 유니 코드

2의 많은 매핑 방법 중 하나입니다. UTF-8은 이전 ASCII

3과의 호환성을 유지하는 매핑 방법입니다. UTF-8은 다른 인코딩 방법과 비교하여 유니 코드에서 가장 공간 효율적인 매핑 방법입니다.

4. UTF-8은 웹에서 가장 많이 사용되는 유니 코드 표준입니다.