ANSI와 유니 코드의 차이점

Anonim

ANSI와 유니 코드 사이에 있으며 유니 코드는 한 지점 또는 다른 지점에서 광범위하게 사용되는 두 가지 문자 인코딩입니다. 사용법은 ANSI가 매우 오래되었고 Windows 95/98 및 이전 버전과 같은 운영 체제에서 사용되는 반면, 유니 코드는 현재의 모든 운영 체제에서 사용되는 최신 인코딩이기 때문에 둘 사이의 주요 차이점이기도합니다. ANSI에는 사용 초기 단계에서 쉽게 알 수 없었던 많은 제한 사항이 있었지만 컴퓨팅이 전 세계적으로 퍼지기 시작하자 어려워졌습니다.

ANSI의 가장 큰 단점은 사용되는 언어에 따라 많은 코드 페이지를 사용한다는 것입니다. 영어 (서유럽 라틴어로 알려져 있음), 그리스어, 터키어, 히브리어, 아랍어 등 여러 언어가 있습니다. 데이터에 액세스하는 모든 컴퓨터가 동일한 코드 페이지를 사용하지만 다른 코드 페이지가 사용 중일 때는 읽는 데이터가 쓰여진 데이터와 같지 않을 때 아무런 문제가 없습니다. 이로 인해 특정 시나리오에서 데이터 손상 및 프로그램 충돌이 발생할 수 있습니다.

ANSI가 수용 할 수없는 이유는 모든 코드 포인트를 나타내는 데 8 비트 만 사용하기 때문입니다. 이 너비는 고정되어 있으며 총 256 개의 다른 조합 만 있습니다. 비교해 보면, 유니 코드는 각 코드 포인트 당 최대 32 비트를 사용합니다. UTF-32의 고정 폭으로 사용됩니다. 그러나 각 문자에 대해 4 바이트를 사용하면 공간이 많이 낭비되므로 UTF-8 및 UTF-16에서 가변 폭 인코딩을 사용하여 공간을 절약합니다.

유니 코드는 새로운 표준이므로 이전 운영 체제에서는 유니 코드를 지원하지 않을 수도 있습니다. UTF-8과 ANSI의 코드 포인트가 거의 동일하더라도 Windows 95와 같은 구형 운영 체제에서는 작동하지 않습니다. 따라서 유니 코드를 사용하는 프로그램은 이러한 운영 체제에서 제대로 실행되지 않습니다. 새로운 운영 체제에서 ANSI 코딩 된 프로그램을 실행하거나 반대하는 경우 ANSI와 유니 코드 간 변환 메커니즘이 있으므로 가능합니다. 전환시 약간의 오버 헤드가 추가된다는 점을 명심하십시오. 오늘날의 컴퓨터에서는 상당한 중요성을 갖지는 못하지만 프로그램 효율을 높이기 위해서는 여전히 주목할 필요가 있습니다.

요약:

1. ANSI는 매우 오래된 문자 인코딩이며 유니 코드는 현재 사용중인 표준입니다.

2. 유니 코드는

3이 아니지만 ANSI는 다른 언어로 다른 페이지를 사용합니다. ANSI는 고정 폭 인코딩을 사용하는 반면 유니 코드는 고정 폭과 가변 폭

4를 모두 사용할 수 있습니다. 유니 코드 프로그램은 구형 시스템에서는 작동하지 않습니다.

5. ANSI 프로그램은 현재 컴퓨터의 유니 코드 프로그램보다 느립니다.