데이터 마이닝과 OLAP의 차이점

Anonim

데이터 마이닝과 OLAP 비교

데이터 마이닝과 OLAP은 일반적인 비즈니스 인텔리전스 (BI) 기술 중 두 가지입니다. 비즈니스 인텔리전스는 비즈니스 데이터에서 유용한 정보를 식별하고 추출하기위한 컴퓨터 기반의 방법을 나타냅니다. 데이터 마이닝은 커다란 데이터 세트에서 재미있는 패턴을 추출하는 컴퓨터 과학 분야입니다. 인공 지능, 통계 및 데이터베이스 관리의 여러 가지 방법을 결합합니다. 이름에서 알 수 있듯이 OLAP (온라인 분석 처리)은 다차원 데이터베이스를 쿼리하는 방법을 모아 놓은 것입니다.

데이터 마이닝은 지식 검색 (KDD)이라고도합니다. 위에서 언급했듯이 원시 데이터에서 이전에 알려지지 않았고 흥미로운 정보를 추출하는 컴퓨터 과학 분야입니다. 특히 비즈니스와 같은 분야에서 기하 급수적 인 데이터 증가로 인해 데이터 마이닝은 지난 수십 년 동안 패턴의 수동 추출이 불가능 해 보였으므로이 풍부한 데이터를 비즈니스 인텔리전스로 변환하는 데 매우 중요한 도구가되었습니다. 예를 들어, 현재 소셜 네트워크 분석, 사기 탐지 및 마케팅과 같은 다양한 애플리케이션에 사용되고 있습니다. 데이터 마이닝은 일반적으로 클러스터링, 분류, 회귀 및 연결의 네 가지 작업을 처리합니다. 클러스터링은 구조화되지 않은 데이터와 유사한 그룹을 식별합니다. 분류는 새로운 데이터에 적용 할 수있는 학습 규칙이며 일반적으로 데이터 전처리, 모델링 설계, 학습 / 기능 선택 및 평가 / 검증 단계를 포함합니다. 회귀 분석은 모형 데이터에 대한 오차가 최소 인 함수를 찾는 것입니다. 그리고 협회는 변수 들간의 관계를 찾고 있습니다. 데이터 마이닝은 일반적으로 월마트에서 내년에 높은 ​​수익을 얻는 데 도움이 될 수있는 주요 제품과 같은 질문에 대답하는 데 사용됩니다.

OLAP은 다차원 쿼리에 대한 응답을 제공하는 시스템 클래스입니다. 일반적으로 OLAP은 마케팅, 예산 책정, 예측 및 유사한 응용 프로그램에 사용됩니다. OLAP에 사용되는 데이터베이스는 빠른 성능을 염두에두고 복잡하고 특수한 쿼리로 구성된다는 것은 말할 필요도 없습니다. 일반적으로 행렬은 OLAP의 출력을 표시하는 데 사용됩니다. 행과 열은 쿼리의 차원에 의해 형성됩니다. 그들은 종종 요약을 얻기 위해 여러 테이블에서 집계 방법을 사용합니다. 예를 들어, 월마트에서 올해의 매출을 작년에 비해 비교하는 데 사용할 수 있습니까? 다음 분기의 매출 예측은 어떻게됩니까? 백분율 변화를 보면서 추세에 대해 말할 수있는 것은 무엇입니까?

데이터 마이닝과 OLAP은 지능을 얻기 위해 데이터에서 작동하기 때문에 비슷하지만 주요 차이점은 데이터에서 어떻게 작동하는지에 따른 것입니다.OLAP 도구는 다차원 데이터 분석을 제공하며 데이터 요약을 제공하지만 대조적으로 데이터 마이닝은 데이터 집합의 비율, 패턴 및 영향에 중점을 둡니다. 이는 "추가"를 통해 데이터 조작으로 이어지는 집계와 OLAP 계약이지만 데이터 마이닝은 "부문"에 해당합니다. 다른 중요한 차이점은 데이터 마이닝 도구가 데이터를 모델링하고 실행 가능한 규칙을 반환하는 동안 OLAP은 비즈니스 차원에서 실시간으로 비교 및 ​​대비 기술을 수행한다는 것입니다.