데이터 마이닝과 데이터웨어 하우징 간의 차이점

Anonim

데이터 마이닝 및 데이터웨어 하우징

데이터 마이닝 및 데이터웨어 하우징은 데이터 분석을위한 매우 강력하고 널리 사용되는 기술입니다. 통계를 향한 경향이있는 사용자는 데이터 마이닝을 사용합니다. 그들은 통계 모델을 사용하여 데이터의 숨겨진 패턴을 찾습니다. 데이터 마이너는 서로 다른 데이터 요소 간의 유용한 관계를 찾는 데 관심이 있으며 궁극적으로 비즈니스에 유리합니다. 그러나 반면에 비즈니스의 차원을 직접 분석 할 수있는 데이터 전문가는 데이터웨어 하우스를 직접 사용하는 경향이 있습니다.

데이터 마이닝은 지식 검색 (KDD)이라고도합니다. 위에서 언급했듯이 원시 데이터에서 이전에 알려지지 않았고 흥미로운 정보를 추출하는 컴퓨터 과학 분야입니다. 특히 비즈니스와 같은 분야에서 기하 급수적 인 데이터 증가로 인해 데이터 마이닝은 지난 수십 년 동안 패턴의 수동 추출이 불가능 해 보였으므로이 풍부한 데이터를 비즈니스 인텔리전스로 변환하는 데 매우 중요한 도구가되었습니다. 예를 들어, 현재 소셜 네트워크 분석, 사기 탐지 및 마케팅과 같은 다양한 애플리케이션에 사용되고 있습니다. 데이터 마이닝은 일반적으로 클러스터링, 분류, 회귀 및 연결의 네 가지 작업을 처리합니다. 클러스터링은 구조화되지 않은 데이터와 유사한 그룹을 식별합니다. 분류는 새로운 데이터에 적용 할 수있는 학습 규칙이며 일반적으로 데이터 전처리, 모델링 설계, 학습 / 기능 선택 및 평가 / 검증 단계를 포함합니다. 회귀 분석은 모형 데이터에 대한 오차가 최소 인 함수를 찾는 것입니다. 그리고 협회는 변수 들간의 관계를 찾고 있습니다. 데이터 마이닝은 대개 내년 월마트에서 높은 이익을 얻는 데 도움이 될 수있는 주요 제품과 같은 질문에 대답하는 데 사용됩니까?

위에서 언급했듯이 데이터웨어 하우징은 데이터를 분석하는데도 사용되지만 다른 사용자 집합과 약간 다른 목표를 염두에두고 사용됩니다. 예를 들어, 소매 부문의 경우 데이터웨어 하우징 사용자는 고객이 어떤 종류의 구매를 선호하는지에 대해 관심이 많기 때문에 분석 결과는 고객 경험을 향상시켜 고객을 도울 수 있습니다. 그러나 데이터 마이너는 먼저 고객이 특정 유형의 제품을 구매하고 가설을 테스트하기 위해 데이터를 분석하는 등의 가설을 추측합니다. 데이터웨어 하우징은 뉴욕 매장이 시카고 매장보다 훨씬 더 빨리 작은 크기의 재고품을 판매한다는 사실을 나중에 알기 위해 동일한 크기의 제품으로 매장을 초기에 재고하는 주요 소매 업체가 수행 할 수 있습니다. 따라서이 결과를 보면 소매업자는 시카고 매장보다 작은 규모의 뉴욕 매장을 확보 할 수 있습니다.

따라서 분명히 알 수 있듯이이 두 가지 유형의 분석은 육안으로 같은 성질로 보입니다. 둘 다 역사적인 데이터를 기반으로 이익을 늘리는 것에 대해 우려하고 있습니다. 물론 핵심 차이점이 있습니다. 간단히 말해서 데이터 마이닝과 데이터웨어 하우징은 여러 유형의 분석을 제공하는 데 전념하지만 사용자 유형에 따라 다릅니다. 즉, Data Mining은 통계 가설을 뒷받침하는 상관 관계, 패턴을 찾습니다. 그러나 데이터웨어 하우징은 비교적 광범위한 질문에 대답하고 이후의 개선 방법을 인식하기 위해 이후부터 데이터를 조각하고 깍습니다.