728x90
반응형

 

GA는 모든 데이터를 보여주진 않는다.

글 애널리틱스의 데이터가 모든 것을 보여주지는 않는다는 것을 알고 계신가요?
우선 기존 유니버셜 애널리틱스(이하 GA3)를 기준으로 보자면,
GA3가 모든 데이터를 수집하고 보관하면서 분석하는 일은 무료 툴에서 효율성이 떨어집니다.

모든 데이터를 그때 그때 분석해서 내놓는다면 시간도 오래걸리게 되겠죠.
그렇다보니 기준을 초과하는 데이터를 정재해서 보여줍니다.
이것이 데이터 샘플링(Data Sampling)입니다.

데이터 샘플링을 더 간단하게 이해하는 방법은 인사이드 아웃의 구슬을 상상하는 것 입니다.
만약 우리에게 파란색, 노란색, 빨간색 등의 구슬이 굉장히 많이 있다고 볼 때,
여기서 파란색 구슬은 몇 개인지 어떻게 알 수 있을까요?

 

 

가장 정확한 방법은 모든 구슬을 하나씩 세면서 분류하는 방법이 있습니다.
그리고 정확도는 떨어지지만 빠른 방법으로는 100개 까지만 무작위로 구슬을 꺼내고,
파란색이 나오는 숫자를 기반으로 추론하는 방법이 있습니다.
이렇게 다양한 구슬 중 일부를 뽑고 그 비율에 따라 추론하는 것이 데이터 샘플링입니다.

 

 

GA4는 데이터 샘플링이 있는가?

GA4에도 데이터 샘플링이 존재합니다.
GA4의 보고서(Report)탭은 표준 보고서로 아직까지는 데이터 샘플링이 되지 않습니다.
하지만 표준 보고서 외의 탐색(Explore), 광고(Advertising), 구성(Configure)의 보고서는 고급 보고서로 데이터 샘플링이 될 수 있습니다.

 

 

샘플링 되지 않은 보고서
샘플링 된 보고서, 추가로 기준점이 적용된 보고서

 

데이터 샘플링이 되는지 안되는지는 보고서 등의 GA4 화면 상단에 표시를 보면 알 수 있습니다.
초록색 체크 아이콘이 있다면 데이터 샘플링이 되지 않은 데이터를 보고 있는 것입니다.
만약에 초록색이 아닌 주황색의 아이콘이 나타나게 됩니다.

해당 아이콘에 마우스로 클릭해보면 N%의 데이터를 기반으로 표시된 내용인지 나타나게 됩니다.
그 외에도 샘플링은 100% 이지만 기준점 미달에 대한 내용이 있으니, 초록색이 아니라고 너무 경계하진 마세요.

 

GA4에서는 일부 데이터에서 사용자 추론이 불가능하도록 기준점 설정이 되어있습니다.
인구통계학 데이터의 임계값은 GA에서 설정한 사항으로 수정이 불가능하고,
만약 특정 지역의 성별 등이 나오지 않는다면 기준점 이하로 수집된 내용으로 보면 됩니다.

 

고급 보고서에서 데이터 샘플링이 안되는데요?

고급 보고서에서 데이터 샘플링이 걸리지 않는 경우

 

고급 보고서에서 데이터 샘플링이 된다고 말했는데,
막상 들어가보니까 데이터 샘플링이 없다고 나타나고 있나요?

그렇다면 아직 데이터 샘플링이 필요할 정도로 수집된 이벤트수가 많지 않다는 내용입니다.
데이터를 더 정확히 볼 수 있기에 분석 면에서는 더 좋은 것이지만,
샘플링에 걸릴 정도로 아직 유저가 유입되고 활동하지 않기에 분발해야하는 내용일 수도 있겠네요.

 

 

데이터 샘플링 피할 수 없는 것인가요.

네 ... 데이터 샘플링을 피할 순 없습니다.
무료로 사용하는 분석 툴인 만큼 어느정도의 패널티는 감수해야 합니다.
데이터 샘플링이 된 데이터가 무조건 틀린 것은 아니지만, 

무조건 맞는 것도 아니기에 언제나 우리에겐 비판적 사고를 열어놓고 분석해야합니다.

 

참고로 GA3의 데이터 샘플링이 적용되는 데이터의 기준점을 아래와 같습니다.
1. GA3 무료 기준 - 설정 기간 동안의 세션 50만회 이상 발생 시
2. Analytics360 기준 - 설정 기간 동안의 세션이 1억 회 이상 발생 시
반응형
복사했습니다!