마케팅 이야기

회귀분석과 마케팅, 그 어딘가

창이 2023. 6. 12.
728x90
반응형

안녕하세요.

이전 글에서 크리테오에 대해 글을 썼던 적이 있습니다.

해당 글에서 회귀분석을 잠시 언급했었는데요.

2023.05.27 - [마케팅 이야기] - 네트워크 광고 매체, 크리테오 이용기_2편 전/후

 

네트워크 광고 매체, 크리테오 이용기_2편 전/후

안녕하세요. 1편에서는 대표적인 네트워크 광고매체 중 하나인 크리테오의 세팅법에 대해서 적었는데, 이번엔 진짜로, 찐 저의 후기를 알려드리고자 합니다. 혹시, 크리테오를 이용해보고 싶은

m-kang97.tistory.com

회귀분석이란, 

종속변수와 독립변수 간의 상관성을 살피고 

실제 유의미한 차이가 있는지

확인해보는 통계 기법입니다. 

 

위 이미지는

실제 데이터를 활용하여

cafe24에서 집계되는 실 매출과 

광고 매체에서 집계되는 매출과

유의미한 차이가 있는가를

주제로 분석을 해본 내용입니다. 

 

해당 예제는 실제 

경영 통계학을 배울 때 나오는 예제로 

주당 학습시간과 학점의 예시입니다. 

 

해당 코드는 R로 돌렸습니다. 

주당 학습시간이 학점에 영향을 미치는 지를 

알아보는 실험이기 때문에

주당 학습시간을 독립변수로,

학점을 종속변수로 넣었습니다. 

회귀분석에 사용되는 

lm 코드는 다른 곳에 워낙 잘 정리되어 있으니

여기서는 생략하겠습니다.

 

간단하게 해석을 하자면,

"유의수준 p value 0.05 하에서 주당 학습시간과 학점에는 상관관계가 있다."

Adjusted R -squared가 0.4로 주당 학습시간이 학점에 대해 약 40% 정도 설명하고 있지만 p-value 0.00667로 95% 신뢰구간 이내에 있는 것으로 확인된다. 따라서 귀무가설인 주당 학습시간과 학점에는 상관관계가 없다는 가설을 기각할 수 있다.

해당 데이터가 잘 설명된다는 것을 

증명하기 위해서는 

해당 모델들이 회귀분석에 적합한지

먼저 알아봐야 합니다. 

 

그래서 선형회귀에는 

기본 4가지 가정들을 만족해야 하는데요. 

선형성 / 등분산성 / 독립성 / 정규성 등입니다. 

 

해당 예제에서는 

편의상 빼고 진행했으며 

기존 매출 예시도 간단하게 알아보려 했던 탓에

기본 가정들은 무시한 채 진행했습니다. 

 

이번 포스팅에서는

이러한 방법으로 실제 업무에서도

학부시절 배우는 다양한 통계 기법을

적용할 수 있다는 것을 

보여주기 위함이었으며 

 

다중공선성이나 정규성 검정 등 

깊게 들어가게 되면 길어지기 때문에

여기서 마치도록 하겠습니다.

이후에,

각 잡고 실 매출 데이터로 회귀분석을 돌릴 때

모든 가정들을 만족시킨 분석값을 활용하여

다시 포스팅해보겠습니다.

 

읽어주셔서 감사합니다. 

728x90
반응형

댓글

추천 글