마케팅 이야기

[cafe24 분석 2편] 쇼핑몰(이커머스) 리뷰 분석_파이썬 활용법

창이 2022. 12. 18.
728x90
반응형

안녕하세요 ! 

사실, 엑셀에서 보여지는 몇 개의 데이터만 처리하기 위해서는

우리가 직접 손으로 세어봐도 되요.

 

하지만,

데이터가 몇 만개, 몇 십만개 이렇게 존재한다면?

저희는 일일이 데이터들을 세기가 힘들겠죠. 

그래서 대부분 통계 프로그램을 이용합니다. 

 

저 같은 경우 원래 R로 통계 분석을 진행했으나 

R 같은 경우 자연어 처리할 수 있는 패키지인 KoNLP가 완벽하게 구현되지 않아

항상 어려움을 겪었던 것 같아요. 

그래서,이번에 아는 동생의 도움을 받아 '파이썬'을 활용해보기로 했습니다.

 

파이썬이라는 통계 패키지를 막 열심히 공부해야할 것 같고

통계 분석의 개념을 알아야 할 수 있을 것 같지만,

사실 그건 아니거든요.

 

저희 같은 인하우스 마케터들은 통계 툴을 활용한 결과값이 필요하지

그 과정이 필요한 건 아니잖아요?

 

더해서, 결과값을 활용한 인사이트 도출이 중요한거지 

통계 분석에 대한 구체적인 내용이 중요한 것이 아닙니다.

 

서론이 너무 길었군요.

우선 파이썬을 키는 것부터 시작하겠습니다. 

 

우선 인터넷에서 바로 분석할 수 있는 환경인 

COLAB으로 들어갑니다.

 

https://colab.research.google.com/

 

Google Colaboratory

 

colab.research.google.com

 

왼쪽 위 '파일'을 누르면

'새노트' 라는 말이 나오는데 

새노트를 생성해주세요.

 

그 후, 우선 파일을 colab 환경으로 가져와야 

그 엑셀 파일을 분석할 수 있겠죠?

왼쪽 바에 있는 네모 박스를 클릭합니다.

여기다가 drag and drop으로 끌고옵니다.

엑셀 제목을 적절하게 변경한 후에 끌고오는 것이 좋겠죠? 


이제 코드를 짜볼까요! 

# 이 셀을 실행시키고 '런타임 > 런타임 다시 시작'을 해주세요
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf

* 나눔 폰트를 설치하고 폰트 설정 / 한글 폰트를 설정하느 코드입니다. 

 

!pip install konlpy

* 자연어 처리를 하기 위한 NLP 관련 파이썬 패키지로 생각하시면 됩니다. 

해당 라이브러리가 있어야 리뷰 분석이 가능합니다. 

 

from glob import glob
import pandas as pd
from datetime import datetime
import plotly

from konlpy.tag import Okt
from collections import Counter
from wordcloud import WordCloud
from matplotlib import pyplot as plt
%matplotlib inline

* 파이썬 데이터 분석 관련한 라이브러리인 pandas, 그래프 그리는 라이브러리인 plotly 등, 

데이터를 분석하는 데에 필요한 다양한 라이브러리를 다운받아 줍니다. 

plt.rc('font', family='NanumBarunGothic')

 

쇼핑몰 리뷰 분석을 위한 세팅 작업들이 모두 끝났습니다.

다음 시간 부터는 실제 데이터를 가져와

결과물을 내는 것까지 진행해보겠습니다. 

 

728x90
반응형

댓글

추천 글