728x90
반응형

빅데이터5

Simulation 공부 with R 공부하려고 TISTORY하는 범창입니다. simulation을 이용한 연구를 위해서는 난수 발생이 필수입니다. 그 중에서 0과 1사이의 균일 난수가 가장 기본 random numbers는 독립의 성격을 갖는 U(0, 1) random variables EX3 파이 추정 P(U1^2 + U2^2 2021. 10. 2.
빅데이터 ; R markdown 실습하기 R markdown을 처음 써봤습니다. R markdown을 사용하여 특정 데이터셋에 대해 빈도수를 구하고 이를 그림으로 나타내기 최종 pdf로 추출하는 과정까지 실습한 내용입니다. barplot(table(crime$Category)) Calls: ... process_file -> split_file -> lapply -> FUN -> parse_block 실행이 정지되었습니다 라는 에러문구가 나오면 ``` {r pressure, echo = F} ~~~ ``` 이렇게 한번 했으면 ``` {r pressure2, echo = F} ~~~ ``` 이렇게 pressure에다가 두 번째라는 것을 나타내주어야 합니다 --- title: "21-07-20" output: html_document --- ```.. 2021. 8. 2.
빅데이터 분석 ; LDA(선형판별분석) QDA(2차판별분석) data는 kaggle에 있는 고객데이터 사용하였습니다. customer id ; 연속형 (고객아이디) Gender : 이산형(성별) Age : 여기서는 연속형으로 사용 (나이) Annual Income : 연속형(소득) Spending Score ; 연속형 (소비점수) 탐색 data 2021. 7. 20.
빅데이터 분석 ; 연관성 분석(2) ; kaggle 데이터에 적용 kggle에 있는 공개 데이터에 적용시켜보기 data 2021. 7. 19.
빅데이터 분석하기 ; 데이터 탐색하기 kaggle에 있는 데이터 "supermarket" 데이터를 이용. 17개의 열과 1000개의 행으로 이루어진 데이터이다. csv 파일을 첫 행이 보일 수 있도록 불러온 후, 먼저 데이터의 구조부터 살펴보았다. table 함수를 통해 질적변수의 개수를 알아보았다. barplot(table(Branch), col = c("red", "blue", "green"), ylim = c(0, 400)) Branch 변수를 간단하게 그림으로 알아보려 했는데, y 축의 길이가 너무 커서 0, 400까지 범위를 줬고 색을 빨-파-초 순서대로 줘봤다. barplot(table(Payment), col = c("red", "blue", "green"), ylim = c(0, 400)) Branch 변수를 간단하게 그림으로.. 2021. 7. 16.

추천 글

728x90
반응형