728x90
반응형

R 데이터분석5

[4일차] Do it! 쉽게 배우는 R 데이터 분석 / 180P~ 218P / 실제 데이터 분석하기 ! # 그래프만들기 산점도란. x축과 y축에 점으로 표현한 그래프를 산점도라고 합니다. 산점도는 나이와 소득처럼 연속 값으로 된 두 변수의 관계를 표현할 때 사용됩니다. ggplot2 레이어 구조 이해 > ggplot2 문법은 레이어 구조로 되어 있습니다. 배경을 만들고, 그 위에 그래프 형태를 그리고, 마지막으로 축 범위, 색, 표식 등 설정을 추가하는 순서로 그래프를 만듭니다. # 그래프 만들기 library(ggplot2) # ggplot2 레이어 구조 이해 # 배경 설정 # x축은 displ, y축은 hwy로 지정해 배경 생성 ggplot(data =mpg, aes(x = displ, y= hwy)) # 배경에 산점도 추가 ggplot(data = mpg, aes(x = displ, y= hwy)) .. 2022. 5. 10.
[3일차] Do it! 쉽게 배우는 R 데이터 분석 / 145P~ 179P / 자유자재로 데이터 가공하기 / 결측, 이상치 정제 남은 부분인 summarise, group_by, left_join 부분 완료. 추가적으로 dplyr 안에 있는 함수들로 연결해서데이터 분석해보기. # 2022.05.07 data % summarise(mean_math = mean(math)) data %>% group_by(class) %>% summarise(mean_math = mean(math)) # group_by를 통해 반별로 집단을 나누고, n 을 통해 각 반 별로 몇 명이 있는지 알 수 있다. data %>% group_by(class) %>% summarise(mean_math = mean(math), sum_math = sum(math), median_math = median(math), n = n().. 2022. 5. 7.
[2일차] Do it! 쉽게 배우는 R 데이터 분석 / 98P~ 144P / 자유자재로 데이터 가공하기 head() : 데이터 앞 부분 출력 tail() : 데이터 뒷 부분 출력 View() : 뷰어 창에서 데이터 확인 dim() : 데이터 차원 출력 str() : 데이터 속성 출력 summary() : 요약 통계량 출력 summary() 함수의 출력값 Min 1st Qu Median Mean 3rd Qu Max as.data.frame 은 데이터 속성을 데이터 프레임 형태로 바꾸는 함수. 어떤 데이터를 분석하든, 가장 먼저 data.frame, dim, summary 등의 함수를 활용하여 각 변수들의 전반적인 특징을 먼저 파악하는 것이 중요합니다. dplyr 패키지 filter() : 행 추출 select() : 열 추출 arrange() : 정렬 mutate() : 변수 추가 summarise() : .. 2022. 5. 5.
data mining, maximal margin classifier + support vector classifier + support vector machine in R - Maximal margin classifier (최대 마진 분류기): linear boundary로 class 구별 (에러 없음) - Support vector classifier (서포트 벡터 분류기): linear boundary & soft margin classifier (에러 포함) - Support vector machines (서포트 벡터 머신): non-linear class boundaries Maximal margin classifier (최대 마진 분류기) - Separating Hyperplane (분리 초평면) •Suppose a hyperplane that separates .. 2021. 12. 16.
빅데이터 분석 ; 신경망 알고리즘 ; 뉴런 데이터 불러오기 data 2021. 7. 22.

추천 글

728x90
반응형