728x90
반응형

r4

[4일차] Do it! 쉽게 배우는 R 데이터 분석 / 180P~ 218P / 실제 데이터 분석하기 ! # 그래프만들기 산점도란. x축과 y축에 점으로 표현한 그래프를 산점도라고 합니다. 산점도는 나이와 소득처럼 연속 값으로 된 두 변수의 관계를 표현할 때 사용됩니다. ggplot2 레이어 구조 이해 > ggplot2 문법은 레이어 구조로 되어 있습니다. 배경을 만들고, 그 위에 그래프 형태를 그리고, 마지막으로 축 범위, 색, 표식 등 설정을 추가하는 순서로 그래프를 만듭니다. # 그래프 만들기 library(ggplot2) # ggplot2 레이어 구조 이해 # 배경 설정 # x축은 displ, y축은 hwy로 지정해 배경 생성 ggplot(data =mpg, aes(x = displ, y= hwy)) # 배경에 산점도 추가 ggplot(data = mpg, aes(x = displ, y= hwy)) .. 2022. 5. 10.
[1일차] Do it! 쉽게 배우는 R 데이터 분석 / 1~98p / 둘째 마당, 데이터 갖고 놀기, 데이터 프레임의 세계로 R은 어디에 쓸 수 있을까 1) 머신러닝 모델링 2) 텍스트 마이닝 3) 소셜 네트워크 분석 4) 지도 시각화 5) 주식 분석 6) 이미지 분석 7) 사운드 분석 working directory 설정방법 Session > Set working directory > choose directory working directory를 원하는 장소로 설정하셔야 나중에 파일을 찾아서 사용하기가 쉬워요 ! var1 2022. 5. 4.
data mining, random forest + boosting in R - Bagging에서와 같이 bootstrapped training sample에서 여러 개의 decision tree를 만듦 - Tree에서 분할이 고려될 때마다 p개의 predictors의 full set에서 m개의 predictors로 구성된 random sample만 선택하여 이들 중에서 한 개가 선택되도록 함 - 보통 m≈√p을 사용 - Random forest는 bagging방법에서 variance를 더 줄임으로써 test error를 줄임.. Why? • 하나의 very strong predictor와 여러 개의 moderately strong predictors가 있다고 가정하면 대부분의 tree에서는 top split에 very strong predicto.. 2021. 12. 15.
빅데이터 ; R markdown 실습하기 R markdown을 처음 써봤습니다. R markdown을 사용하여 특정 데이터셋에 대해 빈도수를 구하고 이를 그림으로 나타내기 최종 pdf로 추출하는 과정까지 실습한 내용입니다. barplot(table(crime$Category)) Calls: ... process_file -> split_file -> lapply -> FUN -> parse_block 실행이 정지되었습니다 라는 에러문구가 나오면 ``` {r pressure, echo = F} ~~~ ``` 이렇게 한번 했으면 ``` {r pressure2, echo = F} ~~~ ``` 이렇게 pressure에다가 두 번째라는 것을 나타내주어야 합니다 --- title: "21-07-20" output: html_document --- ```.. 2021. 8. 2.

추천 글

728x90
반응형