728x90
반응형

데이터마이닝4

MySQL 공부하기(Feat. Workbench) 안녕하세요. 업무 상 필요해서 데이터베이스 관련 공부를 해보고 있습니다. DBMS란, 데이터베이스를 관리하는 시스템으로써, 여러 응용 시스템들의 통합된 정보를 저장하여 운영할 수 있는 공용 데이터들의 묶음입니다. 그 중 RDBMS란, 관계형 데이터베이스 관리 시스템으로 불리는데 가장 많이 사용되는 종류입니다. 역사가 오래되며 가장 신뢰성이 높으며 탐색 속도가 빠릅니다. 이 RDBMS는 테이블 형태로 되어 있으며 속성과 데이터 값으로 구조화되어 있습니다. Primary Key(기본키) : 한 테이블의 각 행을 유일하게 식별해주는 컬럼으로, 각 테이블마다 Primary Key가 존재해야 하며, NULL 값을 허용하지 않고, 각 행마다 유일한 값이어야 함. Foreign Key : 한 테이블의 필드 중 다른테.. 2023. 11. 19.
data mining, maximal margin classifier + support vector classifier + support vector machine in R - Maximal margin classifier (최대 마진 분류기): linear boundary로 class 구별 (에러 없음) - Support vector classifier (서포트 벡터 분류기): linear boundary & soft margin classifier (에러 포함) - Support vector machines (서포트 벡터 머신): non-linear class boundaries Maximal margin classifier (최대 마진 분류기) - Separating Hyperplane (분리 초평면) •Suppose a hyperplane that separates .. 2021. 12. 16.
data mining, random forest + boosting in R - Bagging에서와 같이 bootstrapped training sample에서 여러 개의 decision tree를 만듦 - Tree에서 분할이 고려될 때마다 p개의 predictors의 full set에서 m개의 predictors로 구성된 random sample만 선택하여 이들 중에서 한 개가 선택되도록 함 - 보통 m≈√p을 사용 - Random forest는 bagging방법에서 variance를 더 줄임으로써 test error를 줄임.. Why? • 하나의 very strong predictor와 여러 개의 moderately strong predictors가 있다고 가정하면 대부분의 tree에서는 top split에 very strong predicto.. 2021. 12. 15.
Data Mining , Classification tree + Regression tree + Bagging Bagging (배깅) - 배깅의 목적은 분산 감소 - generate B different bootstrapped training data sets using random sampling with replacement from Z data set: - compute f ̂_1^∗ (x), f ̂_2^∗ (x),…, f ̂_B^∗ (x) by training the method on B different training sets - finally average all the predictions - Regression tree에 bagging을 적용하기 위해서는 B개의 bootstrapped training sets을 사용하여 B개의 regres.. 2021. 12. 14.

추천 글

728x90
반응형