8000 GitHub - sunkusun9/DS_lv3_2505_1
[go: up one dir, main page]
More Web Proxy on the site http://driver.im/
Skip to content

sunkusun9/DS_lv3_2505_1

Repository files navigation

DS_lv3_2505_1

DS lv3 2505_1 강의를 위한 git 입니다.

실습 내용

Day1 Day2 Day3
주제 최대수요전력 예측 스프링 내구력 테스트 통과/실패 예측 세탁 지수 예측
출제
영역
데이터 전처리
> Join, 표준화, 일자(date) 형식 처리, shifting
데이터 추출
> GroupBy, …
가설 검정
> Shapiro-Wilks, Bartlett, T,
일원분산분석, Mann-Whitney U
이원분산분석
지도학습
> 결정트리, GBDT, SVM
비지도학습
> PCA, DBSCAN
이상치 탐색
> Isolation Forest, Local Outlier Factor
결측치 처리
> 반복적 결측치 처리
가설 검정
> 베르눌리 분포, 정규 분포
속성 선택
> 필터법, 전진선택법
가설 검정
> Jarque-bera, Bartlett, 일원분산분석
지도학습
> 로지스틱 회귀, 랜덤 포레스트, LDA
비지도학습
> PCA
하이퍼 파라미터 최적화
> 그리드 서치
데이터 전처리
> 치환, 문자열 결합, 표준화, 구간범주화, 가변수화
가설 검정
> Kolmogolov-Smironov, Bartlett, 일원분산분석
확률 통계
> 정규분포
지도학습
> Linear Regression, xgboost
비지도학습
> Agglomerative Clustering, PCA
하이퍼 파라미터 최적화

강의 내용

  1. 데이터 처리 기법을 문제 풀이와 Tip을 통해 학습합니다.

  2. 통계 분석과 머신 러닝 관련 요건을 분석하고 구현하는 방법을 학습합니다.

  3. Level3에서 추가 된 Kaggle형 문제 유형을 풀기 위한 방법을 학습합니다.

  4. 궁극적으로 데이터 분석과 머신 러닝에 대한 경험치 보다 효과적으로 얻는 방법을 목표로 합니다.

강의: 80% / 실습: 20%

Level 3는 Level 2에 비해 난이도가 급격히 상승합니다. 이에 대응하기 위한 상당히 많은 기법을 알려 드리기 위해 강의 위주로 수업이 구성 되었습니다.

강의 진행 방식

  1. Live Coding 70%

  2. 실습 코드는 강의 git을 통해 시간마다 공유 됩니다.

  3. 코드에 대한 설명은 매일 강의가 끝나고 1~2시간 정도의 정리 작업 후 git에 업로드합니다.

  4. 강의 종료 후 30 ~ 40분 정도 Knox 미팅룸에 남아 있을 예정입니다. 개인별 질의는 이 시간에 부탁드립니다. (많은 질문 부탁드립니다.)

강의 시간표

구분 강의 내용 시작
0 리뷰 9시 00분 9시 50분
1 전처리 10시 00분 10시 50분
2 문제 1 11시 00분 12시 00분
점심시간 - 12시 00분 13시 00분
3 문제 2 13시 00분 13시 50분
4 문제 3 14시 00분 14시 50분
5 문제 4 15시 00분 15시 50분
6 문제 5 16시 00분 16시 50분
7 문제 6 17시 00분 18시 00분

※ 점심시간 이외에는 강의 흐름에 따라 가변적으로 진행될 수 있습니다.

시험장 환경을 가상 환경으로 구축

PC에 있는 Python 환경을 유지하면서, 시험장 환경의 Python환경을 별도로 구축하는 방법입니다.

OS: Windows 10 (Windows 11도 가능하지만 결과에 차이가 있을 수 있습니다.)

  1. 패키지 압축 파일을 다운로드 받습니다. C:\패키지 에 압축을 풉니다.

    (C:\패키지에 위치할 필요는 없지만, 이후 설명은 C:\패키지 를 기준으로 합니다.)

  2. 패키지에 안에 있는 시험장 환경의 python(3.7.4 version) 설치 파일 python-3.7.4-amd64.exe을 실행시킵니다.

  3. Python 설치 경로를 C:\python37로 합니다. (마찬가지로 따를 필요는 없지만, 설명은 C:\python37 를 기준으로 합니다.)

  4. Python 가상 환경 구축

  • 명령프롬프트를 실행시킵니다.(Windows 실행 → cmd.exe)

  • 설치된 버젼의 python 실행 파일을 사용하여 python37이란 이름으로 가상환경을 만듭니다.

    C:\python37\python -m venv python37
  • 성공하면 python37 경로가 생깁니다.
  1. 패키지 설치
    python37\Scripts\activate
    cd c:\패키지
    pip install --upgrade --no-index --find-links . pip
    pip install --no-index --find-links . -r requirements.txt

가상 환경 전환

  • 일단 가상환경이 구축이 되면, 이후에는 활성화를 통해 환경 전환이 가능합니다.
    python37\Scripts\activate 

가상 환경 해제

  • 가상환경 이전의 환경으로 돌아옵니다.
    deactivate

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published
0