본문 바로가기
728x90
반응형

IT39

오라클 VirtualBox 버추얼박스 설치 및 다운로드 도커나 쿠버네티스 공부를 위해 VirtualBox 를 설치해보자 1.사이트 www.virtualbox.org/ Oracle VM VirtualBox Welcome to VirtualBox.org! News Flash New April 19th, 2022VirtualBox 6.1.34 released! Oracle today released a 6.1 maintenance release which improves stability and fixes regressions. See the Changelog for details. Important February 24th, 2022We're hiring! www.virtualbox.org 2. 사이트접속후 다운로드하기 3. usb 사용을위한 확장팩 과 운영체제.. 2022. 5. 19.
AWS 인스턴스등록 EC2 도커이미지 실행 인스턴스생성 UI 가 변경되어서 다시 정리 !! 1. 일단 로그인 2. Region 설정 - 우측상단 (처음부터 서울로 잡힌경우도 있고 아닌경우도 있다) 3. EC2 검색하자 4. 인스턴스시작 클릭 여기까지하고 PUTTY 연결동일하다 기존 EC2 설정참고(탄력적ip연결 등 ) , 키보관잘하기! 서버port 등록! https://unicorn-rejoice.tistory.com/entry/AWS%EB%B0%B0%ED%8F%AC%ED%95%98%EA%B8%B0-PuTTY-%EC%97%B0%EA%B2%B0?category=934320 AWS배포하기 - 인스턴스서버 PuTTY 연결 (ubuntu EC2 ) 우선 PuTTY 다운로드 받고 시작 !! https://unicorn-rejoice.tistory.com/.. 2022. 5. 16.
머신러닝 데이터 전처리(Preprocessing) 데이터전처리 1) 결손값 처리 (Null/ NaN 처리) 1.데이터가 충분한 경우 - 값이 누락된 데이터를 제거함 2. 데이터가 제한적일 경우 - 누락된 값을 추정해서 채움 2)데이터 인코딩(레이블, 원-핫 인코딩) 머신러닝알고리즘은 문자열 데이터 속성을 입력값으로 받지않기 때문에 문자형이 아닌 숫자형으로 표현 되어야한다. 레이블인코딩 - 남, 여 → 1, 0 , 숫자값이기 때문에 의도하지 않아도 1이 더크다는 의미로 영향을 받는 알고리즘이 있을수있다. 따라서 회귀에는 적용하지말고 tree 계열 ML 알고리즘은 적용가능 , 이러한 문제점을 해결하기위해 나온것이 원핫 인코딩이다. 사이킷런의 LabelEncoder 클래스 , fit() 과 transform() 을 이용하여 변환 원핫(One-hot) 인코딩 .. 2022. 5. 6.
머신러닝 교차검증(feat.싸이킷런) 교차검증 교차검증을 하는 이유 - 과적합에 따른 성능저하 개선 과적합 이란? 모델이 학습데이터에만 과도하게 최적화 되어 실제 예측을 다른 데이터로 수행할경우 예측성능이 과도하게 떨어지는것, 고정된 학습/테스트 데이터로 평가를 하다보면 테스트 데이터에만 최적을 성능을 발휘하도록 평향된 모델을 유도 하는 경우가 생기고 결국 테스트 데이터에만 과적합 되는 학습 모델이 만들어져 다른 테스트 데이터가 들어오는 경우 성능이 저하 동일한 학습 데이터로 학습된 아래 3개의 모델을 비교해 보면? A. 모델 2가 실제와 가장 유사한 모델이라고 하였을 때, 모델 1은 너무 단순화되어 있고, 모델 3은 복잡성이 너무 높음 학습데이터를 다시 분할하여 학습 데이터와 학습된 모델의 성능을 일차 평가하는 검증 데이터로 나눔. 검증데.. 2022. 4. 19.
728x90
반응형