본문 바로가기
728x90
반응형

빅데이터분석기사3

빅데이터분석 필기[2과목] 빅데이터 탐색 3.통계기법의 이해 3.통계기법의 이해 * 기술통계 - 데이터 분석을 목적으로 수집된 데이터를 확률 통계적으로 정리·요약하는 기초적인 통계 기술통계 목적: 분석 초기 단계에 데이터 분포의 특징을 파악하고자 함 기술통계 방법 통계적 수치 계산: 평균 / 분산 / 표준편차 그래프 활용: 막대 그래프 / 파이 그래프 데이터에 대한 전반적인 이해를 도움 * 중심경향 통계량 - 평균(Mean): (자료를 모두 더한 값) / (자료 개수) 모든자료에 같은 가중치를 부여/ 이상값에 민감 모평균: 조사하는 모집단의 평균 표본평균: 모집단의 일부분인 표본(Sample)의 평균 - 중위수(Median): 오름차순 정렬 → 중앙에 위치한 데이터 값 특이값 , 이상값에 영향을 받지 않음 -최빈값(Mode): 데이터 값중에 빈도수가 가장 높은 데.. 2023. 3. 20.
빅데이터분석필기 [1과목] 빅데이터 분석 기획 - 2.데이터 분석 계획 1.2 데이터 분석 계획 * 분석 : 잠재원인을 파악하고 , 데이터를 수집및 분석하는 활동 * 과제 : 처리해야될 문제 * 문제 : 기대 상태(목표)와 현재 상태(현상)를 동일한 수준으로 맞추는 과정 * 상향식 접근방식과 하향식 접근방식을 반복적으로 수행하면서 상호 보완하며 분석문제를 발굴한다. * 파일럿 (Pilot) - 이미검증된 기술을 가지고 본 프로젝트를 본격적으로 진행하기 위해 시험운영을 통해 효과를 미리 검토하고 문제점 여부를 점검하는 소규모 프로젝트 * 하향식 접근방식(Top Down Approach) - 문제가 정의되어있고 해결방법을 찾기위해 단계적 업무를 수행함 절차: 문제 탐색 → 문제 정의 → 해결방안 탐색 → 타당성 검토 → 선택 문제 탐색: 비즈니스 모델기반 문제 탐색,분석기회 발.. 2023. 3. 13.
빅데이터분석필기[1과목 ]빅데이터 분석 기획 - 1.빅데이터 이해 1.1. 빅데이터 이해 * 데이터의 정의 - 데이터란 이론을 세우는데 기초가 되는 자료 혹은 컴퓨터가 처리 할수있는 문자, 소리, 숫자 그림 등의 형태로 되어 있는 자료를 뜻함. 만약 데이터가 의미를 담고 있으면 정보라고 부르고 의미를 담고 있지 않으면 자료로 본다. * 데이터의 유형 1. 정량적 데이터 (정형데이터) - 수치로 표현될수 있는 데이터 , ex> 영화평점, 시험성적, 2. 정성적 데이터 (비정형데이터) - 수치로 표현이 될수 없는 데이터 ex> 영화 감상평 3. 반정형 데이터 - 데이터 구조정보(메타데이터)를 함께 제공하는 형식 구조적 관점의 빅데이터 유형: 정형/ 반정형/ 비정형 정형 데이터 반정형 데이터 비정형 데이터 스키마구조 O 고정필드 O 스키마구조 O 메타데이터 O 고정필드 X .. 2023. 3. 13.
728x90
반응형