본문 바로가기
728x90
반응형

빅데이터분석필기2

빅데이터분석 필기[2과목] 빅데이터 탐색 3.통계기법의 이해 3.통계기법의 이해 * 기술통계 - 데이터 분석을 목적으로 수집된 데이터를 확률 통계적으로 정리·요약하는 기초적인 통계 기술통계 목적: 분석 초기 단계에 데이터 분포의 특징을 파악하고자 함 기술통계 방법 통계적 수치 계산: 평균 / 분산 / 표준편차 그래프 활용: 막대 그래프 / 파이 그래프 데이터에 대한 전반적인 이해를 도움 * 중심경향 통계량 - 평균(Mean): (자료를 모두 더한 값) / (자료 개수) 모든자료에 같은 가중치를 부여/ 이상값에 민감 모평균: 조사하는 모집단의 평균 표본평균: 모집단의 일부분인 표본(Sample)의 평균 - 중위수(Median): 오름차순 정렬 → 중앙에 위치한 데이터 값 특이값 , 이상값에 영향을 받지 않음 -최빈값(Mode): 데이터 값중에 빈도수가 가장 높은 데.. 2023. 3. 20.
빅데이터분석필기[1과목 ]빅데이터 분석 기획 - 1.빅데이터 이해 1.1. 빅데이터 이해 * 데이터의 정의 - 데이터란 이론을 세우는데 기초가 되는 자료 혹은 컴퓨터가 처리 할수있는 문자, 소리, 숫자 그림 등의 형태로 되어 있는 자료를 뜻함. 만약 데이터가 의미를 담고 있으면 정보라고 부르고 의미를 담고 있지 않으면 자료로 본다. * 데이터의 유형 1. 정량적 데이터 (정형데이터) - 수치로 표현될수 있는 데이터 , ex> 영화평점, 시험성적, 2. 정성적 데이터 (비정형데이터) - 수치로 표현이 될수 없는 데이터 ex> 영화 감상평 3. 반정형 데이터 - 데이터 구조정보(메타데이터)를 함께 제공하는 형식 구조적 관점의 빅데이터 유형: 정형/ 반정형/ 비정형 정형 데이터 반정형 데이터 비정형 데이터 스키마구조 O 고정필드 O 스키마구조 O 메타데이터 O 고정필드 X .. 2023. 3. 13.
728x90
반응형