Data Analysis

Data Analysis

Hypothesis Test란?

가설 검정 모집단에 대해 가설이 통계적으로 유의한지 표본을 통해 알아보는 것 질문에 대한 2개의 대립되는 가설을 세우고, 수집한 데이터를 통해 참 or 거짓 판단 귀무가설 (Null Hypothesis) (H0) 데이터를 수집하기 전, 사실이라고 믿는 가설 ex) 변화가 없다 (기존의 상태), 차이가 없다, 다르지 않다, 음성이다 등등 수학적으로 = 기호 포함 대립가설 (Alternative Hypothesis) 우리가 사실이라고 증명하고 하는 가설 귀무가설과 대립 (귀무 가설과 겹치지 않는다) ex) 변화가 있다, 차이가 있다, 다르다, 양성이다 등등 수학적으로 = 기호 포함 X 1종 오류(Type I Error) vs 2종 오류(Type II Error) Type I Error 귀무가설 참 → 잘못 ..

Data Analysis

데이터 분석가의 역할 (Data Analyst)

데이터 시대, 데이터 분석가의 역할 (Data analyst) 누구나 적은 비용으로 데이터를 분석할 수 있는 시대입니다. 최근 몇 년간 데이터 저장 및 처리 비용이 엄청나게 낮아지면서 생성되는 데이터의 종류, 양이 무척이나 다양해졌습니다. 금융 생산관리 마케팅 등의 산업 분야를 시작으로 데이터 분석의 효용성과 가치는 점차 확대되고 있고, 많은 기업들이 유사한 서비스 제품 기술을 이용해 경쟁함에 따라 데이터 분석을 통한 혁신과 가치창출은 중요한 경쟁력이 되었습니다. 데이터 분석가란? 데이터 분석가는 조직이 더 나은 비지니스 의사결정을 할 수 있도록 데이터를 사용해 돕는 역할을 합니다. 수많은 데이터를 정리하고, 유용한 정보를 추출하고 데이터 분석에 기초하여 결정을 내려서 인사이트를 도출해 전달합니다. 데이..

Data Analysis

EDA의 개념과 데이터 분석

EDA (Exploratory Data Analysis)란? - 탐색적 데이터 분석 - 벨연구소의 수학자 '존튜키' 가 개발한 데이터 분석 과정에 대한 개념으로, 데이터를 분석하고 결과를 내는 과정에 있어서 지속적으로 해당 데이터에 대한 '탐색과 이해'를 기본으로 가져야 한다는 것을 의미 실무에 있어 새로운 프로젝트에 들어갈 때 가장 중요하게 생각하는 것이 '왜? (Why?)' 라고 생각한다. 그래야 기획단계부터 사로 이해가 잘 되고, 피드백을 하며 소통하여 결과의 질을 높게 향상시킬 수 있다. 처음 로우데이터(Row-Data)를 접할 때부터 이 데이터를 잘 이해하고 파악한 다음, 어떤 결과를 만들어낼지 'feature(col)'로 필터해보고, 다른 feature로 해본 후 데이터를 여러 측면으로 쪼개고..

Balang
'Data Analysis' 카테고리의 글 목록