2022(31)
-
[데이터 시각화] 시각화 기본
서울여자대학교 김예리 교수님의 데이터 시각화 수업을 듣고 정리한 글입니다. ❓시각화 활용 예시 EDA A/B Testing : Conversion Rate Cohort Analysis : User Retention 정기적인 모니터링을 위한 시각화 조직 내 커뮤니케이션을 위한 보고서형 스토리텔링 시각화 🔔 시각화 팁 데이터 잉크의 비율을 높여라 단, 표현하고자 하는 데이터 외의 불필요한 장식은 없애 심플하게 만들어라 시각적 속성을 활용해라 미묘한 차이도 정확하게 비교할 수 있도록 해라 위치 > 길이 > 방향 > 각도 > 면적 > 부피 > 채도 막대차트와 같이 길이를 표현한 차트의 경우 미묘한 길이도 판별할 수 있어 일반적으로 많이 사용됨 파이차트와 영역차트는 각각 각도와 면적을 나타내는데, 인간의 눈으로 ..
2022.10.24 -
[GUI] 13주차, 요인분석과 군집분석
서울여대 김예리 교수님의 'GUI를 활용한 데이터사이언스' 수업을 듣고 작성한 복습용 글입니다. 교재: 마케팅조사원론 요인분석 다수의 변수들을 유사한 성격을 가진 항목들끼리 묶어 적은 수의 요인으로 축약시키는 것 변수간의 상관관계를 고려해 유사한 변수끼리 묶어줌 수집된 자료에 유사한 성격의 변수들이 많이 포함되어있는 경우 변수에 포함되어 있는 정보의 손실을 최소화 하며 소수의 요인으로 축약함 요인분석 조건 계량형 척도(등간척도 또는 비율척도로 측정된 변수) 정규분포를 따라야 함 관찰치는 상호독립적이어야 하며, 분산이 같아야 함 표본수는 최소 50이상, 100이상이 바람직함 요인분석 이용 목적 자료의 요약: 여러개의 변수들을 몇개의 공통된 집단으로 묶음으로써 자료의 복잡성을 줄이고 정보를 요약하는데 이용 ..
2022.06.20 -
[GUI] 12주차, 상관관계와 회귀분석
서울여대 김예리 교수님의 'GUI를 활용한 데이터사이언스' 수업을 듣고 작성한 복습용 글입니다. 교재: 마케팅조사원론 상관관계와 상관계수 상관계수 등간 또는 비율척도로 측정된 두 변수간의 연관 정도 한 변수의 증감에 따른 다른 변수의 변화를 보여주는 지표 선형의 정도 측정 지표 -1~1의 값을 가짐 0: 완전 독립 0.4 이상: 높은 상관관계 0.7 이상: 매우 높은 상관관계 1: 완전 상관 피어슨 상관계수 → 모수적 상관계수 두 변수 모두 등간척도 혹은 비율척도로 측정된 경우, 두 변수간의 선형적 상관관계 측정에 사용 상관계수 값: -1~1 스피어만 상관계수 → 비모수적 상관계수 두 변수가 서열척도로 측정되거나 두 연속형 변수 분포가 정규분포를 심하게 벗어난 경우에 사용 회귀분석 상관계수의 한계점 변수..
2022.06.20 -
[GUI] 11주차, 두 집단간 평균차이에 대한 가설 검증 및 분산분석, 카이제곱 검증
서울여대 김예리 교수님의 'GUI를 활용한 데이터사이언스' 수업을 듣고 작성한 복습용 글입니다. 교재: 마케팅조사원론 두 집단간의 평균차이에 대한 가설 검증 독립적 두 집단의 평균차이를 검증하는 경우 서로 배타적이고 독립적인 두 집단간에 평균에서 차이가 있는지를 검증 검증 통계량 독립 t테스트, t통계량 이용 독립 t테스트는 서로 독립인 두 집단간 차이를 검증할 때 사용함 두 집단이 서로 독립이라는 것은 한 집단의 측정이 다른 집단의 측정에 영향을 미치지 않는 것임 독립 t검정은 두 집단이 상호독립적임을 가정하는 경우 두 집단의 평균차이를 검정함 두 집단의 분산이 동일하다고 가정하면 t통계량은 자유도가 n1 + n2 - 2인 t분포를 따름 t분포는 표본수가 증가하면 정규분포에 접근, 표본수 30 이상이면..
2022.06.20 -
[GUI] 10주차, 가설과 가설 검증
서울여대 김예리 교수님의 'GUI를 활용한 데이터사이언스' 수업을 듣고 작성한 복습용 글입니다. 교재: 마케팅조사원론 가설의 의미와 종류 가설의 통계적 검증 필요성 통계적 검증이 부재한 가설 기반 의사결정 → 실패확률이 높으며 기업 경영성과에 부정적 결과 초래 가설적 주장 관련 자료수집, 통계적 검증 후 최종 의사결정을 하는 경우 실패확률 낮아짐 가설: 어떤 현상에 대한 연구자의 추측의 서술로 증명되지 않은 연구자의 주장을 문장으로 표현한 것 귀무가설 대립가설 조사자의 주장인 대립가설과 반대되는 진술 조사자가 제기하는 주장 조사자가 부정하고 싶은 가설 수집자료에 의해 사실로 입증되기 원하는 진술 조사자의 주장을 세우고 반대 주장을 귀무가설로 설정, 귀무가설이 참이라고 가정 후 귀무가설이 참이 아님을 입증..
2022.06.20 -
[사회과학] 13주차, CLT와 마케팅믹스
서울여대 데이터사이언스학과 김예리 교수님의 '데이터사이언스를 위한 사회과학이론' 과목을 수강 후 복습용으로 작성한 글입니다. CLT(Construal Level Theory) : 해석수준이론, 해석수준은 공간적 거리, 사회적 거리, 확률적 거리, 시간적 거리 총 네개의 심리적 거리가 있으며, 이는 사고의 프레임을 완전히 바꾸어 놓기 때문에 사람의 의사결정에 있어 큰 차이를 도출함 사고방식의 변화 - Liberman, Trope (1998) 사람들에게 먼 미래(1년후)와 가까운 미래(내일)를 나눠 과학소설읽기, 새 아파트로 이사 등의 7가지 시나리오를 보여주고 어떤 생각이 들었는지 자유롭게 작성하게 함, 사람들이 먼 미래 조건에서 추상적, 상위개념 서술을 많이 하고, 가까운 미래 조건에서는 구체적, 하위 ..
2022.06.14 -
[사회과학] 12주차, 휴리스틱
서울여대 데이터사이언스학과 김예리 교수님의 '데이터사이언스를 위한 사회과학이론' 과목을 수강 후 복습용으로 작성한 글입니다. 휴리스틱: 비합리적 선택 의사결정을 할 때, 휴리스틱은 직관적 지름길이라고 생각할 수 있음 결정 휴리스틱 대안의 선택 과정에서 고려해야 하는 수많은 요인들을 신중히 고려하지 않고, 경험과 직관적 사고에 의하여 의사결정 과정을 단순화시키는 규칙이나 지침 제품단서(신호)에 의한 휴리스틱 제품의 가시적인 측면(외관)을 통해 내재된 제품의 질을 추측하는 것 시장에서 통용되는 가격에 의한 휴리스틱 초보소비자는 가격을 유일한 제품 관련 속성으로 인식, 능숙한 소비자는 가격에 따라 품질의 차이가 큰 제품에서는 가격을 중요한 속성으로 인식 브랜드 의존적 선택 상표 인식 효과: 친숙하고 유명한 상..
2022.06.14 -
[사회과학] 11주차, 성격과 소비자 행동
서울여대 데이터사이언스학과 김예리 교수님의 '데이터사이언스를 위한 사회과학이론' 과목을 수강 후 복습용으로 작성한 글입니다. 자기개념 self-concept, William James 개인이 자신에 대해 가지고있는 생각과 인식의 총체 자기에 대한 인식은 영아때는 없지만 2세 무렵 인간은 자신의 존재에 대해 인식하기 시작 자기 개념의 구조는 매우 복잡하지만, 크게 3개의 측면으로 나누어짐 물질적 자기: 신체를 포함한 외형적 측면들, 가족, 직장, 소유물 등 정신적 자기: 자신의 생각, 의식, 감정, 영성 등 사회적 자기: 사회적 관계에서의 자신에 대한 인식 사람은 누구나 자기 자신의 자기 개념과 일치되게 행동하려는 욕구가 있기 때문에 자신에 대한 지각이 성격의 기본을 형성 → 심리적 균형과 편안함을 느끼며..
2022.06.14 -
[사회과학] 10주차, STP 전략
서울여대 데이터사이언스학과 김예리 교수님의 '데이터사이언스를 위한 사회과학이론' 과목을 수강 후 복습용으로 작성한 글입니다. 마케팅 과정 시장조사 3C 분석, 고객분석, 자사분석, 경쟁분석 거시적 환경분석(PEST, Political Economic Social Technological) SWOT 분석 (Strengths, Weaknesses, Opportunities, Threats) STP 전략 시장 세분화 (Segmentation) 타겟목표시장 (Targeting) 포지셔닝 (Positioning) 마케팅 믹스 4P 분석 (Product, Place, Promotion, Price) 5 Froces (시장 진입장벽, 대체상품, 공급자의 교섭력, 구매자의 교섭력, 경쟁자 수) 실행 Implementa..
2022.06.14 -
[사회과학] 9주차, 디지털 과학으로 본 소통의 문제
서울여대 데이터사이언스학과 김예리 교수님의 '데이터사이언스를 위한 사회과학이론' 과목을 수강 후 복습용으로 작성한 글입니다. 디지털 사회과학으로 본 소통의 문제 댓글 뉴스에 댓글을 남기며 자신의 의견을 실시간으로 표현할 수 있음 댓글을 통해 뉴스를 보완하거나 수정하고 비판과 재해석을 함 댓글은 한국 사회에서 시민참여를 활성화 하는 통로임 댓글은 구전 커뮤니케이션 중 하나 기사수보다 댓글 수가 더 많음 → 뉴스나 사설보다 댓글이나 공감 수에 더 영향을 받는 것은 아닌지? In group, Out group 자신과 다른 생각을 가진 집단을 Out Group이라고 함 외집단을 겨냥해 공격적인 댓글을 남기기도 함 댓글의 특성 상호작용: 반응과 재반응으로 구성됨, 일방적이지 않음 자발성: 댓글을 쓰는 행위는 자발..
2022.06.14