통계학(4)
-
4차시 공부: 기술통계 기초
Chapter 4. 기술통계 기초 이 챕터에서는 데이터를 분류, 정리, 요약하는 방법에 대해 나와있다. 데이터는 정량적인 데이터와 정량적이지 않은 데이터로 분류된다. 정량적이지 않은 데이터 정량적이지 않은 데이터는 *수치로 표현하기 어려운 경우로 주로 카테고리형 변수로 나타낸다. 예를 들어 호수의 물고기 데이터를 분석할 때 정확한 마릿수는 알기 어렵지만 어떤 종류가 있는지는 알아낼 수 있다. 그래서 수치형 변수로 나타내지 않고 송사리, 잉어 등과 같이 카테고리형 변수로 나타낸다. *수치로 표현하기 어려운 경우는 필자가 추측한것이므로 정확하지 않을 수 있음. 위의 호수의 예를 통해 좀더 자세히 카테고리형 변수에 대해 알아보자. 호수 안에 물고기를 종류별로 분류한 것은 카테고리를 나눈 것이..
2021.07.01 -
3차시 공부: 표본을 얻는 과정의 추상화
Chapter 3. 표본을 얻는 과정의 추상화 샘플링 과정을 추상화하여 수학적으로 다루기 쉽게 한다. 여기서 추상화를 한다는 것은 복잡한 자료로부터 핵심적인 개념이나 기능만 간추리는 것을 이야기한다. 확률(probability)은 주로 P라고 나타내며 2cm짜리 물고기가 잡힐 확률은 P(1.5=
2021.06.30 -
2차시 공부: 표본을 얻는 과정
Chapter 2. 표본을 얻는 과정 확률 변수란 확률적 법칙에 따라 변화하는 값으로 이에 대한 이해와 다른 용어들의 설명을 위해 호수에서 낚시를 하는 예를 가지고 모든 설명을 할 예정이다. 이 호수는 다른 곳에서 물고기가 유입되지 않고, 물고기는 1종류만 살고있다. 물고기를 낚는데 쉽고 어려움은 없으며, 잡은 물고기를 다시 호수에 돌려보내도 전체 물고기의 수가 변하지 않는다. 그리고 물고기가 다치는 일은 없다. 낚아올린 물고기의 길이는 모두 반올림하여 소수점을 없앤다. 이 호수에서 한마리를 잡아올렸다 하자. 이때 물고기 전체는 모집단, 잡아올린 물고기는 표본이라고 할 수 있다. 그리고 표본을 뽑아내는 과정을 샘플링이라고 하며 여기서는 물고기를 잡아올린 것이 샘플링이다. 샘플링은 다른말로 표본..
2021.06.30 -
1차시 공부: 통계학
Chapter 1. 통계학의 기본 -통계학의 목적 데이터는 크게 두가지로 나뉜다. 지금 현재 가지고 있는 데이터와 가지고 있지 않는 데이터. 지금 가지고 있는 데이터를 정리가 되지 않은 상태로 둔다면 확인하는데 오랜 시간이 걸린다. 이를 보기좋게 정리하고 요약하는 것을 기술통계(학)이라고 한다. 기술 통계학=가지고 있는 데이터를 정리, 요약하기 위해 사용되는 통계학 그렇다면 지금 가지고 있지 않은 데이터는 어떨까? 책에 나온 예시를 들면 구두가게에서 빨간 구두와 파란 구두를 팔 때 내일 빨간 구두를 더 많이 올려놔야할지 파란구두를 더 많이 올려놔야할지 고민을 하고있다. 많이 팔릴 구두를 많이 올려놓는 것이 가게 입장에서는 이득일텐데 이를 어떻게 알아낼 수 있을까? 어제와 오늘의 빨간 구두 ..
2021.06.29