교내활동(52)
-
K-MOOC 데이터로 배우는 통계학 13주차
1. 재현성 위기와 연구 윤리 1) 재현성의 위기 l 원 실험에서 대부분의 연구에서 통계적으로 유의미한 결과가 나왔으나 재현 연구에서 통계적으로 유의미한 결과가 매우 적게 나오는 경우가 있음. l 하지만 통계적으로 유의미한 연구 결과와 통계적으로 유의미하지 않은 연구결과의 차이가 통계적으로 유의미하지 않을 수 있음. l 통계적 유의미성과 더불어 효과의 크기와 효과의 방향 또한 확인하는 것이 중요 l 대부분의 경우 재현 연구에서 효과의 방향은 일치하나 효과의 크기는 절반 정도였음. 운 좋게 큰 효과가 나온 연구가 논문으로 나오는 편향을 보여주는 것임. 귀무가설로의 회귀라고 이야기함. l 계획 단계에서 오해를 불러일으킬 수 있는 문구를 사용하거나 대표성이 부족하고, 편리하지만 저비용의 표본을 선택한 경우 혹..
2021.11.16 -
K-MOOC 데이터로 배우는 통계학 10~12주차
1. 신뢰구간과 가설검정 1) 순열검정과 P값 분할표: 변수의 값에 따라 각 변수에 해당하는 관측치의 개수를 표시하는 유형의 표 순열검정: 원래의 각 변수별 비율차를 구한 뒤, 변수의 값을 조금씩 조정해 비율차를 구한 후 표본분포를 그림. P-value: 귀무가설이 참이라는 전제하에 우리가 관측한 검정통계량의 값이나 혹은 그보다 더 극단적인 값을 얻을 확률. P-value가 주어진 기준값(유의수준)보다 작을 경우 검정통계량의 값이 극단적이라고 이야기함. 대립가설: 우리가 증명하고자 하는 가설 양측 검정: ‘성별에 따라 팔짱끼는 방식이 다르다.’의 대립가설에서는 검정통계량이 음수가 나올 수 있어 그 값보다 작을 확률도 계산해야함. 단측 검정: ‘여성이 남성보다 팔짱을 낄 때 오른팔을 올려놓는 것을 선호한다..
2021.11.14 -
K-MOOC 데이터로 배우는 통계학 8~9주차
1. 확률로 풀어보는 불확실성 1) 붓스트랩 표본이 커질수록 표본 요약치의 값들은 모집단의 요약치와 가까워지지만, 같은 크기의 표본을 다시 뽑는 과정에서 처음의 요약치와는 값들이 변함. 이를 요약치의 변동성(통계량의 분산)이라고 하며, 이를 알아내기 위한 방안으로 bootstrap이 있음. Bootstrap: 모집단에서 표본을 추출 후 그 표본으로 복원추출을 진행하는 방법 붓스트랩 95% 불확실성 구간은 재표본 평균의 95%가 포함되는 범위임. 붓스트랩을 이용해 회귀직선을 그릴 때 불확실성 구간이 나옴. 2) 확률의 기원과 법칙 확률: 데이터가 어떻게 생성되었는지 모형에 대한 것 기대돗수나무: 가능한 모든 경우를 고려해 확률을 쉽게 계산할 수 있는 그림 확률법칙 ① 확률은 0과 1 사이임 ② 여사건 법칙..
2021.11.04 -
K-MOOC 데이터로 배우는 통계학 7주차
7~9주차인줄 알고... 까먹고 있다가 급하게 8주차를 듣던 중 7주차만 듣는 것을 알게되었다. 하하.. 7주차는 저번주에 들어놨었는데.. 1. 알고리즘 알아보기 1) 알고리즘과 인공지능 l 알고리즘: 데이터를 기반으로 실생활의 문제에 대한 해답을 제공하는 기술. l 머신러닝: 통계학과 컴퓨터 공학의 접점분야로 데이터를 통해 자동적으로 향상되는 컴퓨터 알고리즘을 연구하는 분야. l AI: 머신러닝의 또다른 이름. 지도학습과 자율학습으로 나뉨. ① 지도학습 i. Classification(분류) : 사진에서 고양이와 개의 분류 ii. Prediction(예측) : 주식가격 예측 등 (반응변수가 continuous함) ② 강 인공지능: 자의식을 가진 인공지능으로 명령을 받지 않은 일도 할 수 있으며 명령 거..
2021.10.11 -
K-MOOC 데이터로 배우는 통계학 4~6주차
1. 부분에서 전체를 추론하기 1) 모집단과 표본 l 귀납적 추론: 데이터--> 표본--> 연구 모집단--> 목적 모집단 -데이터가 표본으로 가는 단계에서 데이터가 가져야 할 특성 ① 데이터 자체의 변동이 작고 반복 가능 ② 알고자 하는 항목에 대해 어떤 편의도 없이 정확히 측정하고 있음. -내적 타당성: 표본이 연구 모집단의 대표성을 가지는 경우 e.g. 임의추출 등의 방법 이용 -외적 타당성: 연구 모집단과 목적 모집단이 정확히 일치하지 않을 경우 연구 모집단의 결과를 목적 모집단으로 확장할 수 있는 경우 2) 표본 조사 방법 l 센서스: 표본을 선택하는 대신 전체 모집단에 대해서 조사를 한 경우 문제점 ① 센서스에 잡히지 않는 사람이 있음. E.g. 불법 체류자 ② 모집단은 계속 변화하기 때문에 완..
2021.10.04 -
K-MOOC 데이터로 배우는 통계학 1~3주차
0. PPDAC 과정 데이터를 분석하는 다섯개의 단계를 나타내며 각각 Problem, Plan, Data, Analysis, Conclusion을 의미함. Problem 단계에서 중요한 것은 문제 정의의 기준을 어떻게 혹은 어디에 두는지가 가장 중요함. 예를 들어 지구상에는 얼마나 많은 나무가 있을지에 대한 문제에서 나무의 정의에 따라 나무의 기준이 바뀔 수 있음. Plan 단계에서는 어떻게 데이터를 수집할 것인지를 계획하는 단계임. Data 단계는 데이터를 수집하고 전처리하는 과정을 담고 있으며, Analysis 단계에서는 통계모형 등을 이용해 결론 도출 과정으로 진입함. Conclusion 단계에서는 앞의 과정을 통해 결론 도출을 하는 단계임. 1. 데이터 수집 과정 1) 실험: 의미 있는 결론을 도..
2021.10.04 -
소학회 준비위원회 8
너무 늦어버리긴 했지만.. 마지막 준비위원회 글이다. 추석 연휴에도 바쁘게.. 진행이 되었다. 추석 연휴동안 오티와 공동세션 커리큘럼을 짜고, 뽑을 사람들 확정을 짓고, 개설 신청서를 작성하며 정말 바쁘게 보냈다.. 그리고 대망의 오티날!!!! 공동세션에 대한 공지와 첫 공동세션 스터디 전까지 해야할일에 대해 공지를 하고, 각 분반별로 또 오티를 진행하기로 했다. 나는 공동세션 오티를 진행하고, 다른 분반의 학회장분이 부득이하게 불참하게 되어 내가대신 공지하고 나는 내 분반으로 이동했다. 진행을 하면서 정말 온라인으로 해야되는게 가장 슬펐다.. 화면속으로만 보고 하다니.. 눈물 광광 그리고 우리가 주로 이용하는 노션 페이지이다. 정말 급한 것이 아니라면 모두 노션으로 공지할 예정이며, 개인 프로 계정을 ..
2021.10.01 -
소학회 준비위원회 7
지난번 대표자 회의를 진행하며 모집 일정과 소학회 등록을 언제할지 결정하고, 노션으로 통일해서 진행하자는 회의를 했다. 그리고 공동세션 커리큘럼과 공동세션 모임을 언제할지 정해봤다. 9/15부터 9/18까지 4일간 모집을 하고 공통커리큘럼은 4차 회의를 이용해 짤 예정이다. 일단은 분과별 커리큘럼과 모집 공지에 초점을 맞추기로 했다. 막판에 시간이 빠듯했는데.. 엄청 빡빡해서 다들 증말 힘드셨을텐데.. 증말 죄송하기도 하면서 감사하다. 우리도 회의를 통해서 커리큘럼 수정을 하고, 강의들도 다시 정했다. 그리고 다들 공지용 카드뉴스를 제작하고 폼에 들어갈 질문들을 보내주셨다. 나는 열심히 폼을 만들고 공지글을 작성했다. 폼을 만들고 불안해서 오타낸 것은 없는지, 뭐 잘못된건 없는지 이것저것 찾아봤는데.. ..
2021.09.16 -
소학회 준비위원회 6
두시간동안의 회의를 거쳐 커리큘럼을 확정과 소학회 이름, 얼마나 뽑을 것이며 어떻게 뽑을 것인지가 모두 정해졌다. 힘들었다 정말.. 중간에 나도모르게 격해지고 그런 것이 있었는데.. 주변에서 달래주심.. 본인이 격해졌다고 먼저 미안하다고 이야기하는데 다들 왤케 멋있어요.. 나도 그런인간이 되어보겠읍니다. 일단 우리 소학회의 이름은.. 지금 공개 안할래욥. 나중에 소학회 등록까지 마치고 공개하겠음. 그리고 인원은 현재 준비위원회를 포함해서 15명정도로 구성이될 예정이다. 면접 없이 폼으로만 지원을 받을 예정이다. 이건 DS기준이고 다른 분과는 아직 모르겠다. 대표자 회의때 들어봐야지 알 수 있을 것 같다. 그리고 커리큘럼의 경우 소학회가 마무리되는 일정에 맞춰서 스터디와 프로젝트를 함께 진행할 예정이다. ..
2021.09.07 -
소학회 준비위원회 5
두번째 대표자 회의가 끝나고.. 빠밤 어렵다 어려워 현대사회.. 과연 정말 내가 잘하고 있는건지.. 올바르게 하고있는건지를 모르겠음.. 정답은 없는 길이라고는 하지만.. 차라리 정답이 있는 길이 맘편한 것 같음.. 어떤게 더 좋을지 모르겠다.. 일단 대표자회의는 늘 그렇듯 분과별 진행상황에 대해 이야기나누고, 6개의 안건에 대해 이야기를 나누었다. 회의가 끝난 이후, 소학회를 기다리고 있을 사람들을 위해 진행 상황 공유 글을 올리기로 했고, 가수요조사를 진행하기로 했다. 현재 가수요조사에 참여한 사람은 총 13명. 소학회 준비 위원회에 있는 사람은 15명이다. 슬픈건.. DE 희망자가.. 없어요.. 수요조사 상으로는.. 아직.. 눈물난다.. 이러다 ㄹㅇ 없어지는거 아닌지.. 그리고 대표자 회의에서 진행한..
2021.09.06