분류 전체보기(273)
-
[GUI] 마케팅조사의 중요성과 마케팅 조사의 역할
서울여대 김예리 교수님의 'GUI를 활용한 데이터사이언스' 수업을 듣고 작성한 복습용 글입니다. 교재: 마케팅조사원론 1. 마케팅 조사의 중요성 1) 마케팅 조사의 성공과 실패 사례
2022.04.19 -
자료구조 3주차 - 연결리스트
서울여대 이병걸 교수님의 자료구조 수업을 들은 뒤 복습용으로 작성한 글입니다. 교재: 파이썬과 함께하는 자료구조의 이해 연결리스트는 리스트로 구현된 자료구조로 단순연결리스트, 이중연결리스트(중복연결리스트), 원형연결리스트 세종류가 있다. 단순연결리스트란 동적 메모리 할당을 이용해 노드들을 한 방향으로 연결하여 리스트를 구현하는 자료구조로, 노드는 레퍼런스를 이용하여 다음 노드를 가리키도록 만든다. 여기서 동적 메모리 할당이란 항목이 추가되면 리스트를 확장하고, 항목이 삭제되면 리스트를 축소시키며 새 메모리에 할당하는데 이를 동적 메모리 할당이라고 한다. 레퍼런스는 메모리 주소를 의미한다. 단순연결리스트에서 항목을 삽입하거나 삭제할 때 레퍼런스만 수정하면 되기 때문에 항목들의 이동이 필요없다. 하지만 항목..
2022.04.15 -
자료구조 2주차 - 자료구조를 배우기 위한 준비
서울여대 이병걸 교수님의 자료구조 수업을 들은 뒤 복습용으로 작성한 글입니다. 교재: 파이썬과 함께하는 자료구조의 이해 1. 자료구조와 추상데이터 타입 자료구조란 일련의 동일한 타입의 데이터를 정돈하여 저장한 구성체이다. 데이터를 정돈하는 목적은 프로그램에서 저장하는 데이터에 대해 탐색, 삽입, 삭제 등의 연산을 효율적으로 수행하기 위함이다. 그래서 자료구조를 설계할 때 데이터와 데이터 관련 연산들도 함께 고려하여 설계 해야 한다. 추상 데이터 타입은 데이터 저장 구조 생성 후 실제 저장되는 데이터를 처리하기 위한 연산을 정의하는 관계를 정형화 한 것으로 데이터와 그 데이터에 대한 추상적* 연산들로 구성된다. *추상적: 연산을 구체적으로 어떻게 구현해야 한다는 세부 명세를 포함하고 있지 않다는 의미 추상..
2022.04.04 -
Chapter 8. 데이터 준비하기: 조인, 병합, 변형 (1)
계층적 색인 : 축에 대해 다중 색인 단계를 지정할 수 있도록 해줌 높은 차원의 데이터를 낮은 차원의 형식으로 다룰 수 있게 해주는 기능 data = pd.Series(np.random.randn(9), index=[['a', 'a', 'a', 'b', 'b', 'c', 'c', 'd', 'd'], [1, 2, 3, 1, 3, 1, 2, 2, 3]]) data 위의 객체가 MultiIndex를 색인으로 하는 Series로 색인 계층을 보여줌 data.index 계층적으로 색인된 객체는 데이터의 부분집합을 부분적 색인으로 접근하는 것이 가능함 data['b'] data.loc[['b', 'd']] 하위 계층의 객체를 선택하는 것도 가능 data.loc[:, 2] # 상위 계층의 경우 :를 이용해 전범위를 ..
2022.03.14 -
Chapter 5. Pandas 시작하기 (5)
기술통계 계산과 요약 > 판다스의 일반적인 수학 메서드 상관관계와 공분산 0 변수 한쪽이 큰 값을 갖게되면 다른 한쪽도 커지는 관계 공분산=0 변수사이의 관계성이 없음 공분산 유일값, 값세기, 멤버십
2022.03.04 -
Chapter 5. Pandas 시작하기 (4)
핵심 기능 > 정렬과 순위
2022.03.03 -
Chapter 5. Pandas 시작하기 (3)
핵심 기능 > 정수 index 산술연산과 데이터 정렬 함수 적용과 매핑
2022.03.03 -
Chapter 5. Pandas 시작하기 (2)
핵심기능 > reindex 하나의 low나 col 삭제 인덱싱, 선택하기, 거르기 5] loc: 축이름으로 선택할 때 이용 iloc: 정수 index로 선택할 때 이용 data.loc['Colorado', ['two', 'three']] data.iloc[2, [3, 0, 1]] 슬라이싱, 단일라벨, 라벨리스트도 지원
2022.03.01 -
Chapter 5. Pandas 시작하기 (1)
Pandas의 특징 numpy, scikit-learn, matplotlib 등의 다른 라이브러리와 함께 사용함 for문을 사용하지 않고 데이터를 처리함 배열기반의 함수를 제공 numpy의 스타일을 많이 차용했으나 표 형식의 데이터나 다양한 형태의 데이터를 다루는데 초점을 맞추어 설계 Pandas import하기 import pandas as pd pandas를 pd로 지칭하여 편하게 불러올 수 있도록 함 Pandas 자료구조 > Series Data Frame
2022.03.01 -
캡스톤 디자인I 1차 발표
1학년때의 캡스톤1 솔직히 1학년 치고는 잘한 것 아닐까 싶다 ㄴ응 아니에요 배운게 없는데... 구글링하고.. 교수님이 알려주신 툴 사용법과 야매... 정말 와우 그자체 2학기 정말 대단한 학기였던 것 같다. 캡스톤 디자인 프로젝트를 진행할 때의 1차발표 자료이다. 발표할 때 사용했던 것은 아니며 2학기가 끝나고 개인적으로 다시 정리한 것이다. 1차 발표를 할 당시에는 '영화 개봉 전 유튜브 마케팅의 관객 반응 분석을 통해 영화 흥행 예측하기: 영화 극한직업, 기생충을 중점적으로' 라는 주제로 프로젝트를 진행하려고 했다. 주제 선정이유, 영화 선정이유와 가설 순으로 발표했다. (사실 앞으로의 계획도 포함이였으나 이 글에서는 생략한다.) 선행연구를 찾아보며 대부분의 연구들이 '개봉 후'에 초점을 맞췄고, ..
2022.01.07