목차
1부 데이터 조작
1장 리스트
1-1. 리스트 만들기: [ ]
1-2. 리스트 요소 추출하기
인덱싱과 슬라이싱
메서드로 추출: index, count
1-3. 리스트 편집하기
추가하기: append, extend, +[ ], insert
수정하기: 인덱싱과 슬라이싱
삭제하기: pop, remove, set & list
1-4. 리스트와 유용한 메서드들
정렬/역정렬 하기: sort, reverse
리스트와 문자열 간 변환: split, join
1-5. 기타 데이터 구조와 비교
리스트와 튜플
리스트와 셋
리스트와 문자열
● 연습문제와 풀이
2장 딕셔너리
2-1. 딕셔너리 만들기: { }, dict
2-2. 딕셔너리 저장하기 및 불러오기
저장하기: 텍스트 파일 저장하기, json.dump
불러오기: 텍스트 파일 불러오기, json.load
2-3. 딕셔너리 요소 추출하기: { }[‘key’], get, keys, values, items
2-4. 딕셔너리 편집하기
추가하기: { }[‘new key’] = new value, update
수정하기: { }[‘key’] = new value, update
삭제하기: del, pop
● 연습문제와 풀이
3장 배열
3-1. 배열 만들기: array, zeros, ones, arange, randint
3-2. 배열 저장하기 및 불러오기
3-3. 배열 요소 추출하기
인덱싱과 슬라이싱
최솟값 및 최댓값의 인덱스 추출: argmin, argmax
조건을 만족하는 요소의 인덱스 추출: where, any, all
3-4. 배열 편집하기
추가하기: append, insert
수정하기: 인덱싱과 슬라이싱
삭제하기: delete, unique
3-5. 배열 재구조화: shape, reshape, ravel, T(transpose)
3-6. 배열 연결하기: concatenate, c_, r_, hstack, vstack
3-7. 배열과 유용한 함수들
통계: sum, mean, min, max, std, var, median, percentile, cumsum, cumprod
절댓값, 제곱, 제곱근: abs, power, sqrt
반올림, 올림, 버림: round, ceil, floor
지수와 로그: exp, log, log10
스칼라곱, 배열의 요소별 곱, 행렬곱
● 연습문제와 풀이
4장 데이터프레임
4-1. 데이터프레임 만들기: DataFrame
4-2. 데이터프레임 저장하기 및 불러오기
저장하기: to_csv, to_excel, to_json
불러오기: read_csv, read_excel, read_json
4-3. 데이터 추출하기
데이터의 기본 및 요약 정보: info, columns, index, shape, dtypes, describe
컬럼명과 인덱스로 데이터 추출: df[‘column’], df[[‘column’]], filter, loc, iloc
조건을 만족하는 데이터 추출: df[조건], query(‘조건’)
앞/뒤 n행 추출 및 랜덤 샘플링: head, tail, sample
4-4. 데이터프레임 편집하기
데이터 타입 변경: astype
컬럼과 인덱스 편집: rename, set_index, reset_index
데이터 추가: df[‘column’], loc
데이터 수정: df[‘column’], loc, map, replace, apply
데이터 삭제: drop, dropna, drop_duplicates
4-5. 데이터프레임 재구조화
행/열 전환: T
범주형 변수를 기준으로 집계: groupby
날짜/시간 변수를 기준으로 집계: resample
열과 행에 새로운 변수를 지정하여 집계 (1): pivot_table
열과 행에 새로운 변수를 지정하여 집계 (2): crosstab
변수와 값을 기준으로 재구조화: melt
4-6. 데이터프레임 연결하기: merge, concat
4-7. 데이터프레임과 유용한 메서드들
범주형 변수의 정보 확인: unique, nunique, value_counts
데이터 정렬: sort_values
통계: sum, mean, median, std, var, max, min, mode, cumsum, quantile, rank ...
왜도와 첨도: skew, kurtosis
공분산과 상관계수: cov, corr
● 연습문제와 풀이
2부 데이터 시각화
5장 탐색적 데이터 분석을 위한 시각화
5-1. 선 그래프: plot, lineplot
5-2. 누적 연속 그래프: stackplot
5-3. 막대 그래프: plot, countplot, barplot
5-4. 히스토그램과 KDE 곡선: hist, histplot
5-5. 상자 그림과 바이올린 플롯: boxplot, violinplot
5-6. 산점도와 페어 플롯: scatter, scatterplot, pairplot
5-7. 파이 차트와 도넛 차트: plot, pie
5-8. 모자이크 플롯: mosaic
5-9. 히트맵: heatmap
5-10. 등고선 그래프: contour, contourf, clabel, colorbar
5-11. 서브 플롯 그리기: subplots
5-12. 트윈 플롯 그리기: twinx
● 연습문제와 풀이
6장 모델 관련 시각화
6-1. 트리 기반 모델 특성 중요도 시각화: feature_importances_, barh
6-2. ROC 곡선과 정밀도-재현율 곡선: roc_curve, precision_recall_curve, plot
6-3. 회귀 그래프: regplot
6-4. 잔차 분석 그래프: resid, zscore, probplot, regplot
6-5. 계층적 군집 시각화: linkage, dendrogram, cut_tree
6-6. 비계층적 군집 시각화: inertia_, plot, scatterplot
6-7. 실루엣 다이어그램: silhouette_samples, silhouette_score, fill_betweenx
● 연습문제와 풀이