금요일...절반 듣다가 약속이 있어서 오늘이 되서야 하는 데이터 사이언스 시작하기 챕터!!
금요일날 들은 저 부분까지는 모두 쥬피터 노트북 설치하기 이런 거였는데
내 컴은 뭐가 문제인건지 예전에 잘 썼던 쥬피터가 갑자기 실행이 안되기 시작;;
나중에..시간되면 파일 다 삭제하고 다시 강의대로 천천히 깔아야겠다 ㅠㅠ
1-1 numpy
1. numpy의 사용
기능 | 예시 코드 | 결과 값 |
정의 | import numpy array1=numpy.array([1,2,3,4,5,6,7,8,9]) array1 |
array([1, 2, 3, 4, 5, 6, 7, 8, 9]) |
출력 numpy array 리턴 |
import numpy array1=numpy.array([1,2,3,4,5,6,7,8,9]) print(array1) |
[1 2 3 4 5 6 7 8 9] |
타입 | import numpy array1=numpy.array([1,2,3,4,5,6,7,8,9]) type(array1) |
numpy.ndarray |
import numpy array1=numpy.array([1,2,3,4,5,6,7,8,9]) array1.shape |
(9, ) | |
array 출력 | import numpy array2=numpy.array([[1,2,3],[4,5,6],[7,8,9]]) array2 |
array([[1, 2, 3], [4, 5, 6], [7, 8, 9]]) |
타입 확인 | import numpy array2=numpy.array([[1,2,3],[4,5,6],[7,8,9]]) type(array2) |
numpy.ndarray |
행렬 확인 | import numpy array2=numpy.array([[1,2,3,4],[4,5,6,7],[7,8,9,10]]) array2.shape |
(3, 4) |
...까지 듣다가 맞이한 503 에러..................
서버가 터져서 사이트를 못들어가니
문의고 뭐고 못함..고객센터 연락처도 볼수없음....암울......
대략 30분후... 복구완 ^~^
사이퍼즈 한판이네 ㅎㅎㅎㅎ
2. numpy의 주요 함수
함수 | 코드 | 결과 |
numpy.full(횟수,값) | import numpy array1 = numpy.full(3,9) print(array1) |
[9 9 9] |
numpy.zeros(갯수,dtype=int) | import numpy array2 = numpy.zeros(4,dtype=int) print(array2) |
[0 0 0 0] |
numpy.ones(갯수, dtype=int) | import numpy array3 = numpy.ones(5,dtype=int) print(array3) |
[1 1 1 1 1] |
numpy.random.random(갯수) | import numpy array4 = numpy.random.random(5) print(array4) |
[0.42214929 0.45275673 0.57978413 0.61417065 0.39448558] |
numpy.arange(m-1) | import numpy array5 = numpy.arange(5) print(array5) |
[0 1 2 3 4] |
numpy.arange(시작값,m-1) | import numpy array6 = numpy.arange(3,8) print(array6) |
[3 4 5 6 7] |
numpy.arrange(시작값,m-1, 간격) | import numpy array7 = numpy.arange(1,8,2) print(array7) |
[1 3 5 7] |
3. numpy 의 인덱싱과 슬라이싱
구분 | 코드 | 결과 값 |
숫자로의 인덱싱 | import numpy as np array1=np.array([10, 11, 12, 13, 14, 15, 16, 17, 18]) array1[0] |
10 |
import numpy as np array1= np.array9[10, 11, 12, 13, 14, 15, 16, 17, 18]) array1[3] |
13 | |
import numpy as np array1= np.array([10, 11, 12, 13, 14, 15, 16, 17, 18]) array1[-1] |
18 | |
import numpy as np array1= np.array([10, 11, 12, 13, 14, 15, 16, 17, 18]) array1[-2] |
17 | |
리스트로의 인덱싱 | import numpy as np array1= np.array([10, 11, 12, 13, 14, 15, 16, 17, 18]) array1[[0, 3, 7]] |
array([10, 13, 17]) |
import numpy as np array1= np.array([10, 11, 12, 13, 14, 15, 16, 17, 18]) array2=np.array([0, 5, 2]) array1[array2] |
array([10, 15, 12]) | |
슬라이싱 | import numpy as np array1= np.array([10, 11, 12, 13, 14, 15, 16, 17, 18]) array1[2:5] |
array([12, 13, 14]) |
import numpy as np array1= np.array([10, 11, 12, 13, 14, 15, 16, 17, 18]) array1[:5] |
array([10, 11, 12, 13, 14]) | |
import numpy as np array1= np.array([10, 11, 12, 13, 14, 15, 16, 17, 18]) array1[5:] |
array([15, 16, 17, 18]) | |
array1[시작,m-1끝, n개씩 건너뛰기] | import numpy as np array1= np.array([10, 11, 12, 13, 14, 15, 16, 17, 18]) array1[1:5:2] |
array([11,13]) #1번 인덱스, 3번 인덱스 |
4. numpy 기본 연산
기능 | 코드 | 결과 값 |
import numpy as np array1=np.arange(10) array1 |
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]) | |
곱 연산 | import numpy as np array1=np.arange(10) array1 * 2 |
array([0, 2, 4, 6, 8, 10, 12,14, 16, 18]) |
나누기 연산 | import numpy as np array1=np.arange(10) array1/2 |
array([0. , 0.5 , 1. , 1.5 , 2, 2.5, 3. ,3.5 , 4. , 4.5]) |
덧셈 연산 | import numpy as np array1=np.arange(10) array1-1 |
array([-1, 0, 1, 2, 3, 4, 5, 6, 7, 8]) |
뺄셈 연산 | import numpy as np array1=np.arange(10) array1+2 |
array([2, 3, 4, 5, 6, 7, 8, 9, 10, 11]) |
제곱 연산 | import numpy as np array1=np.arange(10) array1 ** 2 |
array([0, 1, 4, 9, 16, 25, 36, 49, 64, 81]) |
두 numpy array 의 연산 | import numpy as np array1=np.arange(10) array2=np.arange(10,20) array1 + array2 |
array([10, 13, 14, 16, 18, 20, 22, 24, 26, 28]) |
boolean 연산 | import numpy as np array1=np.arange(10) array1>5 |
array([False, False, False, False, False, False, True, True, True, True], dtype=bool) |
import numpy as np array1= np.array([True, True, False, False, True, False]) np.where(array1) |
(array([0, 1, 4]),) | |
import numpy as np array1=np.arange(10) filter = np.where(array1>4) array1[filter] |
array([5, 6, 7, 8, 9]) |
5. numpy 와 python List (import ~ 생략)
Numpy Array | Python List |
numpy.array([1, 2, 3, 4]) + numpy.array([1, 2, 3, 4]) 연산 결과: array([2, 4, 6, 8]) |
list1=[1, 2, 3, 4] list2=[1, 2, 3, 4] list1+list2연산 결과: [1, 2, 3, 4, 1, 2, 3, 4] |
뺄셈, 곱셈, 나눗셈 위와 동일하게 동작 | 오류 |
numpy.array([1, 2, 3, 4]) + 5 연산결과: array([6, 7, 8, 9]) |
오류 |
numpy.array([1, 2, 3, 4]) * 3 연산 결과: array([3, 6, 9, 12]) |
list1=[1, 2, 3, 4] list1*3 연산 결과: [1, 2, 3, 4, 1, 2, 3, 4, 1, 2, 3, 4] |
한 어레이에는 같은 자료형만 저장 | 한 리스트에 다양한 자료형 저장 |
6. numpy로 기본 통계
기능 | 코드 | 결과값 |
최댓값 | import numpy as np array1=np.array([5, 2, 3, 4, 1]) print(array1.max()) |
5 |
최솟값 | import numpy as np array1=np.array([5, 2, 3, 4, 1]) print(array1.min()) |
1 |
평균값 | import numpy as np array1=np.array([5, 2, 3, 4, 1]) print(array1.mean()) |
3.0 |
중앙값 | import numpy as np array1=np.array([5, 2, 3, 4, 1]) print(np.median(array1)) |
3.0 |
표준편차 | import numpy as np array1=np.array([5, 2, 3, 4, 1]) print(array1.std()) |
1.41421356237 |
분산 | import numpy as np array1=np.array([5, 2, 3, 4, 1]) print(array1.var()) |
2.0 |
2-2 pandas란
1. pandans
Column: 데이터의 특징(ex. 키, 나이 ...)
Row: 레코드 (2Row, 이름: 누Ring, 나이: 20살, 키: 170 ...)
numpy와 다른 점: (0,0) 과 같이 숫자로 찾는 것이 아닌 (누Ring, 키) 와 같은 값으로 검색 가능
다양한 자료형을 사용 가능
2. pandans 의 사용
기능 | 코드 | 결과 값 |
import pandas as pd two_dimensional_list=[['A',10, 20], ['B',42,37], ['C',53,11]] my_df=pd.DataFrame( two_dimensional_list) my_df |
||
import pandas as pd two_dimensional_list=[['A',10, 20], ['B',42,37], ['C',53,11]] my_df=pd.DataFrame( two_dimensional_list) type(my_df) |
pandas.core.frame.DataFrame | |
import pandas as pd two_dimensional_list=[['A',10, 20], ['B',42,37], ['C',53,11]] my_df=pd.DataFrame( two_dimensional_list, columns=['Name','EngScore','MathScore'], index=['a','b','c']) my_df |
||
import pandas as pd two_dimensional_list=[['A',10, 20], ['B',42,37], ['C',53,11]] my_df=pd.DataFrame( two_dimensional_list, columns=['Name','EngScore','MathScore'], index=['a','b','c']) my_df.columns |
Index(['Name', 'EngScore', 'MathScore', dtype='object']) | |
import pandas as pd two_dimensional_list=[['A',10, 20], ['B',42,37], ['C',53,11]] my_df=pd.DataFrame( two_dimensional_list, columns=['Name','EngScore','MathScore'], index=['a','b','c']) my_df.index |
Index(['a','b','c', dtype='object']) | |
import pandas as pd two_dimensional_list=[['A',10, 20], ['B',42,37], ['C',53,11]] my_df=pd.DataFrame( two_dimensional_list, columns=['Name','EngScore','MathScore'], index=['a','b','c']) my_df.dtypes |
Name object EngScore int64 MathScore int 64 dtype: object |
'작심3일 챌린지 > 코드잇' 카테고리의 다른 글
[4일차] 1일 1코드잇 챌린지: 파이썬 응용하기 (2) | 2024.01.25 |
---|---|
[3일차] 1일 1코드잇 챌린지: 파이썬과 데이터 어쩌구... (1) | 2024.01.24 |
[2일차] 1일 1코드잇 챌린지:: 파이썬 개념 튼튼어쩌구.. (2) | 2024.01.23 |
[1일차] 파이썬 기초의 어쩌구.. (1) | 2024.01.22 |
[코드잇 0일차] 아케이드(운전) (1) | 2024.01.22 |
댓글