-
파이썬 넘파이, 판다스 연습(numpy, pandas)computer_IT 2022. 7. 10. 21:48반응형
넘파이는 Numerical Python의 줄임말로, 수치 해석, 통계 관련 작업을 구현할 때 가장 기본이 되는 모듈이다. 설치는 pip install numpy 명령으로 설치한다.
배열생성은 array() 함수로 생성하고, 배열의 각 요소에 접근하는데 대괄호를 사용한다.
전치(transpose)란 배열 요소의 위치를 주대각선을 기준으로 뒤바꾸는 것이다. T속성이나 transpose() 함수를 사용한다. flatten() 함수는 다차원 배열을 1차원 배열 형태로 바꾼다.
내적 곱은 dot()함수를 사용한다.
판다스(pandas)는 금융 데이터 분석을 목적으로 개발되어 구조화된 데이터를 빠르게 가공할 수 있는 자료형과 함수를 제공한다. 또한 데이터 시각화 라이브러리인 파이플롯(pyplot)과도 쉽게 호환도기 때문에 데이터 과학용 기본 라이브러리로 활용된다. 판다스는 시계열 데이터를 다루는데 적합한 시리즈(Series)와 인덱스와 여러 시리즈를 합친 데이터프레임(Dataframe) 자료형 객체를 제공한다. 판다스는 pip install pandas 명령으로 설치한다.
시리즈 객체의 정보를 확인하는데는 describe() 메서드를 이용한다. 개수, 평균, 표준편차, 최소값, 제1~3 사분위수, 최대값을 확인할 수 있다.
데이터프레임 생성은 DataFrame을 사용한다.
시리즈로 데이터프레임 생성하는 경우는 다음과 같다. 파이썬은 들여쓰기를 잘못하면 오류가 난다.
2022.07.12 - [computer_IT] - 파이썬 증권 데이터 분석 연습하기(주식 주가 그리기)
반응형'computer_IT' 카테고리의 다른 글
(파이썬 증권데이터 분석) 일간 변동률 누적합 그래프 그리기 (0) 2022.07.13 파이썬 증권 데이터 분석 연습하기(주식 주가 그리기) (0) 2022.07.12 파이썬 프로그래밍 연습(이스케이프 처리, 범위, 나누기, 정렬, 리스트, 셋) (0) 2022.07.10 자바 문자열 글자수로 자르기 (0) 2022.07.01 넥사크로 한 개 컬럼에 여러 체크박스 바인딩하기 스크립트 (0) 2022.06.30