[Data anaysis] 데이터분석 라이브러리 (python)
사용 라이브러리1) pandas엑셀/CSV처럼 표 형태의 데이터(DataFrame) 를 다루는 대표 라이브러리데이터 불러오기, 정리, 변환, 결측치 처리 등에 필수예: CSV 불러와서 필요한 컬럼만 뽑고 가공 가능2) numpy수학 연산, 배열 계산을 빠르게 수행하는 라이브러리다차원 배열(ndarray) 기반pandas, matplotlib 등 거의 모든 데이터 라이브러리의 기반3) scipynumpy 기반 확장 라이브러리로 과학·공학 계산 특화선형대수, 최적화, 신호처리, 통계 기능 제공예: 곡선 피팅, 최적화 문제 해결, 회귀/통계 함수 등4) statsmodels전문 통계 모델링 라이브러리회귀 분석, 시계열 분석(ARIMA), 통계 테스트(T-test, ANOVA 등)통계 정보(계수, 유의성 p-v..
2025. 12. 18.
[데이터 분석] Python, Pandas Library의 mode() 함수를 이용해서 최빈값 구하기
pandas의 mode()는 “최빈값(가장 자주 등장한 값)”을 반환합니다.Series.mode() → 해당 시리즈의 최빈값들을 담은 Series 반환DataFrame.mode() → 각 열(또는 행)별 최빈값들을 담은 DataFrame 반환여러 값이 동일한 최빈 빈도를 가지면 모두 반환합니다(즉, 결과가 여러 행이 될 수 있음).Sereis 사용 예시기본 : import pandas as pds = pd.Series([1, 2, 2, 3, 3, 3, 4])s.mode()# 0 3# dtype: int64 최빈값이 여러 개인 경우 : s2 = pd.Series([1, 1, 2, 2, 3])s2.mode()# 0 1# 1 2# dtype: int64 NaN이 있는 경우 : s3 = pd.S..
2025. 10. 12.