본문 바로가기

Python3

[Data anaysis] 데이터분석 라이브러리 (python) 사용 라이브러리1) pandas엑셀/CSV처럼 표 형태의 데이터(DataFrame) 를 다루는 대표 라이브러리데이터 불러오기, 정리, 변환, 결측치 처리 등에 필수예: CSV 불러와서 필요한 컬럼만 뽑고 가공 가능2) numpy수학 연산, 배열 계산을 빠르게 수행하는 라이브러리다차원 배열(ndarray) 기반pandas, matplotlib 등 거의 모든 데이터 라이브러리의 기반3) scipynumpy 기반 확장 라이브러리로 과학·공학 계산 특화선형대수, 최적화, 신호처리, 통계 기능 제공예: 곡선 피팅, 최적화 문제 해결, 회귀/통계 함수 등4) statsmodels전문 통계 모델링 라이브러리회귀 분석, 시계열 분석(ARIMA), 통계 테스트(T-test, ANOVA 등)통계 정보(계수, 유의성 p-v.. 2025. 12. 18.
[Linux/Unix] WSL 환경 구축하기 안녕하세요!요즘은 데이터 분석 프로젝트를 하나 진행하고 있습니다.데이터 분석을 좀 더 수월하게 진행하기 위해, python 파일을 차례 대로 실행 시켜주는 Bash 파일을 하나 만들었는데요. 이전에 대학에서 와 교과목을 수강하면서VirtualBox를 통해 Linux를 조금 다뤄보아서 Bash파일이 얼마나 편리한지 알게 되었답니다.하지만 VitualBox는 일일이 프로그램을 실행시켜주어야 하고, 속도가 느리기도 하고 코드 편집이 불편하기도 했습니다. 따라서 좀 더 편한 작업을 위해 WSL을 설치해주었답니다. VirtualBox에 대해서 알아보려면 아래 게시글을 확인하세요!https://lxvxxu.tistory.com/72 [Linux/Unix] 실습 환경 구축: VirtualBox/Ubuntu 다운로드.. 2025. 12. 18.
[데이터 분석] Python, Pandas Library의 mode() 함수를 이용해서 최빈값 구하기 pandas의 mode()는 “최빈값(가장 자주 등장한 값)”을 반환합니다.Series.mode() → 해당 시리즈의 최빈값들을 담은 Series 반환DataFrame.mode() → 각 열(또는 행)별 최빈값들을 담은 DataFrame 반환여러 값이 동일한 최빈 빈도를 가지면 모두 반환합니다(즉, 결과가 여러 행이 될 수 있음).Sereis 사용 예시기본 : import pandas as pds = pd.Series([1, 2, 2, 3, 3, 3, 4])s.mode()# 0 3# dtype: int64 최빈값이 여러 개인 경우 : s2 = pd.Series([1, 1, 2, 2, 3])s2.mode()# 0 1# 1 2# dtype: int64 NaN이 있는 경우 : s3 = pd.S.. 2025. 10. 12.