[Pandas] lambda, map, apply
·
Python/Python 기초문법
lambda() lambda 함수는 함수의 선언과 함수 내의 처리를 한 줄로 변환하는 식 lambda_square = lambda x : x ** 2 lambde_square(6) -------------------------------------- #result 36 map() lambda 식을 이용할 때, 인자 값이 여러개일 경우 map()함수를 결합하여 사용 a = [1, 2, 3, 4, 5, 6] squares = map(lambda x : x ** 2, a) list(squares) --------------------------------------- # result [1, 4, 9, 16, 25] apply() 행 단위로 연산할 때, apply() 함수 사용 예시) titanic 데이터에서 ..
[Python] 문자열 포매팅
·
Python/Python 기초문법
1. 문자열 포매팅 %d는 정수, %s는 문자 number = 3 day = "three" "I ate %d apples. so I was sick for %s days." %(number, day) --------------------------------------------------------------- 'I ate 3 apples. so I was sick for three days.' 2. f 문자열 포매팅 number = 3 day = "three" >>> f'I ate {number} apples. so I was {day} days.' --------------------------------------------------- 'I ate 3 apples. so I was sick fo..
파이썬에서 if __name__ == "__main__": 구문 쓰는 이유
·
Python/Python 기초문법
if __name__ == "__main__": 구문은? 파이썬 스크립트 파일이 직접 실행될 때만 특정 코드 블록을 실행하도록 하는 관용구(idiom) if __name__ == "__main__": 구문을 쓰는 이유? 모듈과 스크립트의 분리: 파이썬 파일은 스크립트로 실행되거나 다른 파일에서 모듈로 import될 수 있다. if __name__ == "__main__":을 사용하면 스크립트로 직접 실행될 때만 특정 코드 블록이 실행되어 스크립트로서의 역할을 수행하고, import될 때는 실행되지 않아 모듈로 사용될 수 있다. 명시적인 진입점: if __name__ == "__main__":을 사용하면 코드의 진입점이 명시적으로 표시됨. 즉, 스크립트 파일의 시작점이 어디인지 명확하게 표현된다. 재사용성..
Python - VScode에서 가상환경 만들기
·
Python/Python 기초문법
1. 원하는 위치에 폴더 생성 2. VScode 실행 후, 생성한 폴더 열기 File > Open Folder 3. 터미널 열기 Terminal > New Terminal 터미널 종류는 powershell, gitbash, Command Prompt 등 다양하지만 여기서는 gitbash로 사용! 4. 가상환경 모듈 설치 가상환경 모듈 또한 여러가지가 있지만 여기서는 virtualenv를 설치! pip install virtualenv 5. 가상환경 라이브러리 폴더 생성 virtualenv venv 6. 가상환경에 접속 source venv/Scripts/activate 아래 이미지와 같이 (venv)가 생기면 가상환경에 접속된 것! 7. 필요한 라이브러리 설치 pip install numpy pandas..
Python - Pandas excel 파일 입출력 및 데이터 불러오기
·
Python/Python 기초문법
파일 불러오기 & 파일 저장하기 파일 불러올 때, 인코딩 확인 !! df1 = pd.read_csv('data/sea_rain1_from_notepad.csv', encoding='cp949') #UTF8 df1.to_excel("data/output.xlsx") 엑셀 파일에서 특정 시트 데이터 가져오는 법 df = pd.read_excel('data/학생시험성적.xlsx', sheet_name = '2차시험', index_col = '학생') df 엑셀 파일에서 특정 열만 가져오는 법 air_quality_pm25 = pd.read_csv("air_quality_pm25_long.csv") air_quality_pm25 = air_quality_pm25[["date.utc", "location", "p..
Python - Pandas 데이터 통합하기 (concat, join, merge)
·
Python/Python 기초문법
concat() : 행 추가 * pandas 1.4.0 버전 이후로 append 지원 안함. concat() 사용 권장 import pandas as pd import numpy as np df1 = pd.DataFrame({ 'Class1' : [95, 92, 98, 100], 'Class2' : [91, 93, 97, 99] }) df2 = pd.DataFrame({ 'Class1' : [87, 89], 'Class2' :[85, 90] }) result = pd.concat([df1, df2]) result 위 데이터에서 인덱스 정렬하고 싶을 때, ignore_index=True 추가 df3 = pd.DataFrame({ 'Class1' : [96, 83] }) pd.concat([result, d..
Python - Pandas str.get(), idmax(), replace()
·
Python/Python 기초문법
str.get(i) i index의 문자열을 출력 예시) 데이터 불러오기 titanic = pd.read_csv("https://raw.githubusercontent.com/pandas-dev/pandas/main/doc/data/titanic.csv") titanic 해당 데이터에서 Name의 값들을 ,로 구분하고 Surname이라는 열 추가하여 Surname 값에 이름을 추가 titanic['Surname'] = titanic['Name'].str.split(',').str.get(0) titanic idxmax() 최대값을 가지는 인덱스 레이블 출력 예시) 가장 이름이 긴 승객의 인덱스 titanic['Name'].str.len().idxmax() ---------------------------..
Python - Pandas csv파일 입출력 및 데이터 불러오기
·
Python/Python 기초문법
* csv 파일 기준 다른 파일 형식은 링크 참조 pd.read_csv( 파일 경로 ) 파일 불러오기 import pandas as pd DATA_PATH = 'playground-series-s4e1/' train = pd.read_csv(DATA_PATH + 'train.csv') test = pd.read_csv(DATA_PATH + 'test.csv') submission = pd.read_csv(DATA_PATH + 'sample_submission.csv') train .to_csv('저장할 파일 이름.csv') index = False 시, index 번호는 열로 추출 x 만약 한글이 깨져서 보인다면 인코딩을 추가해주면 된다. encoding='euc-kr' DATA_PATH = 'playg..