[22.10.19] 판다스 csv파일 활용 (loc / iloc / rank / counts )

PYTHON/강의복습

[22.10.19] 판다스 csv파일 활용 (loc / iloc / rank / counts )

peach_h 2022. 10. 19. 17:36

import pandas as pd

fname = './emp.csv'
emp = pd.read_csv(fname, encoding='cp949')
print(emp)

pd.read_csv 함수로 csv 파일을 읽을 수 있음

loc / iloc

# loc
# 문제1 강감찬출력
print(emp.loc[2])

# # 문제2 2행~5행
print(emp.loc[2:5]) #2행~5행

loc로 원하는 행을 지정해서 불러올 수 있다.

print(emp.loc[2, 'Name':'Pay'])

loc[행, 열] : 원하는 행에서 특정 열만 지정하여 불러오기도 가능

# #loc
print(emp.loc[0:6, 'No' : 'Name'])

# #iloc
print(emp.iloc[0:6, 0:2])

loc : 원하는 columns을 문자열로 지정해야함

iloc : 원하는 columns을 숫자로 지정해야함

score.csv 파일 활용하기

import pandas as pd

score = './data/score.csv'
score = pd.read_csv(score, encoding='cp949')
print(score)

dept = 103인 행만 추출하기

print(score[score.dept==103])

영어점수 총점 / 최소 / 최대 / 평균 구하기

from statistics import mean,median

a = score.kor
b = score.eng
c = score.mat
d = score.dept

print('최고점수:',max(c))
print('최저점수:',min(c))
print('총점수:',sum(c))
print('평균점수:',round(mean(c),2))

평균은 반올림하여 소수점 2번째 자리 까지만 나오게함.

mean은 사용하기 전에 import가 필요하다.

import mean안쓰고 평균 구하기

print('평균점수:',round(sum(c)/len(c),2))

sum으로 모두 더하고, len으로 횟수만큼 나누면 된다.

dept 빈도수 구하기

dept = score['dept']
a = pd.value_counts(dept)
print('부서의 빈도수\n',a)

pd.value_counts를 사용하면 원하는 열의 각 빈도수를 구할 수 있음

열에 평균 점수, 총 점수 추가하기

# 개인별 총점 / 평균 오른쪽 끝 열에 추가 
score = pd.DataFrame(score)
mean1 = score.mean(axis='columns')
sum1 = score.sum(axis='columns')

score['mean'] = mean1
score['sum'] = sum1
print(score)

axis='columns' : 작업 결과가 열로 나타난다. 각행의 모든 열에 동작

score.mean(axis='columns) 즉, 각 행의 모든 열의 평균을 구함

mean과 sum을 구한 후, 새로운 열로 추가해주었다.

-axis에 대한 자세한 설명이 나온 블로그-

https://hogni.tistory.com/49

[파이썬 pandas] 판다스 매개변수 axis의 의미를 알아보자

판다스를 사용하다 보면 평균 계산, 데이터프레임 열이나 행 삭제 작업등을 할 때 axis(축)을 지정해야 합니다. 축을 넣어야 할 때면 0을 넣어야 하는지 1을 넣어야 하는지 헷갈릴 수 있습니다. 이

hogni.tistory.com

순위세우기

# 순위추가
score['rank'] = score['mean'].rank(ascending=False,method='max')

# 순위대로 정렬
print(score.sort_values(by='rank',ascending=True, ignore_index=True))

.rank함수로 순위를 만든 후, ascending=True 내림차순 정렬, ignore_index=True로 인덱스를 새로 설정

저작자표시 비영리 변경금지

'PYTHON > 강의복습' 카테고리의 다른 글

[22.10.19] 판다스 ( Seriese / 데이터프레임 / 인덱스 ) (0)	2022.10.19
[22.09.13] 클래스와 객체 ( class / object / __init__ ) (0)	2022.09.13
[22.09.06] 파이썬 데이터타입( 딕셔너리 / set ) (0)	2022.09.06
[22.09.06 ] 파이썬 데이터타입( 리스트 / 함수 / 튜플 / 시퀀스 ) (0)	2022.09.06
[22.09.05] 1일차 ( 변수 / 문자열 ) (0)	2022.09.05

현재글[22.10.19] 판다스 csv파일 활용 (loc / iloc / rank / counts )

일렉치는 취준생