데이터 분석 공부
-
<Python> 2020_06_05 코드 정리데이터 분석 공부 2020. 6. 5. 20:11
retail['InvoiceDate'] = pd.to_datetime(retail['InvoiceDate'], infer_datetime_format=True) retail.info() plot = rev_by_countries.plot(kind='bar', color=COLORS[-1], figsize=(20, 10)) plot.set_xlabel('Country', fontsize=11) plot.set_ylabel('Revenue', fontsize=11) plot.set_title('Revenue by Country', fontsize=13) plot.set_xticklabels(labels=rev_by_countries.index, rotation=45) def extract_month(date..
-
<Python> 오늘 공부한 코드 정리데이터 분석 공부 2020. 6. 5. 19:57
#head() df.head() #window #sep = ';' df=pd.read_csv('C:/Users/bank-additional-full.csv', engine='python',sep=';') # 만약 , 로 구분되어 있다면 df = pd.read_csv('./data.csv', sep = ',', engine = 'python') #오름차순 정렬 #age칼럼 age=df['age'].sort_values() #내림차순 age=df['age'].sort_values(ascending = False) #drop(axis=1) - 삭제(열 기준) age=age.drop('index',axis=1) #계급간 빈도를 나타내주는 히스토그램 df['age'].plot.hist() plt.show() #히..
-
[Python] Dafit(다핏)에서 받은 커머스 데이터 전처리데이터 분석 공부 2020. 5. 23. 12:02
몸풀기용으로 Raw Data하나 받아서 내 마음 가는대로 전처리 해보기 다음 게시물은 조금 어려운 작업도 추가해서 올려야지 ㅇㅇ 나는 개인적으로 display로 데이터 정보를 한 눈에 보는걸 선호한다. Cell마다 코드 넣고 결과보는거 나에게는 넘나 귀찮은것;; For문 써서 좀 쉽게 바꿔 보려 했는데, 특정 컬럼에 있던 이상치를 확인 안해서, 수작업으로 데이터 처리했지만, 이러한 작업 전에 결측치, 이상치를 먼저 잘 잡아내는게 중요하다. 똑바로 해야 Gui~~ 사실 처음 데이터 정리할 때는, 무언가 엄청난 노동이 들어가지는 않는다. 다만, Business Needs에 따라 데이터를 수정할 때, Which Logic을 써야할지에 대해서는 고민을 해야쥐 이제 슬슬 통계와 머신러닝, 클라우드 좀 공부하려 하..
-
[Python] 맥북으로 Python다룰 때, 한글폰트 안깨지는거 보고 싶다 ㅠㅠ데이터 분석 공부 2020. 5. 16. 18:07
import matplotlib from matplotlib import font_manager, rc import platform try: if platform.system() == 'Windows': #윈도우인 경우 font_name = font_manager.FontProperties(fname="c:/Windows/fonts/malgun.ttf").get_name() rc('font', family=font_name) else: #Mac인 경우 rc('font', family='AppleGothic') except: pass matplotlib.rcParams['axes.unicode_minus'] = False
-