본문 바로가기

CS+/SQL

우분투 18.04 MYSQL workbench 에서 csv import 하기

이번 시간에는 mysql-workbench를 통해서 csv 파일을 임포트 하는 법을 소개 해보겠습니다. 

 

1) 첫 번째 이용할 데이터셋은 

 

https://github.com/billyrohh/dataset 

 

billyrohh/dataset

Contribute to billyrohh/dataset development by creating an account on GitHub.

github.com

링크에 나오는 데이터셋입니다. 위 링크에서 dataset3 을 다운받아주세요. 

 

이제 스키마를 먼저 새로 만들겠습니다.

 

SCHEMAS 부분에서 마우스 우측 클릭하고 create schema 를 눌러주시면 위 사진과 같은 창이 뜹니다. 

mydata 라는 이름의 스키마를 만듭니다. 

 

mydata 스키마에서 테이블에 마우스를 올려두고 우측 클릭하시면 

table data import wazard 가 보입니다. 이를 눌러주세요. 

 

다운받은 데이터셋을 넣어주세요. 

 

 

테이블 이름을 정해주세요. 저는 dataset3 으로 했습니다 :) 

 

 

칼럼 한번 확인해주시구요. 

 

 

이제 next 를 누르면 import 가 됩니다. (에러가 뜨면 csv 파일에 문제가 있거나 하는거에요. 뒤에서 다룰게요) 

 

이렇게 첫 번째 csv 파일을 import 하였습니다. 

 

2) 두 번째 csv 파일을 import 해볼게요. 

 

https://www.kaggle.com/nicapotato/womens-ecommerce-clothing-reviews/data

 

Women's E-Commerce Clothing Reviews

23,000 Customer Reviews and Ratings

www.kaggle.com

캐글에 있는 csv 파일을 가져오겠습니다. 방식은 위와 동일합니다. 하지만 이 데이터셋에서는 한 가지 에러가 발생합니다. 

위에서 다운받은 분들은 만나게 될텐데요. 

 

이런 에러가 발생하는데요. 'incorrect columns' 라는 이름으로 에러가 발생합니다. 

말그대로 칼럼 이름 하나가 이상하다라는 건데요.

 

위 화면에서 보면 빈 칼럼이 보이죠? 이를 삭제해주고 임포트 해주시면 이상없이 임포트됩니다. 

csv 파일을 import 할 때 csv 파일에 문제가 있으면 에러가 발생합니다. 이는 데이터 자체에 문제니깐 에러 코드에 맞춰서 해결을 해주시면 됩니다. 

 

3) 타이타닉 데이터셋 csv 파일 임포트

 

https://www.kaggle.com/pavlofesenko/titanic-extended

 

Titanic extended dataset (Kaggle + Wikipedia)

Additional features from Wikipedia Titanic passenger list

www.kaggle.com

그 유명한 타이타닉 데이터셋입니다. 

임포트 방법은 위와 똑같으니 연습 과제로 넘기겠습니다 ㅎㅎ

 

이번 시간에 import 한 데이터셋들을 이용해서 

다음 시간에는 mysql 쿼리문을 연습하도록 해보겠습니다. 

 

세팅 제대로 됐으면 위와 같이 쿼리문이 잘 먹습니다 ㅎㅎ

 

 

설치 포스팅해서 MYSQL 공식문서에서 classicmodels 스키마 불러오는 거 있었죠? 위 쿼리문은 그 스키마로 한 겁니다!

이거까지 해서 4개의 데이터셋을 workbench 에 설치해주세요. 

 

다음 시간 부터 본격적으로 쿼리문을 포스팅 해보겠습니다.