본문 바로가기

전체 글

(171)
리눅스(우분투) 입문자를 위한 기초 명령어1 - ls, mkdir, cd, rm, mv 이번 시간에는 리눅스 명령어들에 대해서 다뤄보겠습니다. 저도 리눅스를 사용한 지 몇달 안되서 저와 같은 리린이(?) 분들을 위한 포스팅이 되겠습니다. 리눅스를 편안하게 쓰신다면 한 번 빠르게 훏어보시고 저와 같은 리린이분들에게는 도움이 되길 바랍니다~:) 시작하겠습니다! -조금 간단하게 후려쳐서(?) 설명하는 거니깐 정의에 예민하신 분들은 가볍게 넘어가시길 ㅎㅎ 컴퓨터 제어하는 2가지 방식 1) GUI: 아이콘을 눌러서 컴퓨터를 제어한다. (저희가 이미 일상적으로 컴퓨터에서 하는 행위들이죠. 클릭을 기반으로 한? 명령) 2) CLI : command line interface 문자를 입력해서 명령을 한다. 저희는 문자를 입력해서 리눅스 터미널에서 명령을 실행하니 CLI 가 되겠습니다. 리눅스는 항상 현재..
python 데이터 시각화 Matplotlib 기본1 라벨,범례,틱,스타일,타이틀 들어가기에 앞서서... python으로 데이터 시각화를 할때는 matplotlib 과 seaborn 을 많이 사용합니다. 2가지 패키지를 모두 다 알아야하며 많은 예제와 연습이 필요합니다. 이것만을 별도로 다룬 책은 (제가 보기에는 국내에) 없습니다 ㅠㅠ 보통 파이썬 책에서는 한 두 챕터 정도로만 설명하고 있으며 옵션에 대해서는 공식 문서를 참고하라는 식으로 나오는 정도입니다. 공식 문서와 몇 가지 잘 정리된 블로글 참고해서 재가공해보겠습니다. 좀 더 궁금한 것이 있다면 댓글로 달아주시면 찾아보도록 하겠습니다 :) matplotlib 패키지를 우선적으로 알아야한다는 생각이 들어서 matplotlib 사용법에 먼저 다뤄보려고 합니다. 저는 먼저 어떤 형태의 그래프를 그릴지에 대해서는 중요하지만 그래프를 그..
pandas 개념2 불린 추출과 중복값 처리(drop_duplicated) 이번 시간에는 불린 추출과 중복값 처리를 다뤄 보겠습니다. pandas cheet sheet1 의 Subset Observations(Rows)를 중심으로 다루어보겠습니다. 먼저 불린 추출의 경우 dataframe이름[ dataframe이름['칼럼 이름 '] 조건 연산 ] 의 형태로 인덱싱을 하면 되는데요. 예를 들겠습니다. 위처럼 데이터프레임을 하나 만들어 주겠습니다. 대괄호 안에 데이터프레임 이름과 칼럼명 그리고 조건 연산자를 넣어주면 (크거나 같거나 등등) 그에 조건이 true 인 로우만 보여주는 것을 볼 수 있습니다. 좀 더 보겠습니다. 'Do it 데이터분석을 위한 판다스 입문' 책에서 가져온 데이터입니다. 불린 추출을 위처럼 해주면 됩니다. 위에서는 나이가 평균 이상인 과학자들만 보여달라는 불..
pandas 개념1 기본(head,tail,sample,shape,info) + loc, iloc, 행번호, 인덱스 이해하기 (들어가기에 앞서서...) pandas는 데이터분석 하는 분들이라면 많이들 쓰는 패키지입니다. 위에 있는 판다스 치트 시트 2장만 온전히 이해한다면 기본적인 데이터 분석은 할 수 있습니다. 하지만, 위에 있는 pandas cheet sheet 를 온전히 이해하려면 알아야 될 게 몇 가지 있기에 그 부분들을 따로 정리하려고 합니다. 개인적으로 pandas cheet sheet 은 나중에 정리할 때 쓰는 것이 좋다고 생각합니다. 일단 제 나름대로 pandas 쓰면서 알아야하는 것들을 최우선으로 포스팅들을 이어나가보도록 하겠습니다. --시작-- 1. 기본 판다스에서는 데이터를 시리즈(Series)와 데이터프레임(DataFrame)이라는 자료형을 사용합니다. 데이터프레임은 엑셀에서 보는 시트(sheet)랑 동일..
word2vec 이해를 위한 개념 정리 part1 word2vec 을 이해하기 위한 개념들을 모아서 정리하는 포스팅입니다. part 몇까지 진행될지는 모르겠습니다. gensim 튜토리얼을 공부하다가 word2vec 개념을 정리할 필요가 있다고 느껴서 정리하는 포스팅입니다. 출처는 제일 하단에 밝혔으며, 개인적으로 자연어처리 공부하시는 분들은 한 번 이상 보는 자료들이라고 생각합니다. 이를 정리하는데 초점을 두었고, 좀 더 자세한 내용이 궁금한 분들은 출처에 있는 링크나 책을 통해 더 학습하시면 좋을 것 같습니다 1. 희소 표현(Sparse Represents) 희소행렬(sparse matrix)은 행렬의 값이 대부분 0인 경우를 가리키는 표현이다. 희소 표현은 희소행렬에서 나온 개념으로 보시면 됩니다. 원-핫 인코딩을 통해서 나온 원-핫 벡터들은 표현하..
파이썬 클래스 사용하기3: 클래스 상속, super,메서드 오버라이딩, 다중 상속, 추상 클래스 이번에는 클래스 상속(inheritance)을 사용해보겠습니다. 상속은 무언가를 물려받는다는 뜻입니다. 그래서 클래스 상속은 물려받은 기능을 유지한채로 다른 기능을 추가할 때 사용하는 기능입니다. 여기서 기능을 물려주는 클래스를 기반 클래스(base class), 상속을 받아 새롭게 만드는 클래스를 파생 클래스(derived class)라고 합니다. 보통 기반 클래스는 부모 클래스(parent class), 슈퍼 클래스(superclass)라고 부르고, 파생 클래스는 자식 클래스(child class), 서브 클래스(subclass)라고도 부릅니다. 클래스 상속은 다음과 같이 클래스를 만들 때 ( )(괄호)를 붙이고 안에 기반 클래스 이름을 넣습니다. class 기반클래스이름: 코드 class 파생클래스..
파이썬 클래스 사용하기2: 클래스 속성과 정적, 클래스 메서드 앞에서 인스턴스 속성을 사용하는 법과 self 등에 대해 배웠습니다. 이번 시간에는 클래스 속성이랑 정적, 클래스 메서드 이렇게 3가지를 배워 보겠습니다! 사실 속성에는 클래스 속성과 인스턴스 속성 2가지 종류가 있습니다. init 메서드에서 만들었던 속성은 인스턴스 속성입니다. 이번에 배울 클래스 속성은 class 클래스이름: 속성 = 값 형태로 입력해주시면 됩니다. james.bag 과 maria.bag을 출력해보면 넣었던 물건이 합쳐져서 나옵니다. 즉, 클래스 속성은 클래스에 속해 있으며 모든 인스턴스에서 공유됩니다. put_bag 메서드에서 클래스 속성 bag에 접근할 때 self를 사용했습니다. 사실 self는 현재 인스턴스를 뜻하므로 클래스 속성을 지칭하기에는 조금 모호합니다. 그래서 클래스 ..
파이썬 클래스 사용하기: 인스턴스, self 이번 시간에는 파이썬에서 클래스 사용하는 법에 대해서 다뤄 보겠습니다. 버튼, 체크 박스처럼 특정한 개념이나 모양으로 존재하는 것을 객체(object)라고 부릅니다. 그리고 프로그래밍으로 객체를 만들 때 사용하는 것이 클래스입니다. 파이썬에서 클래스는 class 클래스 이름: def 메서드(self): 코드 이렇게 선언합니다. 선언한 클래스를 사용하려면 인스턴스화 해줘야합니다. 위처럼 변수에 할당하는 것이 인스턴스를 생성하는 것입니다. 인스턴스 뒤에 .(점)을 붙 이고 메서드를 호출하면 클래스 안에 정의된 함수(=속성이라고 부르겠습니다)를 사용하게 됩니다. 이를 메서드라고 부르고 인스턴스를 통해 호출하는 메서드는 인스턴스 메서드라고 부릅니다. int, list, dict 등도 사실 클래스입니다. 우리는 ..
캐글 자연어처리(NLP) 튜토리얼 입문 2. 머신러닝 모델링 - 백터화 https://www.kaggle.com/c/word2vec-nlp-tutorial 지난 번에 했던 캐글 NLP 튜토리얼 이어서 하겠습니다! 데이터를 정제한 뒤부터 이어지니깐 커널 돌려서 실행한 뒤에 따라서 해주시면 됩니다. 이 포스팅은 박조은님의 인프런 '[NLP] IMDB 영화리뷰 감정 분석을 통한 파이썬 텍스트 분석과 자연어 처리' 강좌를 듣고 실습하며 따로 내용을 정리한 글입니다! 따라서, 강의 내용 + @ (추가적으로 공부한 내용 및 방법) 으로 구성됩니다! :) scikit-learn 의 기본 알고리즘을 보여주는 그림입니다. 이번 모델링에서는 랜덤포레스트를 사용할 것입니다. 랜덤 포레스트는 https://ko.wikipedia.org/wiki/%EB%9E%9C%EB%8D%A4_%ED%8F%AC..
캐글 자연어처리(NLP) 튜토리얼 입문 1. 데이터 정제 https://www.kaggle.com/c/word2vec-nlp-tutorial Bag of Words Meets Bags of Popcorn Use Google's Word2Vec for movie reviews www.kaggle.com 자연어처리 입문으로 할 때 많이 쓰는 튜토리얼인 Bag of Words Meets Bags of Popcorn 을 다뤄보겠습니다. 위의 링크를 눌러서 'Data'를 누르시면 sources 를 받을 수 있습니다. (로그인이 되어있어야 다운이 될거에요~) 그리고 지금부터 하는 이 튜토리얼 코드는 순수하게 제가 하는 것이 아닌 인프런의 '[NLP] IMDB 영화리뷰 튜토리얼' 강의를 듣고 따라하면서 제가 복습 및 정리하는 내용입니다 :) 1. 데이터 불러서 살펴보기 우..
<우리는 언젠가 만난다> 리뷰, 채사장의 삶에 대한 통찰 오늘 리뷰할 책은 우리는 언젠가 만난다 입니다 채사장 님은 제가 개인적으로도 아주 좋아하는 작가이면서 팟캐스트 '지대넓얕'의 호스트 였습니다. (개인적으로는 인문학에 빠지는 계기를 만들어주셨고, 독특한 사상에 여러 자극을 받고 있기 때문입니다 ㅎㅎ) 그럼, 본격적으로 리뷰 해보겠습니다. 1. 관계의 인문학이라니? 보시는 바와 같이 40가지의 이야기가 있고, '관계'라는 키워드라는 단어를 보고 저는 선입견에 사로잡혔습니다. '인간관계를 쉽게 풀어갈 수 있게 도와주는 그런 류의 책인가 보구나...' 하지만, 읽어보니 이 책은 전~~혀 그런 주제가 아닙니다. 책의 일부에서 타인과의 관계에 있어서에 대한 이야기를 하긴 합니다. but, 전반적으로 이 책은 나라는 '자아'가 '세상'과의 관계를 어떻게 맺고 있는지..
<환율의 미래> 리뷰, '환율'이란 무엇인가? 환율에 대해 명확한 정리를 해보고 싶은데 어떤 입문서가 있을까 싶어서 검색하던 중에 많은 이들의 호평이 있었던 '환율의 미래'를 직접 사서 읽어 보았습니다. 책은 먼저 1장에서 가볍게 시작합니다. 환율이 상승하고 하락할 때, 우리에게 어떤 영향이 있는지 아이폰과 갤럭시 노트를 가지고 예를 듭니다. 환율이 상승함은 1달러에 대한 원화의 비율이 올라갔다는 의미입니다. (1달러/1100원 -> 1달러/1300원) 그러므로 미국에서 500달러에 팔리는 아이폰이 환율이 상승한다면 더 비싼 돈을 줘서 구매하게 됩니다. 반대의 경우에는 조금 더 아이폰을 싸게 살 수 있습니다. 그 다음으로 환율 표기법에 대해 알려줍니다. 직접표시법과 간접표시법이 있는데 바로 위에 예를 든 것처럼 달러/원 환율로 표기하는 직접이며 반대..