본문 바로가기

BOOSTCAMP AI TECH41

[BOOSTCAMP AI TECH] 17일차_RNN, LSTM, GRU 강의 목록 - Recurrent Neural Networks(RNNs) - LSTM and GRU 요약 강의 시퀀셜 데이터를 다루는 모델인 RNN, LSTM, GRU의 개념과 학습법에 대해 학습했다. 그리고 실습을 통해 각 모델의 사용법을 학습했고, 과제를 통해 전처리를 학습했다. 피어세션 어제 배운 실습 코드를 복습하며 Word2Vec과 네이브 베이즈 분류를 재학습했다. 학습정리 Recurrent Neural Networks (RNNs) 다양한 길이를 가진 시퀀스 데이터에 특화된 유연한 구조의 딥러닝 구조 Vanilla RNN은 구조가 매우 간단하지만 경사도 손실, 폭주 문제가 존재한다. 시퀀스 데이터가 입력, 출력으로 주어진 상황에서 히든 스테이트의 출력값을 저장하고, 다음 학습의 입력으로 받아 활용.. 2021. 2. 16.
[BOOSTCAMP AI TECH] 16일차_BOW, Word2Vec, Glove 강의 목록 -Bag-of-words -Word2Vec, Glove -나이즈베이안 분류, Word2Vec 실습 -NLP 전처리 실습 요약 강의 자연어 처리의 동향을 학습했다. 자연어 처리를 위한 Bag of Words, Word2Vec, GloVe 알고리즘을 학습했다. 나이브 베이즈 분류와 word2vec 실습을 진행했고, NLP 전처리를 실습을 통해 학습했다. 피어세션 파이썬 머신러닝 완벽가이드 책의 군집화와 자연어 처리 파트를 다 함께 학습했다. 학습정리 NLP (Natural Language Processing, 자연어처리) 컴퓨터와 인간 언어 사이의 상호 작용하는 기술로, 인공지능의 핵심 기능 중 하나이다. 크게 NLU (Natural Language Understanding), NLG (Natur.. 2021. 2. 15.
[BOOSTCAMP AI TECH] 15일차_Generative model 강의 목록 - Generative Models1 - Generative Models2 요약 강의 Generative models에 대한 학습을 진행했다. 피어세션 어제의 내용을 복습하고, 파이썬 머신러닝 완벽 가이드 책을 바탕으로 분류 알고리즘의 종류를 학습했다. 학습정리 Generative Models Generative Model은 단순히 이미지, 문장 등의 데이터를 생성하는 것이 전부가 아니다. 단순 데이터 생성 (Generation) 뿐 아니라, 이상탐지 (Density estimnation)도 가능하다. implicit 모델 : 단순히 데이터를 생성할 수 있는 모델 explicit 모델 : 데이터를 생성할 뿐 아니라 입력에 대한 확률값을 얻어내는 모델 Basic Discrete Distribut.. 2021. 2. 7.
[BOOSTCAMP AI TECH] 14일차_Recurrent Neural Network 강의 목록 -RNN 첫걸음 -Sequential Models - RNN -Sequential Models - Transformer 요약 강의 이전의 CNN까지는 Sequential data를 다룰 수 없었다. 오늘의 강의에서는 Sequential data를 다루는 여러가지 모델에 대한 설명과, 그 활용법을 익혔다. 피어세션 어제의 학습을 복습하는 시간을 가졌고, 분류에 관한 각종 알고리즘 (랜덤 포레스트, 결정 트리 등)에 대해 학습했다. 학습정리 Sequential data (시퀀스 데이터) 독립동등분포 조건을 만족하지 않는 순차적 데이터 순서를 바꾸거나 과거 정보에 손실이 발생하게 되면 확률 분포도 변경되는 데이터 소리, 문자열, 주가, 동영상 등이 있다. 이벤트의 발생 순서가 중요한 요소이다. 과거.. 2021. 2. 4.
[BOOSTCAMP AI TECH]13일차_Convolution Neural Network 강의 목록 [DLBasic] CNN - Convolution은 무엇인가? [DLBasic] Modern CNN - 1x1 convolution의 중요성 [DLBasic] Computer Vision Applications [DLBasic] CNN Assignment [DLBasic] CNN - 강아지 종류 분류하기 [DLBasic] CNN - 나만의 데이터셋 만들기 [DLBasic] 과제 해설 - Optimization 요약 강의 CNN의 상세한 개념을 학습했고, 여러 모델을 학습했다. GoogleNet과 VGGNet을 통해 1*1 컨볼루션의 중요성을 집중적으로 학습했다. 그리고 Semantic Segmentation과 Detection 분야에서의 CNN의 활용을 학습했다. 피어세션 어제 배운 내용들을 .. 2021. 2. 3.
[BOOSTCAMP AI TECH] 12일차_최적화 & CNN 강의 목록 - Optimization (최적화) - CNN 첫걸음 요약 강의 뉴럴 네트워크의 최적화와 관련해 일반화 성능, 교차 검증, 경사 하강법, 정규화 등을 학습했다. CNN의 개념 중 콘볼루션 연산에 대해 학습했다. 피어세션 어제의 내용을 복습하는 시간을 가졌고, 과제 코드를 함께 분석하는 시간을 가졌다. 학습정리 Optimization (최적화) Generalization (일반화 성능) 학습한 적 없는 데이터에서 얼마나 잘 작동하는지 테스트 한 것. 일반화 성능은 학습 에러와 테스트 에러의 차이가 크지 않음을 의미한다. 무작정 학습 에러가 적다고 좋은 것이 아니다. Underfitting vs Overfitting Underfitting (과편향) : 모델이 너무 단순해서 데이터에 내제된 구조.. 2021. 2. 2.
[BOOSTCAMP AI TECH] 11일차_딥러닝 기초 강의 목록 - 베이즈 통계학 맛보기 - 딥러닝 기본 용어 설명 - Historical Review - PyTorch 시작하기 - 뉴럴 네트워크 - MLP - 데이터셋 다루기 요약 강의 3주차가 되었다. 본격적으로 AI에 관련된 학습을 시작했다. 아직 미숙한 수학을 보충하기 위해 조건부 확률, 베이즈 정리 등에 대한 수학 학습을 했다. AI를 본격적으로 다루기 위해 PyTorch의 사용법을 간략하게 익혔다. AI를 본격적으로 학습하기 전에 AI의 간략한 역사를 학습했다. NN과 LNN등을 통해 AI의 기초적인 지식을 학습했고, MLP를 구현해보며 NN의 구축법을 학습했다. 피어세션 전날 학습한 내용을 복습하는 시간을 가졌다. 파이썬 머신러닝 완벽 가이드의 1,2 장을 함께 학습했다. 학습정리 조건부 확률 .. 2021. 2. 1.
[BOOSTCAMP AI TECH] 10일차_시각화 도구, 통계학 맛보기 강의 목록 -시각화 도구 -통계학 맛보기 요약 강의 matplot.pyplot과 serborn 라이브러리를 사용하여 데이터를 시각화 하는 방법을 학습했다. 모수, 확률분포, 가능도 등 확률 관련 수학을 학습했다. 피어세션 어제 배운 내용을 정리하며 다시 한 번 학습하는 시간을 가졌다. 학습정리 Matplot Pyplot이라는 객체를 사용해 데이터 표시한다. 구체적으로는 Pyplot 객체에 그래프를 쌓은 다음 flush하는 방식이다. 이 때 그래프는 화면에 보여준 후 메모리에 남겨두지 않는다. 단점으로는 argument를 kwargs로 받는데, 고정된 argument가 없어 alt+tab으로 확인이 어렵다. 그래프는 원래 figure 객체에 생성 import matplotlib.pyplot as plt i.. 2021. 1. 29.
[BOOSTCAMP AI TECH] 9일차_Pandas 2, 확률론 강의 목록 - Pandas 2 - 확률론 맛보기 요약 강의 Pandas 라이브러리의 상세한 활용법을 학습했다. 또한 딥러닝에서의 확률론을 학습하며, 확률분포와 각종 확률변수, 조건부확률 등을 학습했다. 피어세션 어제의 강의를 다시 한 번 복습하는 시간을 가진 후, 어제 풀지 못했던 의문들을 풀었다. 학습정리 Pandas import pandas as pd #groupby #sql의 groupby와 같다. #split->apply->combine 과정을 거친다. df = pd.DataFrame([[876, 1, 'Riders', 2014], [789, 2, 'Riders', 2015], [863, 2, 'Devils', 2014], [673, 3, 'Devils', 2015], [741, 3, 'Kings.. 2021. 1. 28.
[BOOSTCAMP AI TECH] 8일차_Pandas / 딥러닝 학습방법 이해하기 강의 목록 - Pandas 1 - 딥러닝 학습방법 이해하기 요약 강의 1강에서는 앞으로 사용하게 될 파이썬의 판다스 라이브러리에 대해 학습했다. 2강에서는 딥러닝의 학습방법에 대한 설명을 들었다. 피어세션 몇 차례 프로젝트에 활용한 경험이 있는 CNN과 RNN 중 조금 더 이해도가 있는 CNN에 대해 설명했다. CNN의 탄생 배경과 간략한 개념을 설명했고, LeNet-5, AlexNet, VGGNet, ResNet에 대해 설명했다. 시간관계상 GoogleNet은 생략했다. 학습정리 Pandas 구조화된 데이터의 처리를 지원하는 라이브러리 엘셀같은 테이블형 데이터를 처리하는 데 효율적이다. (데이터 테이블) numpy와 통합하여 강력한 스프레드시트 처리 기능 제공 인덱싱, 연산용 함수, 전처리 함수 제공 .. 2021. 1. 27.
[BOOSTCAMP AI TECH] 7일차_경사하강법 강의 목록 -경사하강법 (순한맛) -경사하강법 (매운맛) 요약 강의 딥러닝에서 사용될 경사하강법의 개념을 배우고, 이를 코드로 구현하는 방법을 학습했다. 피어세션 전날 수업에서 배운 내용을 복습하고, 과제 풀이의 시간을 가졌다. 또한 내일부터는 효율적인 학습을 위해 새로운 방식으로 피어세션을 진행할 것을 결정했다. 학습정리 미분 (Differentiation) 변수의 움직임에 따른 함수값의 변화를 측정하기 위한 도구 최적화에 많이 사용된다. 미분은 변화율의 극한(Limit)으로 정의한다. 파이썬에서는 sympy.diff(symm.poly(다항함수), x)로 쉽게 계산할 수 있다. import sympy as sym from sympy.abc import x x = sym.Symbol('x') xx = s.. 2021. 1. 26.
[BOOSTCAMP AI TECH] 6일차_Numpy/벡터/행렬 강의 목록 -numpy -벡터가 뭐에요? 요약 강의 파이썬에서 수학을 다루기 위한 모듈인 Numpy에 대해 자세한 사용법과 개념을 익히는 시간을 가졌다. 또한 수학의 벡터, 행렬의 자세한 개념을 학습하고 Numpy를 활용한 계산법을 학습했다. 피어세션 AI에 관련해서 많은 학습을 하신 모더레이터께 데이터 구조에 관련된 내용들과 AI를 공부하기 위한 강의와 책 추천 등을 받았다. 학습정리 Numpy 다양한 매트릭스 계산 및 처리할 때 처리 속도의 문제가 발생했다. 이러한 문제 해결을 위해 고성능 과학 계산용 패키지인 Numpy를 사용한다. Numpy는 Matrix와 Vector와 같은 배열 연산의 표준이다. 일반 리스트에 비해 빠르고 메모리 효율적임 반복문 없이 데이터 배열에 대한 처리를 지원 선형대수와 .. 2021. 1. 25.