본문 바로가기
5. 활동/KT AIVLE AI 3기

KT AIVLE AI 3기 ┃ 12주차(4.17 ~ 4.21) - 미니 프로젝트 6차 & 1차 AIVLE DAY

by 로기(dev-loggi) 2023. 4. 22.

12주차(4.17 ~ 4.21) 일정

날짜 주제 카테고리
4/17 (월) 미니 프로젝트 6차 - (1) 언어 지능
4/18 (화) 미니 프로젝트 6차 - (1) 언어 지능
4/19 (수) 미니 프로젝트 6차 - (2) 시계열 데이터 예측
4/20 (목) 미니 프로젝트 6차 - (2) 시계열 데이터 예측
4/21 (금) 1차 AIVLE DAY AICE Associate 시험 & 특강 & 랜선 회식

 

4/17(월) ~ 4/18(화) ┃ 미니 프로젝트 6차 - (1)

주제: AIVLE SCHOOL 질문 답변 챗봇 만들기

  • 데이터: AIVLE SCHOOL 홈페이지 Q&A 기반 자체 제작 Text 데이터
  • 유형: Intent Classification 기반 챗봇

 

데이터 탐색

  • intent별 문장 길이, 단어 개수 분포 확인

데이터 전처리

  • KoNLPy 형태소 분리

모델 학습 및 예측/평가

  • Word2Vec
  • LSTM
  • FastText

 

더보기

접은글

 

4/19(수) ~ 4/20(목) ┃ 미니 프로젝트 6차 - (2)

주제: 서울시 장애인 콜택시 대기시간 예측

  • 데이터: 서울시 장애인 콜택시 운행 정보 데이터, 날씨 정보 데이터

데이터 전처리

  • 시계열 패턴 분석을 위해 날짜 변수에서 년, 월, 일, 요일, 공휴일 등의 변수를 추가한다
  • 시계열 예측 모델에 맞게 데이터 구조를 만들기 위해 target과 날짜 관련 변수를 shift(-1) 한다
  • 예측에 도움을 줄 날씨 정보 데이터를 결합한다

데이터 탐색 (EDA)

  • 단변량 분석
  • 다변량 분석
  • 관련성 높은 변수 정리

모델 학습 및 예측/평가

  • ML 모델 - Logistic Regression, RandomForest, LGBM, Catboost 비교 평가
  • DL 모델 - DNN, RNN 비교 평가

 

더보기
  • 시계열 예측
 

Forecasting: Principles and Practice

2nd edition

otexts.com

 

3.3.7.시계열분석

# 시계열 자료 + 시간의 흐름에 따라 관찰된 값들 + 주식가격 데이터, 실업률, 기후데이터 등 + 시계열 데이터의 분석 목적 + 미래의 값을 예측 + 특성파악 + …

wikidocs.net

 

1. 시계열 예측이란?

시계열 예측(Time-Series Forecasting)이란? 시계열(Time-Series) 데이터란 시간의 흐름에 따라 순차적으로(sequentially) 기록된 데이터를 가리킨다. 관측된 시계열 데이터를 분석하여 미래를 예측하는 문제

undeadkwandoll.tistory.com

 

  • 시계열 정상성(Stationarity)
 

시계열 분석 시리즈 (1): 정상성 (Stationarity) 뽀개기

이번 포스팅은 실전 시계열 분석: 통계와 머신러닝을 활용한 예측 기법 책과 Forecasting: Principles and Practice책을 기반으로 정상성에 대해 자세하게 정리하였습니다.

assaeunji.github.io

 

시계열 정상성 (Stationarity), 들어봤니? - 알아보자 시계열 분석 Episode 2

시계열 데이터의 중요한 특징 중 하나인 정상성(stationarity)에 대한 글입니다. 정상성이란 무엇이고 왜 중요한지, 어떤 시계열 데이터가 정상적인지, 비정상적인 시계열을 어떻게 정상 시계열로

modulabs.co.kr

 

  • 평가 지표
 

[BASIC] 대회에서 자주 사용되는 평가산식들에 대한 정리✏️ (1) 회귀모델 평가산식

 

dacon.io

 

머신러닝 회귀 모델의 평가 지표 (1)

머신러닝을 활용할 때 올바른 평가 지표를 사용하는 것은 매우 중요합니다.

velog.io

 

 

4/21 (금) ┃ 1차 AIVLE DAY

1) AICE Associate 시험

  • 시험 시간: 10시 ~ 11시 30분 (1시간 30분)

AICE 홈페이지내의 Jupyter Notebook 시험 환경을 통해 주어진 주제와 데이터셋을 활용하여 데이터 전처리부터 ML/DL 모델 학습/예측/평가 과정을 문제 가이드에 따라 프로그래밍으로 구현하는 시험이다. AI 개발 프로세스 전반에 대한 이해와 라이브러리 활용 능력을 어느 정도 갖추고 있으면 충분히 통과할 수 있는 난이도였다.

 

2) AI 특강

주제: AI 트렌드

  • 자연어처리와 컴퓨터비전
  • 데이터 사이언스
  • AI 트렌드

오랜 기간 자연어 처리 분야에서 연구/개발 했던 경험을 공유해주시기 위해 커리어가 굉장하신 분이 오셔서 강연을 해주셨다. 자연어 처리의 기본 원리와 개념, 그리고 과거의 Rule-based Model 부터 End-to-End, 그리고 현재의 거대한 Pretrained 모델이 탄생하게 된 배경과 역사에 대해 들려주셨다. 또한, 자연어 처리계에서 GPT3 의 영향력과 파급 효과에 대해 설명해 주시면서 앞으로는 모델링에 관한 연구보다는 BERT나 GPT와 같은 거대 Pretrained 모델을 특정 도메인에 맞게 파인튜닝하여 적절하게 사용하는 것이 중요하다고 하셨다.

 

3) 랜선 회식 & 우리반 소통

12주간 Step1의 AI 커리큘럼을 모두 마친 기념으로 팀즈에서 각 반끼리 모여 랜선 회식을 하며 소통하는 시간을 갖었다. 매니저님 주도 하에 간단한 퀴즈 게임도 하고 지금까지 에이블 활동을 통해 느낀 소감이나 하고 싶은 말을 익명 게시판을 통해 공유하면서 놀았는데, 그렇게 조용하던 우리반 친구들이 익명이 되자 놀라울 정도로 많은 글이 올라왔다. 아무래도 다들 바쁜 수업 일정 소화하랴 취업 준비 병행하랴 등등 시간이 정신없이 흘러가는 사이에 서로 소통할 시간도 많이 부족했고, 비대면이라 친해지기도 어려운 환경이라 더욱 그랬던 것 같다. 그래도 이렇게나마 반친구들의 생각들을 들을 수 있어서 좋았고, 아직 step2와 가장 중요한 빅프로젝트도 남았기 때문에 앞으로는 우리반끼리 더욱 똘똘 뭉쳐서 다같이 화이팅했으면 좋겠다.

 

 

(+ 3반 오프라인 모임)

우리 3반 반장님이 오프라인 모임을 추진해주셔서 에이블 데이 수업을 마친 후 치맥과 함께 금요일을 불태웠습니다!! 오늘 처음 뵙는 팀원도 있었지만 대부분 미니 프로젝트에서 교육장이나 줌 미팅에서 만났던 분들이어서 다들 너무 반가운 얼굴들이었네요😄 2차로 넘어가서 찍은 사진이라 태양님과 용주님은 아쉽게도 사진에 없지만 다들 너무 반가웠고 다음 2차 에이블 데이때 또 만나요🙋‍♂️

댓글