본문 바로가기

KT AIVLE3

KT AIVLE AI 3기 ┃ 1주차(1.31 ~ 2.3) - OT, Git, Python 1주차(1.31 ~ 2.3) 일정 일차 날짜 주제 카테고리 - - - - Day 1 1/31 OT OT, 전문가 특강 Day 2 2/1 Git Git, Github Day 3 2/2 Python 알고리즘 기초, 반복 알고리즘 Day 4 2/3 Python 자료구조와 배열, 검색 알고리즘 [Day 1, 1/31] OT, 전문가 특강 일정 요약 전체 오리엔테이션 반별 오리엔테이션 전문가 특강(KT AI2XL 배순민 소장님, KAIST 조대곤 교수님) 더보기 KT AI2XL 의 배순민 소장님께서는 AI, Big Data 산업에 대한 개요와 KT DIGICO 사업에 대해 설명해 주셨다. KAIST 조대곤 교수님께서는 재미있고 다양한 데이터 분석 사례들을 엄청 많이 소개해주셨고, 그 속에서 발상의 전환과 생각의 .. 2023. 1. 31.
[KT AIVLE 3기] 사전 강의 3주차 목차 5-1. [데이터 분석 이해와 실무] 가설의 의의와 검정 1) 가설 검정의 의미 모집단에 어떤 가설을 설정한 뒤, 해당 가설에 대해 통계적 추론으로 가설의 채택 여부를 확률적으로 판정하는 방법 기존 이론을 의미하는 귀무가설(H0)과 연구자의 주장인 대립가설(H1)이 존재 2) 가설 검정 방법 종속변수와 독립변수의 유형에 입각하여 검정 방법을 설정(예: 단일 집단 평균 검정, 독립 표본 t 검정 등) 3) 가설 검정의 오류 제1종 오류: 귀무가설이 참이지만 기각을 할 경우 생기는 오류, "유의수준"이라고 불림 제2종 오류: 귀무가설이 거짓이지만 기각하지 못할 경우 생기는 오류 5-2. [데이터 분석 이해와 실무] 상관분석 1) 상관관계 상관관계는 변수 간의 상호 관련성을 의미하며, 관계성의 정도는 통.. 2023. 1. 27.
[KT AIVLE 3기] 사전 교육 2주차 목차 3-1-1. [데이터 전처리 이해와 실무] 데이터 정제 - 결측 데이터 처리 1) 결측치(Missing Value) Null, NA, NAN 데이터가 수집되지 않거나 누락되어 정보(값)가 존재하지 않음을 의미 결측치가 보함된 데이터는 모델 학습이 불가능하므로 반드시 사전에 결측치 처리를 진행해야 한다 2) 결측치 발생 원인 미수집 시스템오류 신규항목 3) 결측치 처리 방안 결측치 제거하기 가장 쉬운 처리 방안(단, 데이터 손실이 발생한다) Listwise deletion: 결측치가 존재하는 행 삭제 -> df.dropna() Pairwise deletion: 모든 값이 결측치로만 존재하는 행 삭제 -> df.dropna(how='all') 결측치 대체하기 정보의 손실을 방지하나 변수 특성(평균, 상.. 2023. 1. 16.