ABC 부트캠프 6

ABC 부트캠프 day8 : 프로젝트 중간발표

다른 조 발표 피드백 정리와 우리조에 추가하고 싶은것 문제점을 설명할 때 장애인 수가 늘고 있다 -> 장애인 인식 개선의 필요성 ? 논리적인 과정으로 설명하자 찾자 근거를 명확하게 데이터 증강 수로 표현하기 모델 선정 이유 더 자세하게 적기 (F1 스코어, 소수점 2자리 까지) 약자 사용하지말고 모델 설명 더 자세하게 차이 설명 (내가 안다고 모두가 다 알거라는 착각 하지말자) 모델에 깊이 특징까지 UI 를 잘만들어보자 소감? 넣을지 말지 고민 역할에 학과 넣기 페이지 번호넣기 -> 크게 주제 필요성 설명할때 1. 그래프 잘선택하기 2. 비중을 볼때 원그래프 3. 인용할 때 잘 걸러서 생각하기 4. 근거 레퍼로 넣기 밑으로 자기소개 자신감있게! 수동태 사용 x ( 생각됩니다. x 생각합니다 o) 시간 역..

ABC 부트캠프 2024.01.24

ABC 부트캠프 day5 : 초거대언어모델 & 생성형 AI 핸즈온

..... ai -> ml -> ann(인공신경망) -> dl(딥러닝) 자연어 처리의 역사 2017 - google에서 개발한 transformer 이전과 이후로 나뉨 성능자체는 획기적이지 않았지만 순환 또는 합성곱 레이어 기반 아키텍처 보다 훨씬 더 빠르게 트레이닝 할 수 있음 기존 언어 모델들은 병렬처리로 하기가 힘들엇지만 transformer는 병렬처리가 가능하기 때문에 시간을 크게 줄일 수 있음. GPT : 학습을 시킬땐 전체를 학습을 시키지만 인코더를 사용하지않고 디코더만 사용함. 인코더 : 고양이 사진 -> 식별 AI -> 고양이 디코더 : 고양이 -> 식별 AI -> 고양이 사진 = 생성형 ai를 가능하게함 BERT : 디코더를 사용하지 않고 인코더만 사용한 모델 (성공하진 못함) 모델이 클..

ABC 부트캠프 2024.01.19

ABC 부트캠프 day4 : 딥러닝 활용

...숫자인식을 할때 랜덤한 결과값보다 연속적인 결과값으로 학습시켰을때 더 학습이 잘될까? 더 잘안될까? 중간층을 내맘대로 늘려도 괜찮다. 시간이 오래걸린다. 학습이 더 잘될수도 있다. 이때 유닛수를 적절하게 선택하는것이 데이터과학자의 역량이다. 어제보다 학습이 확실히 잘됐다. 결과를 보고 epoch와 dense층의 갯수 각각의 노드수를 여러가지로 실행해보자 감을 잡아보자. 많은 dense층의 부작용 질문 이미 마지막 층이 학습을 다 완료해버리니까 앞에 사람들은 학습을 못해서 딥러닝으로 학습하지 못하게 했지만 relu 함수의 발견으로 시그모이드보다 온오프 해주기 때문에 또한 골고루 학습하고 싶어서 drop out을 통해 랜덤으로 학습시키면서 딥러닝이 지금은 많이 학습해도 괜찮다. epoch를 높은 값으로..

ABC 부트캠프 2024.01.18

ABC 부트캠프 day3 : 딥러닝 기초 및 실습

오늘 실습할 주제: – 다중 분류: MNIST 0-9까지 숫자 이미지 예측하기 – 회귀 문제: 자동차 연비 예측하기 – 이미지 인식: 강아지 고양이 이미지 예측하기 MNIST는 딥러닝계의 "Hello World" train 은 6만건, test는 1만건(성능평가) 트레인 데이터에서 만건정도 떼어서 검증데이터(val) 로 사용하고 싶다 (쪽지 시험) 중간중간에 한번씩 학습하지 않은 데이터를 주면서 잘 학습되고 있는지 확인한다. 보통 7:3으로 비율을 나눔 하지만 훈련데이터가 부족할 경우 사용하지 않아도 된다(필수는 아님) 이유는 검증데이터는 학습시키는 데이터가 아니기때문에 데이터셋이 충분히 확보 되있을때만 사용한다. x_train, x_val, y_train, y_val = train_test_split(..

ABC 부트캠프 2024.01.17

ABC 부트캠프 day2 : 머신러닝 딥러닝 기초

머신러닝과 딥러닝 기초 인공지능의 정의를 개인이 내리는 것이 중요함 -> 사람처럼 하는 프로그램 프로그래밍과 머신러닝의 차이 머신러닝 : 데이터를 사용해서 해결패턴을 스스로 찾아냄 딥러닝 : 머신러닝의 한 방법중 하나, 그동안 머신러닝으로 해결되지 않았던것 ex) 컴퓨터 비전 을 해결하는 해법중 하나 머신러닝의 세가지 학습방법 지도학습 : 오늘 배울 내용 거의 90% 이상이 지도학습( 문제집, 정답) (독립변수, 종속변수)(특성feature, 레이블targer)(x, y) 1) 이진분류 : 정답이 둘중 하나인경우 ex) 삶 2) 다중분류 : 정답이 여러개 중에 하나인 경우 ex) 차종, 학년 3) 회귀 : 연속적인 값을 예측하는 것(수치) ex) 관객수, 투자 비지도 학습 : 정답이 있는 데이터가 아닌 ..

ABC 부트캠프 2024.01.16

ABC 부트캠프 day1 : 데이터 수집을 위한 크롤링

간단하게 오리엔테이션과 자기소개를 진행하고 바로 크롤링 수업에 들어갔다. 크롤링을 하기 위해선 html 구조를 간단히라도 알아야하는데 구조를 담기 위한 태그 목록 // 리스트 // 반복되는 값을 담기위한 태그 // 페이지 이동을 위한 태그 url 값이 있다. href:"~" = 속성 atribute 이동을 하는건 a 태그의 기능이고 안에 들어있는 텍스트를 추출하려면 기사제목 텍스트로 기사제목 을 추출하고 상세주소는 속성값을 가져와야함 크롤링 주제는 네이버 언론사별 랭킹뉴스 크롤링 및 데이터 시각화 우선 코랩에 접속하여 파일을 만들고 목차에 담아 코딩을 진행하였다. 파이썬은 많이 다뤄봤지만 코랩에서 쓰는것은 처음이여서 초반에 많이 헤맸다.. 하지만 옆자리 동기가 잘알려주어서 극복 첫번째로 패키지 준비하기 ..

ABC 부트캠프 2024.01.15