본문 바로가기

일기5

근데 이제 뭐함?: 부스트캠프4기가 끝나고 한달 뒤 후기 1편 한 줄 요약: 몰루 부스트캠프 AI Tech 4기가 끝나고 한달? 정도 지난 것 같다. 궁금해 하는 사람들도 있을 것 같아서 간단하게 적어보려 한다. 먼저 부스트캠프 AI Tech에 대해 모르는 사람이 있을 것 같아 간단하게 설명하면, 인공지능에 대해 가르치는 교육프로그램이다. 총 5개월동안 진행해서 10월 시작 ~ 2월 초 수료를 했던 것 같다.(5기는 지금 3주차 과정정도 진행중이다.) 다른 인공지능 교육 프로그램을 안들어봐서 다른 프로그램과 할 수 없지만, 대체로 수강생들은 만족하는 것 같다. 간단히 입과 전 나의 상태에 대해 적어보았다. 부스트캠프 입과 전 나의 상태 기술적 상태 비전공자임(기계공 2학년) 인공지능 진짜 1도 몰름(입과 1달전 fastai라는 프레임워크 써봄, 파이토치 안 써봄) .. 2023. 3. 23.
어제 오늘 뭐했나. 11/4 그 전 일기에서 했던 실험 리포트 1.특정 카테고리의 데이터만 여러번 넣어서 학습함 확실히 그 특정 카테고리는 학습이 잘 되었지만, 오버피팅이 난 건지, 그 외의 카테고리 데이터는 오히려 예측 오차가 커져서 전체적인 성능이 떨어졌다... -> 만약 predict데이터에, 어떤 카테고리인지 나와 있다면, 전체 데이터를 모델에 학습시키고, 추가로 classifier를 카테고리별로 만들어서, 카테고리 데이터만 학습시켜서, 카테고리별로 예측을 한다면 성능이 오를 수 있을 것 같다.(물론 대회가 끝나고 알았다.) 2.regex문법을 이용하여, 쉼표, 느낌표, 물음표, ㅋ, ㅎ, a, b를 제거한 뒤 학습 이러한 토큰들이 문장의 핵심내용을 희석하지 않을까 라는 생각이 들어 실험을 진행한 것이었는데, 트랜스포머에서는.. 2022. 11. 4.
오늘 뭐했나 11/1 개요 U스테이지에서, model이 현재 어떤 부분에 대해 학습이 부족한지 알아야 할 필요가 있었다. 따라서 템플릿에 model의 prediction과 실제 label의 차이값을 체크하는 prediction check기능이 필요하게 되었고, 해당 기능을 제작하는 것이 오늘의 주요일과였다. 이슈1 prediction check기능이 test dataset에서는 잘 작동했지만, dev dataset과 train dataset에서는 잘 작동하지 않았다. 해결 pl.trainer의 predict메소드를 실행시켰을 때, template의 Dataloader가 test dataset과 predict dataset 객체만 생성하도록 정의 되어있던 것이 문제였다.(메모리 때문에 predict에 필요한 두개만 메모리에 저.. 2022. 11. 2.
오늘 뭐했나-10/28, 10/31 개요 실험을 하기위해, victory-resque의 pytorch-template를 사용해왔다. pytorch-lightning을 wandb를 배우고, 이를 pytorch-template에 이식을 하는 작업을 수행했다. issue1: wandb의 json config인식 불가 문제! 그런데, pytorch-template의 json config file이 wandb 프로젝트의 config에 인식이 안되는 issue가 있었다. (wandb는 json 대신 yaml을 config file로 사용하는 것을 권장함.) wandb의 프로젝트 관리 용이성과, sweep를 통한 hyperparameter최적화를 이용하기 위해서는 템플릿 수정이 불가피했다. 해결 yaml기반의 config관리로 템플릿을 수정했다.(NL.. 2022. 10. 31.