본문 바로가기

전체 글64

시작 전 훑어보기: 뭘 해야하나? 목표는 정했는데, 아직 아는 게 하나도 없다. 따라서, 오늘은 뭘 해야 하는지 좀 더 세밀하게 생각해 보자. 그리고 이런 걸 기가 막히게 도와주는 친구가 있다. 요약하면, 게임을 강화학습으로 학습하기 위해서는 게임 환경 구현, 상태 정의, 보상 함수 정의, 강화학습 알고리즘 선택, 데이터 수집, 학습과 평가 총 6가지가 존재한다. 그럼 우선적으로 게임 환경 구현 은 어떻게 해야 하는지 찾아보자. 두 가지 방법이 있는데, 게임 코드를 직접 구현하는 것과 게임 인터페이스를 사용하는 것 두 가지가 존재한다. 일단 게임자체를 구현하는 것도 문제지만, 가장 문제가 되는 것은 속도이다. 강화학습은 학습과정에서 수많은 시뮬레이션 과정이 동반되기 때문에, 게임진행속도가 빨라야 매우 유리하다. 관련 정보를 찾기 위해, .. 2023. 4. 1.
프롤로그: 강화학습 프로젝트 안녕하세요! 오늘은 새로운 프로젝트를 시작하려고 합니다. 이번 프로젝트의 주제는 "Slay the spire" 게임을 강화학습을 이용하여 정복하는 것입니다. "Slay the spire"는 카드 덱 구성과 전략적인 게임 방식으로 유명한 게임입니다. 이번 프로젝트에서는 이 게임을 처음부터 구현하고, 강화학습 알고리즘을 적용하여 최고 점수를 기록하는 것이 목표입니다. 이 게임의 모든 환경을 구현하며, 강화학습 알고리즘을 적용하기 위해 TorchRL과 같은 강화학습 라이브러리를 사용할 예정입니다. 이번 프로젝트에서는 파이썬 프로그래밍 실력을 향상하기 위해 프로그래밍에 많은 시간을 투자할 예정입니다. 또한, TorchRL과 같은 강화학습 라이브러리를 사용하는 방법을 배우고, 다양한 강화학습 알고리즘을 적용해 보.. 2023. 3. 31.
한국의 AI트렌드 확인하기:AI경제연구소 https://youtube.com/playlist?list=PLl8_wapZ3Ft8K6TUwzhKXiAJR2S1sPStk 한국공학한림원 공동 포럼 www.youtube.com 한국경제신문에서 만든 AI관련 채널이다. 이 채널의 장점 참여하는 패널들의 전문성 하정우 네이버 AI랩 소장님, 카이스트의 주재걸 교수님, 과학기술정보통신부, AI반도체 담당의 윤두희 과장님 등이 패널로 참여하였다. 현업 트렌드 확인 AI을 활용하는 기업에서 발표를 하기 때문에 실제 기업의 목표나 트렌드를 확인할 수 있다. 본인의 기업 홍보를 목적으로 하는 발표도 있는 것 같아(스타트업의 경우가 약간 그랬다.) 어느정도 비판적인 태도가 필요할 수 있다. AI반도체 관련 정책을 직접 담당하는 분께서 향후 지원정책을 소개해 주셔서 우.. 2023. 3. 26.
챌린저스: 의지박약을 위한 습관 형성 앱 챌린저스는 목표로 하는 습관을 만들도록 도움을 주는 앱이다. 구글 플레이스토어와 애플 앱스토어 모두에서 다운로드 받을 수 있다. https://chlngers.com/ 대한민국 1등 건강습관 앱, 챌린저스 눈 뜨는 것부터 먹는 것까지, 더 건강하게 chlngers.com 나는 이 앱을 사용해서 다음과 같은 습관을 유지하고 있다. 아침 7시에 일어나서 산책 1시간하기 하루에 1만보 이상 걷기 블로그 글 작성 습관을 형성하는 가장 간단하면서도 효과적인 방법은 보상과 패널티를 사용하는 것이다. 챌린저스 앱을 이용하면 원하는 습관(예: 아침 6시에 일어나기)을 설정하고 참가비(1-20만원)를 지불하여 참가할 수 있다. 참가비는 해당 습관을 100% 달성하면 보너스가 추가된 금액으로 환급되며, 85% 이상은 유지.. 2023. 3. 25.