전체 글65 how to random masking in Huggingface. 문장에 랜덤마스킹을 하고싶은데, 어떻게 하는지 기억이 안나서 찾은김에 기록하기로 했다. 아주 간단하다. transformer에서, DataCollatorForLanguageModeling을 임포트한다. 그 뒤 사용할 토크나이저와 mlm, mlm_probability(마스킹 비율), return_tensors(리턴할 텐서 타입)을 넣어주면 끝이다. # transformer import from transformers import DataCollatorForLanguageModeling, AutoTokenizer # 토크나이저 선언 tokenizer = AutoTokenizer.from_pretrained("klue/roberta-large") # DataCollator선언. mask_datacollator.. 2022. 11. 24. 오토인코더의 모든것. 임시저장하면 안올릴거 같아서 걍올림(1강까지만 작성) AUTOENCODER의 4가지 키워드 Unsupervised learning Manifold learning Generative model learning ML density estimation Autoencoder를 학습할 때: 학습 방법은 비지도 학습 방법을 따르며, -> Unsupervised learning Loss는 negative ML로 해석된다. -> ML density estimation 학습된 Autoencoder에서: 인코더는 차원 축소의 역할을 수행하며, -> Manifold learning 디코더는 생성 모델의 역할을 수행한다. -> Generative model learning 01. Revisit Deep Neural Netw.. 2022. 11. 23. 2차원 리스트 파이써닉하게 출력하기. answer = [ ["1", "2", "3"], ["4", "5", "6"], ["7", "8", "9"] ] print("\n".join(map(" ".join, answer))) 2022. 11. 12. 2022 LG CNS Code Monster 예선회고 개요 프로그래머스에서 주관한 코딩 테스트 선발 대회. 그냥 코딩 테스트 연습하러 프로그래머스 들어갔는데 접수가 이틀 남았고, 이번 주말에 바로 예선이어서 신청해봤다. 3시간 정도에 4문제를 해결하는 코딩 테스트였다. 회사마다 다른 것 같지만, 인턴 코딩 테스트가 2시간이고, 카카오가 4시간에 5~7문 제정도 것 같으니 중간 정도 시간이었던 것 같다. 히든 테스트 케이스 통과 여부는 주어지지 않았다. 코딩 테스트를 여러 번 해보면서 느낀 건데, 1차에서는 보통 히든 테케 통과여부가 주어지지 않고, 2차에서는 보통 히든 테케 통과 여부를 준다. 사실 히든테케 통과 여부를 안 주면 이전에는 상당히 불쾌했다. 약간 정답 여부를 바로 알 수가 없다 보니 찝찝한 느낌? 카카오 코딩 테스트를 설계했던 분께서도 히든테.. 2022. 11. 12. 이전 1 ··· 6 7 8 9 10 11 12 ··· 17 다음