
해당 프로젝트에서 GPT-2 모델을 구현하면서, 핵심 컴포턴트인, attention layer, postion embedding을 직접 구현이후 HuggingFace에서 제공하는 pretrained weight를 로드해서 downstream task에 적용CS 224N final projectyou will build GPT-2, the precursor of OpenAI’s ChatGPT language model. Specifically, you will implement some of the most important components of the architecture, load the official model weights from HuggingFace into your implementat..
AI
2025. 6. 14. 18:38
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- pvm
- GPT2
- ttyd
- 분할 정복
- 뿌요뿌요
- 정보보호병
- 뿌요뿌요 테트리스
- pintos
- 웹IDE
- os
- 구름ide
- react
- 시간 초과
- 프로젝트
- 리눅스
- FastAPI
- io blocking
- Python
- C
- 토이프로젝트
- HNSW
- 백준
- letsencrypt
- Web
- vector search
- 싸지방
- Deep Learning
- 사이버정보지식방
- 코딩
- codeanywhere
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
글 보관함