본문 바로가기 메뉴 바로가기

스터디 기록장

프로필사진
  • 글쓰기
  • 관리
  • 태그
  • 방명록
  • RSS

스터디 기록장

검색하기 폼
  • 분류 전체보기 (39)
    • 코딩 (7)
      • 알고리즘 (1)
      • 팁 (1)
      • Python (1)
    • AI (5)
    • 프로젝트 (6)
      • 뿌요뿌요 테트리스 (4)
      • 슈룹 - 우산 공유 플랫폼 (1)
      • web code runner (1)
    • 끄적끄적 (4)
      • 회고 (4)
    • Web (3)
    • Infra (6)
    • Mobile (3)
      • Flutter (3)
    • CS (5)
      • OS (4)
    • research (4)
  • 방명록

GPT2 (1)
[CS 224N] GPT-2 구현 (embedding, attention)

해당 프로젝트에서 GPT-2 모델을 구현하면서, 핵심 컴포턴트인, attention layer, postion embedding을 직접 구현이후 HuggingFace에서 제공하는 pretrained weight를 로드해서 downstream task에 적용CS 224N final projectyou will build GPT-2, the precursor of OpenAI’s ChatGPT language model. Specifically, you will implement some of the most important components of the architecture, load the official model weights from HuggingFace into your implementat..

AI 2025. 6. 14. 18:38
이전 1 다음
이전 다음
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
  • Git
TAG
  • pvm
  • GPT2
  • ttyd
  • 분할 정복
  • 뿌요뿌요
  • 정보보호병
  • 뿌요뿌요 테트리스
  • pintos
  • 웹IDE
  • os
  • 구름ide
  • react
  • 시간 초과
  • 프로젝트
  • 리눅스
  • FastAPI
  • io blocking
  • Python
  • C
  • 토이프로젝트
  • HNSW
  • 백준
  • letsencrypt
  • Web
  • vector search
  • 싸지방
  • Deep Learning
  • 사이버정보지식방
  • 코딩
  • codeanywhere
more
«   2025/07   »
일 월 화 수 목 금 토
1 2 3 4 5
6 7 8 9 10 11 12
13 14 15 16 17 18 19
20 21 22 23 24 25 26
27 28 29 30 31
글 보관함

Blog is powered by Tistory / Designed by Tistory

티스토리툴바