예비 대학원생의 논문 리뷰 뽀개기

  • 홈
  • 태그
  • 방명록

2026/03/03 1

[REVIEW] Flamingo : a Visual Language Model for Few-Shot Learning

(1) 어떤 문제를 해결하고 싶은가목표: multimodal(image/video + text) 모델이 few-shot in-context learning으로 새로운 시각-언어 태스크에 빠르게 적응하도록 만드는 것이다.“few-shot”은 태스크별 fine-tuning 없이, prompt에 (입력,정답) 예시를 몇 개(예: 4, 32 shots) 넣고 autoregressive generation으로 답을 생성하는 설정이다.문제의 핵심 난점:기존 CV 파이프라인은 대개 대량의 태스크별 라벨 데이터 + fine-tuning에 의존해서, 새로운 태스크/도메인에 빠르게 적응하기 어렵다.contrastive 기반 vision-language 모델(예: CLIP류)은 zero-shot 분류는 강하지만, 기본적으로..

딥러닝 논문/VLM(비전 랭귀지 모델) 딥러닝 논문 2026.03.03
이전
1
다음
더보기
프로필사진

예비 대학원생의 논문 리뷰 뽀개기

서울대 경제학과 22학번 이지원의 블로그 입니다.

  • 분류 전체보기 (61)
    • 수학 (8)
    • 경제학 논문 (1)
    • 딥러닝 논문 (44)
      • 랭귀지 딥러닝 논문 (7)
      • 비전 딥러닝 논문 (7)
      • VLM(비전 랭귀지 모델) 딥러닝 논문 (7)
      • VLA(비전 랭귀지 액션) 딥러닝 논문 (2)
      • 시계열 딥러닝 논문 (13)
      • 강화학습 (2)
    • 랩세미나 랩미팅 (1)

Tag

최근글과 인기글

  • 최근글
  • 인기글

최근댓글

공지사항

페이스북 트위터 플러그인

  • Facebook
  • Twitter

Archives

Calendar

«   2026/03   »
일 월 화 수 목 금 토
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31

방문자수Total

  • Today :
  • Yesterday :

Copyright © AXZ Corp. All rights reserved.

티스토리툴바