일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 백트래킹
- 플로이드 와샬
- DP
- BFS
- dropout
- tensorflow
- pytorch
- c++
- 미래는_현재와_과거로
- 우선 순위 큐
- 다익스트라
- 알고리즘
- NEXT
- lazy propagation
- 가끔은 말로
- 분할 정복
- object detection
- back propagation
- 문자열
- 너비 우선 탐색
- 2023
- 회고록
- dfs
- 자바스크립트
- 크루스칼
- 조합론
- 이분 탐색
- 세그먼트 트리
- 가끔은_말로
- Overfitting
Archives
- Today
- Total
목록Multi-Modal (1)
Doby's Lab
CLIP, 단순한 분류의 시대는 지났다
✅ Intro LLaVA-Med를 공부하면서 Visual Encoder로 CLIP(Contrastive Language-Image Pre-training)이 사용되어 이번 기회에 공부를 해보았습니다. CLIP은 기존 Classification 방식에서 새로운 메커니즘을 제안했습니다. Classification은 수많은 데이터셋에서 라벨링 된 클래스로 분류하는 것이 일반적인 특징입니다. 하지만, 세상에는 여러 가지 사물이 존재하며, 이 사물 또한 어떠한 상태에 있냐에 따라 분류를 할 수 있는 범위는 셀 수 없을 정도로 많습니다. 예를 들어, '일반적인 자전거'와 '바퀴가 없는 자전거'라는 Task로 수많은 사물들이 더 디테일한 description을 원할 때, 단순한 Classification Task만으..
Multi-Modal
2024. 2. 14. 16:58