일 | 월 | 화 | 수 | 목 | 금 | 토 |
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 | 29 |
30 | 31 |
- Data-centric
- Segment Anything 설명
- Meta AI
- ssl
- Prompt Tuning
- active learning
- iclr 2024
- Stable Diffusion
- Data-centric AI
- iclr 논문 리뷰
- Computer Vision 논문 리뷰
- deep learning 논문 리뷰
- 논문 리뷰
- Prompt란
- Multi-modal
- 논문리뷰
- Self-supervised learning
- 자기지도학습
- Segment Anything
- ai 최신 논문
- Segment Anything 리뷰
- cvpr 2024
- cvpr 논문 리뷰
- iclr spotlight
- deep learning
- Computer Vision
- contrastive learning
- Today
- Total
목록ai 최신 논문 (6)
Study With Inha

ICLR 2023 Spotlight (notable-top-25%),(SparK) Designing BERT for Convolutional Networks: Sparse and Hierarchical Masked Modeling논문 링크: https://openreview.net/forum?id=NRxydtWup1SGitHub: https://github.com/keyu-tian/SparK Designing BERT for Convolutional Networks: Sparse and Hierarchical...This paper presents a simple yet powerful framework to pre-train convolutional network (convnet) with Sparse..

ICLR 2024 Oral Paper,Is ImageNet worth 1 video?Learning strong image encoders from 1 long unlabelled video논문 링크: https://openreview.net/forum?id=Yen1lGns2o Is ImageNet worth 1 video? Learning strong image encoders from 1...Self-supervised learning has unlocked the potential of scaling up pretraining to billions of images, since annotation is unnecessary. But are we making the best use of data? H..

CVPR 2024 Highlight Paper, Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images 논문 리뷰Paper Link: https://arxiv.org/pdf/2403.12570GitHub Link: https://github.com/MediaBrain-SJTU/MVFA-AD 1. Introduction여러가지 Modality를 하나의 모델로 다루는 연구가 지속됨에 따라서, 최근 Visual-Language Model (VLM)이 괄목할만한 성능을 보이고 있다.하지만 CLIP을 포함한 대부분의 VLM은 대용량의 Natural image들로 pretrain되었기에, Domain Gap이나 Tas..

CVPR 2024, Open-World Semantic Segmentation Including Class Similarity논문 링크: https://www.ipb.uni-bonn.de/wp-content/papercite-data/pdf/sodano2024cvpr.pdfGitHub 링크: https://github.com/PRBonn/ContMAV 1. Introduction컴퓨터 비전 기술이 실제 산업에 많이 적용됨에 따라서 조금더 넓은 coverage를 가진 기술에 대한 관심이 많아지고 있다.본 논문도 컴퓨터 비전 task의 coverage를 넓히는 것을 목표로 하는 논문으로, Open World에서 발생하는 문제를 해결하고자 한다.Closed world: 정해져 있는 class 중에 정답을 맞추..

ICLR 2024, Interpreting CLIP's Image Representation via Text-Based Decomposition 논문 링크: https://openreview.net/attachment?id=5Ca9sSzuDp&name=pdf프로젝트 페이지 링크: https://yossigandelsman.github.io/clip_decomposition/ 1. Introduction최근 많은 논문들에서 거대한 Text, Image Pair로 학습시킨 CLIP 모델을 활용하는 후속 연구들을 진행하고 있다.본 논문에서는 CLIP의 이미지 인코더를 분석하여 모델의 각 구성 요소가 final representation에 미치는 영향을 해석 가능한 텍스트로 설명하고 있다.먼저, Attentio..

ObjectLab: Automated Diagnosis of Mislabeled Images in Object Detection Datahttps://arxiv.org/pdf/2309.00832.pdf 1. Introduction아래 링크의 글에서 볼 수 있듯이, 잘못된 GT를 가진 Dataset으로 학습된 모델의 경우 그 성능이 낮아질 수 있다.이를 방지하기 위해서 연구되는 분야가 Data-centric AI에서 'Data Preparation' 단계의 'Data Cleaning'이다.[Computer Vision 시리즈물 연재] - [Data-centric AI - 1편] DCAI 소개 [Data-centric AI - 1편] DCAI 소개 및 Data-centric AI: Perspectives a..