CMMMU

Paper: CMMMU: A Chinese Massive Multi-discipline Multimodal Understanding Benchmark Project Link Publisher: Arxiv Author Affiliation: Hong Kong University of Science and Technology

Jan 22, 2024 Arxiv

MLLM-Tool

Paper: MLLM-Tool: A Multimodal Large Language Model For Tool Agent Learning GitHub Link Publisher: Arxiv Author Affiliation: ShanghaiTech University Functional Division Unders...

Jan 19, 2024 Arxiv

SkyEyeGPT

Paper: SkyEyeGPT: Unifying Remote Sensing Vision-Language Tasks via Instruction Tuning with Large Language Model GitHub Link Publisher: Arxiv Author Affiliation: Northwestern Polytechnical...

Jan 18, 2024 Arxiv

MM-Interleaved

Paper: MM-Interleaved: Interleaved Image-Text Generative Modeling via Multi-modal Feature Synchronizer GitHub Link Publisher: Arxiv Author Affiliation: Shanghai AI Laboratory Functional ...

Jan 18, 2024 Arxiv

DiffusionGPT

Paper: DiffusionGPT: LLM-Driven Text-to-Image Generation System GitHub Link Publisher: Arxiv Author Affiliation: ByteDance Inc Functional Division Understanding Generati...

Jan 18, 2024 Arxiv

α-UMi

Paper: Small LLMs Are Weak Tool Learners: A Multi-LLM Agent GitHub Link Publisher: Arxiv Author Affiliation: Sun Yat-sen University Functional Division Understanding Gen...

Jan 14, 2024 Arxiv

ModaVerse

Paper: ModaVerse: Efficiently Transforming Modalities with LLMs GitHub Link: None Publisher: Arxiv Author Affiliation: University of Adelaide Functional Division Understanding...

Jan 12, 2024 Arxiv

GroundingGPT

Paper: GroundingGPT:Language Enhanced Multi-modal Grounding Model GitHub Link Publisher: Arxiv Author Affiliation: ByteDance Functional Division Understanding Generation...

Jan 11, 2024 Arxiv

3DMIT

Paper: 3DMIT: 3D Multi-modal Instruction Tuning for Scene Understanding GitHub Link Publisher: Arxiv Author Affiliation: Beijing University of Posts and Telecommunications Functional Div...

Jan 6, 2024 Arxiv

GOAT-Bench

Paper: GOAT-Bench: Safety Insights to Large Multimodal Models through Meme-Based Social Abuse Project Link Publisher: Arxiv Author Affiliation: Hong Kong Baptist University

Jan 3, 2024 Arxiv

CMMMU

MLLM-Tool

SkyEyeGPT

MM-Interleaved

DiffusionGPT

α-UMi

ModaVerse

GroundingGPT

3DMIT

GOAT-Bench

Trending Tags