MMBenchmark

Paper: MMBench: Is Your Multi-modal Model an All-around Player? Project Link Publisher: Arxiv Author Affiliation: Shanghai AI Laboratory

Aug 13, 2023 Arxiv

MMBench-Chinese

Paper: MMBench: Is Your Multi-modal Model an All-around Player? Project Link Publisher: Arxiv Author Affiliation: Shanghai AI Laboratory

Aug 13, 2023 Arxiv

SparklesChat

Paper: Sparkles: Unlocking Chats Across Multiple Images for Multimodal Instruction-Following Models GitHub Link Publisher: Arxiv Author Affiliation: Sun Yat-sen University Functional Div...

Aug 11, 2023 Arxiv

SparklesChat's IT

Paper: Sparkles: Unlocking Chats Across Multiple Images for Multimodal Instruction-Following Models GitHub Link Publisher: Arxiv Author Affiliation: Sun Yat-sen University Multi-turn ...

Aug 11, 2023 Arxiv

Chinese-LLaVA

Paper: Chinese-LLaVA GitHub Link Publisher: Website Author Affiliation: LinkSoul-AI Functional Division Understanding Generation Design Division Too...

Aug 3, 2023 Website

ASM

Paper: The All-Seeing Project: Towards Panoptic Visual Recognition and Understanding of the Open World GitHub Link Publisher: Arxiv Author Affiliation: Shanghai AI Laboratory Functional ...

Aug 3, 2023 Arxiv

OpenFlamingo

Paper: OpenFlamingo: An Open-Source Framework for Training Large Autoregressive Vision-Language Models GitHub Link Publisher: Arxiv Author Affiliation: University of Washington Functiona...

Aug 2, 2023 Arxiv

LISA

Paper: LISA: Reasoning Segmentation via Large Language Model GitHub Link Publisher: Arxiv Author Affiliation: The Chinese University of Hong Kong Functional Division Understan...

Aug 1, 2023 Arxiv

3D-LLM

Paper: 3D-LLM: Injecting the 3D World into Large Language Models GitHub Link Publisher: Arxiv Author Affiliation: University of California, Los Angeles Functional Division Und...

Jul 24, 2023 Arxiv

MGVLID

Paper: ChatSpot: Bootstrapping Multimodal LLMs via Precise Referring Instruction Tuning GitHub Link Publisher: Arxiv Author Affiliation: MEGVII Type SFT RLHF M...

Jul 18, 2023 Arxiv