awesome-prompting-on-vision-language-model

This repo lists relevant papers summarized in our survey paper: A Systematic Survey of Prompt Engineering on Vision-Language Foundation Models.

513

GitHub Stars

115

Curated Resources

Use this list with your AI agent

Add the Context Awesome MCP server to Claude, Cursor, or any MCP client, then ask:

"Show me applications & responsible ai resources from awesome-prompting-on-vision-language-model"

Benchmarking Robustness of Adaptation Methods on Pre-trained Vision-Language ModelsPrompting Models in Multimodal-to-Text Generation (e.g. on Flamingo)
NeurIPS
BLIP-2: Bootstrapping Language-Image Pre-training with Frozen Image Encoders and Large Language ModelsPrompting Models in Multimodal-to-Text Generation (e.g. on Flamingo)
ICML
Chain-of-Thought Prompting Elicits Reasoning in Large Language ModelsPrompting Models in Multimodal-to-Text Generation (e.g. on Flamingo)
NeurIPS
Compositional Exemplars for In-context LearningPrompting Models in Multimodal-to-Text Generation (e.g. on Flamingo)
ICML
Flamingo: a Visual Language Model for Few-Shot LearningPrompting Models in Multimodal-to-Text Generation (e.g. on Flamingo)
NeurIPS
InstructBLIP: Towards General-purpose Vision-Language Models with Instruction TuningPrompting Models in Multimodal-to-Text Generation (e.g. on Flamingo)
NeurIPS

Showing a sample of 115 resources. View the full list on GitHub →