多模态模型演示控制台
选择不同的视觉语言模型(VLM)来分析您的图片
选择模型
LLaVA 7B
Qwen2.5-VL 7B
Qwen3 8B (纯文本)
LLaVA: 基于 LLaMA 的视觉语言模型,擅长图片描述和视觉问答。
上传图片(多选支持)
指令提示
分析
清除所有
就绪
分析结果
llava:7b
等待操作...