MLLMGuard

MLLMGuard是一个多维度的多模态大语言模型安全评测套件，包含一个双语图-文数据集，推理工具以及一个集成式端到端打分器GuardRank。

新闻

[2024-06-06]我们发布了MLLMGuard评估套件。

SOP

安装环境
下载数据
快速推理
快速打分

安装

git clone https://github.com/Carol-gutianle/MLLMGuard.git
conda create -n guard python=3.10
pip install -r requirements.txt
cd MLLMGuard
# 创建新的文件夹
mkdir {data, results, logs}

请将下载后的数据存放在data文件夹下，data文件夹的格式为：

----data
|-privacy
|-bias
|-toxicity
|-hallucination
|-position-swapping
|-noise-injection
|-legality

数据

下载

您可以在Hugging FaceHuggin Face Website中获取MLLMGuard数据集。

描述

目前开源的数据集为MLLMGuard(Public)版本，共1,500条数据，并且经过脱敏处理。如果您需要未脱敏数据进行评测，请在这里填写表单。

排行榜 🏆

您可以在HuggingFace SpaceHugging Face Space查看最新榜单。

使用MLLMGuard快速推理

你可以在scripts中找到模型的推理脚本，我们提供了闭源模型和开源模型的推理脚本。

闭源模型

我们提供了闭源模型的评估脚本evaluate_api.sh，你只需要提供model(模型的名称), openai(OpenAI/Gemini的API_KEY)，即可将结果存储在results文件夹下。

以下是已经实现的模型以及对应的在model中的简称：

GPT-4V: gpt4v
Yi-VL-Plus: yi-vl-plus
Gemini: gemini

开源模型

我们也提供了开源模型的评估脚本eval.sh，你只需要提供model(模型的名称/路径), category(评估的维度)，即可将结果存储在results文件夹下。

以下是已经实现的模型：

LLaVA-v1.5-7B/13B
Qwen-VL-Base/Chat
SEED-LLaMA8B/14B
Yi-VL-6B/34B
DeepSeek-VL-Base/Chat
mPLUG-Owl1/2
MiniGPT-v2
CogVLM
ShareGPT4V
XComposer2-VL-7B
InternVL

自定义模型

你可以通过继承models/base.py中的Mllm类并重写__init__和evaluate函数来添加自己的模型。请记得在evaluate.py中添加自定义模型的接口，具体样例可以参考cogvlm.py以及下面的代码片段：

        elif 'cogvlm' in model_name:
            from models.cogvlm import CogVLM
            cogvlm = CogVLM(args.model, args.tokenizer)
            evaluate_model(cogvlm, args, data)

使用GuardRank快速打分

你可以使用GuardRank进行快速打分，过程请参考。

引用我们

如果您对MLLMGuard感兴趣，可以以下面的方式引用我们。

@misc{gu2024mllmguard,
      title={MLLMGuard: A Multi-dimensional Safety Evaluation Suite for Multimodal Large Language Models}, 
      author={Tianle Gu and Zeyang Zhou and Kexin Huang and Dandan Liang and Yixu Wang and Haiquan Zhao and Yuanqi Yao and Xingge Qiao and Keqing Wang and Yujiu Yang and Yan Teng and Yu Qiao and Yingchun Wang},
      year={2024},
      eprint={2406.07594},
      archivePrefix={arXiv},
      primaryClass={cs.CR}
}

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_ZH.md

README_ZH.md

MLLMGuard

目录

新闻

SOP

安装

数据

下载

描述

排行榜 🏆

使用MLLMGuard快速推理

闭源模型

开源模型

自定义模型

使用GuardRank快速打分

引用我们

Files

README_ZH.md

Latest commit

History

README_ZH.md

File metadata and controls

MLLMGuard

目录

新闻

SOP

安装

数据

下载

描述

排行榜 🏆

使用MLLMGuard快速推理

闭源模型

开源模型

自定义模型

使用GuardRank快速打分

引用我们