thu-coai

CDial-GPT Public

A Large-scale Chinese Short-Text Conversation Dataset and Chinese pre-training dialog models

Python 1.9k 262

CrossWOZ Public

A Large-Scale Chinese Cross-Domain Task-Oriented Dialogue Dataset

Python 700 118

KdConv Public archive

KdConv: A Chinese Multi-domain Dialogue Dataset Towards Multi-turn Knowledge-driven Conversation

Python 487 62

ConvLab-2 Public

ConvLab-2: An Open-Source Toolkit for Building, Evaluating, and Diagnosing Dialogue Systems

Python 463 137

Safety-Prompts Public

Chinese safety prompts for evaluating and improving the safety of LLMs. 中文安全prompts，用于评估和提升大模型的安全性。

CharacterGLM-6B Public

[EMNLP'24] CharacterGLM: Customizing Chinese Conversational AI Characters with Large Language Models

Python 476 35

Provide feedback