Documentcodegit - Chatbot tương tác với Kho lưu trữ GitHub

Giới thiệu

Documentcodegit là một dự án chatbot tương tác được thiết kế để tham gia các cuộc hội thoại về các kho lưu trữ GitHub bằng cách sử dụng Mô hình Ngôn ngữ Lớn (LLM). Nó cho phép người dùng có các cuộc thảo luận ý nghĩa, đặt câu hỏi và truy xuất thông tin liên quan từ kho lưu trữ GitHub.

Installation

Các bước cài đặt:

Create a virtual environment and activate on your local machine to isolate the project's dependencies.
```
python -m venv repochat-env
source repochat-env/bin/activate
```
Clone the Documentcodegit repository and navigate to the project directory.
```
git clone https://github.com/Catopham1702/Document_code.git
cd repochat
```
Install the required Python packages using pip.
```
pip install -r requirements.txt
```
Install the "llama-cpp-python" library.

Cài đặt với không có tăng tốc phần cứng
```
pip install llama-cpp-python
```
Cài đặt với tăng tốc phần cứng. Hướng dẫn tăng tốc cụ thể ở TheBloke/phi-2-GGUF

llama.cpp supports multiple BLAS backends for faster processing.

To install with OpenBLAS, set the LLAMA_BLAS and LLAMA_BLAS_VENDOR environment variables before installing:
```
CMAKE_ARGS="-DLLAMA_BLAS=ON -DLLAMA_BLAS_VENDOR=OpenBLAS" pip install llama-cpp-python
```
To install with cuBLAS, set the LLAMA_CUBLAS=1 environment variable before installing:
```
CMAKE_ARGS="-DLLAMA_CUBLAS=on" pip install llama-cpp-python
```
To install with CLBlast, set the LLAMA_CLBLAST=1 environment variable before installing:
```
CMAKE_ARGS="-DLLAMA_CLBLAST=on" pip install llama-cpp-python
```
To install with Metal (MPS), set the LLAMA_METAL=on environment variable before installing:
```
CMAKE_ARGS="-DLLAMA_METAL=on" pip install llama-cpp-python
```
To install with hipBLAS / ROCm support for AMD cards, set the LLAMA_HIPBLAS=on environment variable before installing:
```
CMAKE_ARGS="-DLLAMA_HIPBLAS=on" pip install llama-cpp-python
```
To get to know more about Hardware Acceleration, refer to official README from llama-cpp-python
Tạo một thư mục có tên là models trong thư mục dự án.
Tải một Mô Hình Ngôn Ngữ từ Hugging Face Model Hub dựa trên khả năng của máy tính của bạn. Đề nghị sử dụng mô hình sau: TheBloke/CodeLlama-7B-GGUF. Nếu bạn muốn tối ưu hóa một mô hình có sẵn trên Hugging Face, làm theo hướng dẫn từ llama.cpp
Sao chép tệp mô hình đã tải vào thư mục "models".

Mở tệp models.py nằm trong thư mục "repochat" và thiết lập vị trí tệp mô hình trong hàm code_llama() như sau:

def code_llama():
    callbackmanager = CallbackManager([StreamingStdOutCallbackHandler()])
    llm = LlamaCpp(
        model_path="./models/codellama-7b.Q4_K_M.gguf",
        n_ctx=2048,
        max_tokens=200,
        n_gpu_layers=1,
        f16_kv=True,
        callback_manager=callbackmanager,
        verbose=True,
        use_mlock=True
    )
    return llm

Nếu sử dụng cuda thì n_gpu_layers=-1

Usage

Mở terminal và chạy lệnh sau để khởi động ứng dụng Documentcodegit:
```
streamlit run app.py
```
Bây giờ bạn có thể nhập liên kết kho lưu trữ GitHub.
Documentcodegit sẽ truy xuất tất cả các tệp từ kho lưu trữ và lưu chúng trong một thư mục có tên "cloned_repo". Sau đó, nó sẽ chia các tệp thành các phần nhỏ hơn và tính toán embedding của chúng sentence-transformers/all-mpnet-base-v2.
Các phần nhúng được lưu trữ cục bộ trong cơ sở dữ liệu vectơ có tên là ChromaDB.

Chatbot Functionality

Documentcodegit cho phép bạn tham gia vào các cuộc trò chuyện với chatbot. Bạn có thể đặt câu hỏi hoặc cung cấp thông tin đầu vào và chatbot sẽ lấy các tài liệu liên quan từ cơ sở dữ liệu vectơ. Sau đó, nó sẽ gửi thông tin đầu vào của bạn cùng với các tài liệu được truy xuất đến mô hình ngôn ngữ để tạo phản hồi. Theo mặc định, tôi đã đặt mô hình thành "codellama-7b-instruct", nhưng bạn có thể thay đổi mô hình dựa trên tốc độ máy tính của mình và thậm chí bạn có thể thử mô hình lượng tử hóa 13b để biết phản hồi.

Chatbot lưu giữ bộ nhớ trong suốt cuộc trò chuyện để cung cấp các phản hồi phù hợp với ngữ cảnh.

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
repochat		repochat
README.md		README.md
app.py		app.py
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Documentcodegit - Chatbot tương tác với Kho lưu trữ GitHub

Giới thiệu

Mục lục

Installation

Cài đặt với không có tăng tốc phần cứng

Cài đặt với tăng tốc phần cứng. Hướng dẫn tăng tốc cụ thể ở TheBloke/phi-2-GGUF

Nếu sử dụng cuda thì n_gpu_layers=-1

Usage

Chatbot Functionality

About

Releases

Packages

Languages

Catopham1702/Document_code

Folders and files

Latest commit

History

Repository files navigation

Documentcodegit - Chatbot tương tác với Kho lưu trữ GitHub

Giới thiệu

Mục lục

Installation

Cài đặt với không có tăng tốc phần cứng

Cài đặt với tăng tốc phần cứng. Hướng dẫn tăng tốc cụ thể ở TheBloke/phi-2-GGUF

Nếu sử dụng cuda thì n_gpu_layers=-1

Usage

Chatbot Functionality

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages