clip-prefix-caption-jp

本リポジトリは画像キャプション生成手法ClipCapの日本語版実装です．ClipCapは，大規模汎用画像分類モデルCLIPと大規模汎用言語モデルGPT-2をベースにした手法です．本リポジトリでは，日本語版GPT-2と日本語版MS COCOデータセットを用いて実装してあります．自作データセットで学習・推論する際のチュートリアルも公開しています．

Official implementation of ClipCap: GitHub
Japanese GPT-2 model :
Japanese MS COCO: Paper, GitHub

Inference Examples on MS COCO


街路樹のある道路を車が走っています。	広場でたくさんの人が凧揚げをしています。	紙の箱の中にピザが入っています。


時計の針は10時20分を指しています。	青空の下に時計台が建っています。	野球のバッターがボールを打とうとしています。

Requirements

Python >= 3.7

pip instal -r requirements.txt

チュートリアル

COCOデータセットやSFCOCOデータセットで学習したモデルでの推論:
- SFCの授業で用いたものです．
自作データセットの用意から学習・推論まで:

用意するデータの形式

data/直下に，任意のデータセット名のディレクトリを作成し，キャプション一覧データ（captions.csv）と画像格納ディレクトリ（images/）を置く．

`data/`ディレクトリ下のデータ例

データセット名がoriginalの場合

data/
  └original/ # データセット名
    ├images/ # 画像データを含んだフォルダ
    │  ├001.jpeg # 画像ファイル名は何でもよい（連番である必要はない）
    │  ├002.jpeg
    │  └...
    │
    └captions.csv # 画像ファイル名とそのキャプション文のペアリスト

captions.csvの中身

画像ファイル名とキャプション文が対になったcsvファイル
- 画像ファイル名は絶対パスや相対パスではなく，ファイル名そのもの（拡張子付き）とする．

例

001.jpeg,スケボーに興じる一人の男性がいます。
002.jpeg,ゲレンデでスキーをしている人がいます。
...

Name		Name	Last commit message	Last commit date
Latest commit History 55 Commits
checkpoints		checkpoints
data		data
example_images		example_images
notebooks		notebooks
.gitignore		.gitignore
LICENCE		LICENCE
README.md		README.md
inference.py		inference.py
model.py		model.py
preprocess.py		preprocess.py
requirements.txt		requirements.txt
train.py		train.py
train.sh		train.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

clip-prefix-caption-jp

Inference Examples on MS COCO

Requirements

チュートリアル

用意するデータの形式

`data/`ディレクトリ下のデータ例

captions.csvの中身

About

Releases

Packages

Languages

License

nu-dialogue/clip-prefix-caption-jp

Folders and files

Latest commit

History

Repository files navigation

clip-prefix-caption-jp

Inference Examples on MS COCO

Requirements

チュートリアル

用意するデータの形式

data/ディレクトリ下のデータ例

captions.csvの中身

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

`data/`ディレクトリ下のデータ例

Packages