oasst1-89k-ja

Update:

2023/11/12
oasst1-89k-jaをチャット形式に変換したoasst1-chat-44k-jaを公開しました。
2023/10/21
自動翻訳によるコード関連データの翻訳誤り2000箇所程度を手動で修正しました。

修正イメージを表示

修正前

もちろん！これは、Flask Webフレームワークを使用して文字列を提供する単純なAPIエンドポイントを作成するPythonスクリプトの例です。

フラスコ輸入フラスコから

app = flask（__name__）

@app.route（ '/'）
def hello_world（）：
    「こんにちは、世界！」を返します

__name__ == '__main__'の場合：
    app.run（）

このスクリプトでは、最初にフラスコモジュールからフラスコクラスをインポートします。次に、__Name__変数を使用してアプリケーションの名前を指定するフラスコクラスの新しいインスタンスを作成します。

修正後

もちろん！これは、Flask Webフレームワークを使用して文字列を提供する単純なAPIエンドポイントを作成するPythonスクリプトの例です。

from flask import Flask

app = Flask(__name__)

@app.route('/')
def hello_world():
    return 'Hello, world!'

if __name__ == '__main__':
    app.run()

このスクリプトでは、最初にフラスコモジュールからフラスコクラスをインポートします。次に、__Name__変数を使用してアプリケーションの名前を指定するフラスコクラスの新しいインスタンスを作成します。

oasst1-89k-ja

OpenAssistant のオープンソースデータ OASST1 を日本語に翻訳したデータセットになります。
日本語大規模言語モデルの作成にご活用下さい。なお、データセットのライセンスは、 Apache 2.0 になります。
日本語への翻訳には Google 翻訳を使用しました。

「ng_translation」カラムは、日本語翻訳に失敗したかどうかを示すカラムになっており、「1」となっている場合は翻訳に失敗しており、この場合は翻訳前のテキストがそのまま「text_ja」に入っています。

データセット内で翻訳誤り、誤字、脱字、文脈の違和感等あるレコードがあった場合はPull requests いただけると助かります（英語弱者なのでPRは日本語で大丈夫です）。
「use_deepl」が「0」になっているものはすべてGoogle翻訳で日本語翻訳されています。マイナーな言語だと日本語翻訳の精度が怪しいと感じる部分がありますが、こういったデータはDeepLでの翻訳に差し替えるだけで改善するものもあると思っています（DeepLでの翻訳に差し替えた場合は「use_deepl」を「1」にしてPRしてもらえると助かります）。

huggingface上のデータセットも定期的に更新しますが、レポジトリから最新ファイルをダウンロードして使いたい場合は concat_json.py を使用してひとつのjsonファイルに結合してご利用下さい。

huggingface
https://huggingface.co/datasets/kunishou/oasst1-89k-ja

Name		Name	Last commit message	Last commit date
Latest commit History 60 Commits
image		image
oasst1_ja_89k		oasst1_ja_89k
LICENSE.txt		LICENSE.txt
README.md		README.md
concat_json.py		concat_json.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

oasst1-89k-ja

About

Releases

Packages

Contributors 3

Languages

License

kunishou/oasst1-89k-ja

Folders and files

Latest commit

History

Repository files navigation

oasst1-89k-ja

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages