This dataset contains >150k question pairs from First Quora Dataset Release: Question Pairs which marked as duplicates, protected by Terms of Service. The data is splitted into training and validation data.
Translated from English to Bahasa Indonesia using Google Translate API.
Examples
{"question_1": "Apa beberapa teknik yoga yang baik untuk menurunkan berat badan?", "question_2": "Apa asana yoga untuk menurunkan berat badan?"}
{"question_1": "Bagaimana musik memicu emosi?", "question_2": "Mengapa musik bertanggung jawab untuk memicu emosi?"}
{"question_1": "Bagaimana cara meretas ke Facebook seseorang?", "question_2": "Bagaimana kita bisa meretas FB?"}
Please kindly check this repo, https://github.com/louisowen6/NLP_bahasa_resources, for more NLP in Bahasa Indonesia resources.