Skip to content

summary.md

Bratanov edited this page Nov 9, 2016 · 9 revisions

Проектът е резултат от 8 дневен спринт (с доста флуктоации), в който идеята е да поставим технически предизвикателства и на края да направим равносметка.

В следващите редове ще ви запознаем с цялостната визия на проекта, какви предизвикателства поехме, какво постигнахме, както и личните мемоари на всеки един от нас.

Екип

Идея

TL;DR: Генератор за рап песни + сайт където можеш да запишеш своето изпълнение.

Потребителя:

  • избира изпълители
  • генерира текст на база на тяхното творчество
  • избира аудио от списъка с възможни
  • записва видео на изпълнението си
  • получава merge-натото видео от записаното видео и оригиналното аудио.

Ден първи (през погледа на Мони):

Започнахме в понеделник. Ние с Явката разгледахме що е то невронни мрежи и как да ги използваме за генерация на текст. През уикенда бях се натъкнала на deepbeat.org, който ми се стори доста зле и далеч от това което искахме да постигнем. Междувременно (около 12:32ч.) Явката откри един алгоритъм наречен Markov_chain и изгенерира песен върху няколкото текста на ГП. Аз започнах търсенето на API, което да съдържа много текстове, които ни трябват за да генерираме нови. Колкото повече, толкова повече, все пак! Но... след дълго търсене се оказа, че няма безплатно API, което да има неограничен брой заявки. Да не говорим, че нямаше и български текстове в повечето от тях. Междувременно Явката написа един crawler, който обхождаше и сваляше текста на всички песни за даден изпълнител в сайта textove.com. Това решение вършеше доста добра работа и се спряхме на него. Добрата новина е, че още не са го ban-нали.

Качихме се в тихата стая и нахвърляхме идеи какво искаме да направим. Най-общо, идеята бе да извлечем текстове на песни. Да направим landing page, на който потребителите си генерират песни и след това да ги възпроизведем.

В резултат на първоначалната среща, си разпределихме задачите по следния начин:

  • Явката се зае да довърши crawler-a и да направи REST API, с който да генерираме текстове. За език за програмиране избра Python.
  • Веско избра да проучи по-подробно въпроса с възпроизвеждането - text to speech. В последствие се наложи той да имплементира merge-ването на аудио и видео, което той разработи под формата на REST API, написан на Python.
  • Аз се въобразих на frond-end developer и да направя landing page-a. Като технологии използвах HTML, CSS, Bootstrap, JS, AJAX.

Ден втори, трети, четвърти, пети - лични мемоари

Какво постигнахме?

Demo

Какво следва?

  • Веско работи над auto tune, за да превърне гласовете ни в този на Криско!
  • Добавяне на форма за предложения за нови изпълнители. (Процеса на обхождане на всички текстове е бавен, за това в менюто за избор на изпълнители показваме само вече кешираните изпълнители. Така генерацията отнема няколко секунди.)