A "Signature Sound" és társai (Autonóm módon zeneszerzésre képes szuperszámítógép)

 ( eCaffee | 2018. július 9., hétfő - 22:55 )

A hallgatható minőségű gépi zene megvalósításához induljunk ki abból a feltételezésből (én abból indultam ki), hogy nálam jóval okosabb emberek már réges-régen kikutatták a zeneelmélet összes fontos kérdését (a szélesebb hallgatóság igényeit lefedő zenék tekintetében biztosan), és okos, tornacipős, kockás inges, és szakállas programozó bácsik ezeket az ismereteket felhasználva már Fortranban megírták anno (hát még azóta...) azokat az algoritmusokat, amik a populárisabbnak mondható, vagy éppenséggel a népszerű klasszikus zenei irányzatok stílusában viszonylag emészthető minőségű kottát képesek generálni.

Ha ez megvan (és többé-kevésbé megvan), akkor a számítógépek következő leckéi a hangszerelésről, az előadói stílusokról és ismeretekről, majd a felvételi technikáról, keverésről, effektezésről kell hogy szóljanak. Ha ezen területek leglényegesebb ismereteit egyszerűbb szabályokká gyúrva beletömjük a gépbe, akkor kapunk egy korlátozottan használható rendszert, ami néhány stílusban működve elfogadható kezdő, esetleg középszerű szerző, hangszerelő, előadó, és hangmérnök lesz egyben. Ez már elegendő ahhoz, hogy egy áruházi rádió, fodrászat, kutyaszalon, lift, mosdó, kávézó, közösségi tér, online játék, házi videó, vagy egy autóvezetés közben hallgatható mainsream rádió számára megfelelő kész zenét gyártson a masina. Nekem ez a szint jelenti a most futó hobbyprojektem közeli célját, mert ezt most, a jelenben megvalósíthatónak látom. (Aztán majd jönnek a nálam képzettebb, okosabb, és több szemmel többet látó emberek, és idővel majd jócskán továbbfejlesztik a dolgot, ha arra érdemes lesz.)

Szóval, lépjünk a gép következő leckéjéhez, és nézzük meg, hogy leegyszerűsítve mit is jelent az, hogy "signature sound": egy szerző vagy előadó olyan hangzó jellemzőit (stílus, szokásos frázisok, hangszerhasználat, hangszínek, énekhang-karakter, énekstílus, stb), amiről szinte azonnal felismerhetjük hallásból. Amitől kitűnik a tömegből a zenéje. Ilyen jellemzőket meg tudunk határozni a gép számára is (újat és meglévőt egyaránt). Nagyon leegyszerűsítve a dolgot, ha bekapcsolsz egy PPG Wave szintit, és vaskos padokon telt akkordokat fogsz Bachra emlékeztető akkordmenetekkel, akkor jó eséllyel Alphaville-t fogsz felidézni...ha CASIO PT-80 dobalapra, barkácsolt szinti hangokat pötyögve, szenvtelen robotszerű hangon németül kántálsz, az Kraftwerk hatást kelt...ha egy ragtime zenét gépzongora hangszínnel adsz elő, de méltóságteljesen lassan játszva, majd az eredményen lefuttatsz egy szűrést, amitől az gramofonfelvétel hatású lesz, a hallgatóban önkéntelenül is az ötlik fel, hogy esetleg nem eredeti Scott Joplin felvételt hallott-e? Nagyon sok mindenből készíthetünk kezdő gépünk részére szabályokból álló, igen kivonatos, de már felismerhető "signature sound"-leveskockát.

Egy nagyon buta, még teljesen "inkubátoros" kelta népzene feldolgozó program-kezdemény már működik a gépemen (viccből Enya-emulátornak szoktam hívni a gép háta mögött, azért, mert nagyrészt tőle jöttek a szignatúra meghatározó jellemzői). Ez a progi inputként fog egy tetszőleges, MIDI fájlba átírt, lehetőleg több szólamban lekottázott ír népdalt, az egészet áthangszereli hárfákra, aztán feldúsítja a kellő szólamokat az Enya és követőinek stílusára jellemző szintetizátor-hangszínekkel, és effektezi. Rémisztően keveset tud, a jövőben fejleszteni kell, de több száz ír/angol/skót/welszi népdalból csak három-négy esetben eredményezett hallgathatatlan minőségű zenét. A kimenet nagy része bőven megüti a stílustól elvárt, és hallgatható szintet.

Demo zene:
https://drive.google.com/open?id=1kv2itkN22ePFw20pftbbf-lHqtp_m6iG

Folyt. köv. :)

Hozzászólás megjelenítési lehetőségek

A választott hozzászólás megjelenítési mód a „Beállítás” gombbal rögzíthető.

Szerintem ezzel a módszerrel kb. teljesen eltűnne a zene és hangfelvétel készítésből az emberi kreativitás és ez az eredményben is hallatszana valószínűleg. Persze ha közép, alap szintű zene készítés a lényeg egy fajta háttér zenének minimális zenei igényekre hallgatói oldalon akkor akár működhet is. A kérdés hogy ez a szintű zenei eredmény tényleg kell-e bárkinek bármire is.
Egy koncerten ki állna a színpadon és mit csinálna zene közben? :)

> Egy koncerten ki állna a színpadon és mit csinálna zene közben? :)

Voltál már popsztár művházas hakniján? Ott állnak a színpadon, és a fene sem tudja, mit csinálnak zene közben ;)

Néző, hallgatóként nem, hangosító emberként igen. :)
Egyszer még Fenyő Miklósnak is hangosítottam. Zenekar nulla, CD-ről ment a zene, ő meg énekelt rá. A vicces az volt az egészben hogy az embere 5 perccel kezdés előtt hozta oda nekem a CD-t és végig nem tudta megmondani milyen sorrendben indítsam a CD-n lévő track-eket. Úgyhogy nyomkodtuk, Miki meg a színpadon improvizált az indításokra. De mondjuk elég csúnyán nézett ránk koncert közben.

Fél off szellemi bakugrásom jő: az a kaja, amit "élelmiszer" címen veszel s eszel ennél sokkal rosszabb... :-P
Egyre "tehetségesebb" a masina... ;-)

Nekem a legviccesebb "koncert" élményem az volt, amikor egy Balaton melletti falunapon egy "enyhén" illuminált (egyébként erről is híres) énekes leugrott a színpadról, megbotlott, elesett, feltápászkodott, k*anyázott, és folytatta tovább. Az ének eközben zökkenésmentesen ment. Vagy nagyon tud a csávó, vagy csalás történt :-)
(én nagyon jót röhögtem, megérte megnézni)

"Egy koncerten ki állna a színpadon és mit csinálna zene közben? :)"
szigeten voltam a táncdalfesztivál sátorban uhrin benedek koncerten. ütős példa, de hidd el, megoldható. :)


"I'd rather be hated for who I am, than loved for who I am not."

Szerintem ezzel a módszerrel kb. teljesen eltűnne a zene és hangfelvétel készítésből az emberi kreativitás

Á, dehogy. A gép az alkalmazott zene területén válhat tényezővé, ezen dolgozom. Építhet bárki bármilyen deep learning szupermasinát, a gépnek soha nem volt lyukas a cipője, nem fogyott el a kenyere harmincegyedikén, nem fázott, nem fájt semmije, nem temette el a szüleit, nem veszített el gyermeket, és soha nem álldogált viszonzatlan szerelemben égve, órákat epekedve Júlia ablaka alatt, hogy aztán versbe-dalba-zenébe gyúrja az örömöt és a fájdalmat. A gép soha nem fogja elvenni a valódi, ihletett alkotó ember kenyerét, sőt, remélem, világosságot fog teremteni, és megmutatja azt, hogy valójában ki az, aki nem művész...mert akit ez a gép legyőz, az nem ihletett művész, csak tisztességes iparos. (Művészre és iparosra is szükség van, de tisztán kellene látni!)

Az én projektemben nagyrészt a gép dolgozik, és az ember gondolkodik. Ehhez az alapálláshoz a végletekig ragaszkodom. Mentorálom a gépet, segítem, tanítom, ötletekkel látom el, és mindezt lefordítom a gép nyelvére, mert ez az ÉN dolgom, és nem fordítva.

-
"Attempting to break SpeedLock can damage your sanity"

hat pl. nem kellene csillardokat kolteni klf. projekteknek az alafesto zene jogdijaira...vagy pl. ettermekben hatterzenenel ugyanez..

.

Szép és ötletes projekt.
Viszont nekem az nem tiszta, az összes hasonló kérdésben, hogy a gép hogyan alkot valami gyökeresen újat?
Arra gondolok, hogy programozod le a gépnek, hogy kreatív legyen?
Véletlen szám generátor? Már rossz, mert amikor én dalt írok, van hogy kb egyből alkotok valami nagyszerűt, van amikor órák alatt sem.
Használsz már meglévő zenei modelleket? Nem annyira jó út... A zenében (szerintem) pont azok tudtak nagyobb eredményt elérni akik olyan hangzást adtak a közönségnek amit eddig soha nem hallottak. Vagyis új zenei modelleket hoztak létre.

Az én véleményem az hogy egy gép nem tud kreatív lenni, hiszen ez nem egy reál terület. És hogy programozol le olyat amit nem értesz? :)
Aztán persze lehet nem lesz igazam, hiszen régen olyat is mondtak, hogy nem tud olyan tárgy repülni ami a levegőnél nehezebb. :)

Persze azért sok siket a projekthez!

Persze azért sok siket a projekthez!

Freud-i typo ;)

--
"It all keeps adding up / I think I'm cracking up / Am I just paranoid? / I'm just stoned"
/Green Day - Basket Case/

Jajj, pedig átnéztem, de úgy látszik ez így sikerült.

LOL

A válaszok egy része itt van:
https://hup.hu/node/160039#comment-2247651
-
"Attempting to break SpeedLock can damage your sanity"

És valóban.
Köszi! És sok sikert még1szer!

Azt hittem ez is Generative Adversarial (Neural) Network lesz (vagy valami hasonlo a lenyege). Ezek szerint nalad sokkal tobb vele a kezi munka, cserebe sokkal jobb az eredmeny.

GAN mukodesi mod
Taryn Southern videoi .. es interju vele (Siraj Ravallal, aki eleg tomeny AI videokat csinal)
Carykh egyik videoja errol (de egyebkent a csatornajan eleg sok hasonlo video van).

--
When you tear out a man's tongue, you are not proving him a liar, you're only telling the world that you fear what he might say. -George R.R. Martin

igen, gondolkodjon az ember, és dolgozzanak a gépek. (feljebb, kommentben kifejtettem)
-
"Attempting to break SpeedLock can damage your sanity"

Ha nem hagytam ki valamit, akkor ez a 3. ide publikált szám. Az első kettőnél egyértelműen ugyanaz volt a bajom: a befejezés. Ennél már majdnem egyértelmű volt, hogy jön a vége. (Az első kettő nekem kissé váratlanul maradt abba.)

=====
tl;dr
Egy-két mondatban leírnátok, hogy lehet ellopni egy bitcoin-t?

Igen, sok kis problémát kell még orvosolni, idő kell hozzá és türelem.
Igazad van, listára rakom, és köszönöm.
-
"Attempting to break SpeedLock can damage your sanity"