Hol kezdődik egy hang?

Fórumok

Zongora hangmintákat szerkesztek amiket egy digitális zongorából "nyertem" ki. A célom egy virtuális zongora összeállítása ezekből a hangokból.  A probléma amivel szembesültem, hogy nem tudom kellően precízen elhatárolni a csendet a hangtól.  Maga a felvett hangfájl csenddel kezdődik és utána jelenik meg a zongora hangja.  Arra van szükség, hogy ezredmásodperc precizitással tudjam levágni a csendet a minta elejéről. Ennek óriási jelentősége van,  hisz minden egyes benne hagyott csend ezredmásodperc rontja a játékélményt. A billentyű lenyomásakor a hangnak "rögtön" meg kell szólalnia, komoly kompromisszumokat kell egyébként is kötni, hogy 10 ms alatt legyen a latency, hát így nem maradhatnak benne a mintába további ezredmásodpercek.  

Először próbálkoztam automatizálni a dolgot és Sox -szal vagdostam, de a minták annyira eltérőek, h ez nem hozott kielégítő eredményt. Most úgy döntöttem, hogy kézzel vágom le legalább az elejéről a csendet (kb 1500 fájl :-Z)  Ocenaudio programot használom (jobb mint az Audacity erre a feladatra) 

Ez kép jól mutatja a problémát: http://i.imgur.com/vCpbZge.png

Nyilván füllel semmi különbséget nem hallani most a szerkesztésnél, az majd csak akkor lesz érezhető ha elkészül a virtuális zongora és használatba lesz véve. Most csak vizuálisan van lehetőség meghatározni a vágás pontját. Hol vágjam? pl Amikor hullám lefele megy v. amikor felfele? És melyik hullámnál?

Mondjuk abban nem vagyok biztos, hogy lesz-e olyan aki tud erre érdemben válaszolni? De hátha!

Hozzászólások

Lehet h az jobb mint a Sox! A Sox-szal az volt a gond, hogy néha benne hagyott másodpercnél is nagyobb csendet, másik hangnál meg a legnagyobb amplitudóval kezdődtek a minták. Nem sikerült belőni jól a paraméterezését. Mély és magas ill. halk és hangos minták teljes spektrumát kéne lefednie egy automatizált vágóprogramnak.  De kösz a tippet - ránézek!

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Nem nagy segítség, csak jótanács: zero crossing-nál vágjál, ne csak úgy saccra.

Az elején az a kis jelszintű rész talán a billentyű-kalapács mechanikából jön. Gondolj arra is, hogy a billentyű megérintésekor nem szólal meg azonnal a húr. Valamint a mechanika zörejei és a kalapácshang is fontos részei a hű hangzásnak. (Harmonikán pl. a szelepek csattogása ilyen jellegzetes összetevő.)
Ezeket a mintákat többféle sebességű és erősségű leütés mellett is fel szokták venni. Gondolom Neked is ezért van ennyi.

Az én tizenéves zongorám oktávon belül egy mintából transzponál. Hallani is, hogy F és G között változik a minta, ha az ember nagyon fülel. A mai tárméretek mellett erre már nincs szükség.

A kis jelszintű rész 15-20 ezredmásodpercet jelent.  Az igaz h a rendes zongoránál is lehet némi késés a mechanikából adódóan. A digitálisnál ugye (1)billentyű leütés->(2)midi jel->(3)be számítógépbe->(4)szgép feldogozza és előállítja a hangot->(5)hangot kiküldi a hangkártyán.  Ebből a 4.) kb 5-10 ms-t tesz ki jó esetben. Szóval a 15-20 ezredmásodperc plusz az nagyon sok. 

Amúgy 16 velocity layert (leütési erősség) van felvéve minden billentyűhöz. A magas hangok leghalkabb verziója, szinte nem is hallatszik, a szerkesztőben is totál fel kell nagyítani, h észre lehessen egyáltalán venni. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Szerkesztve: 2020. 12. 17., cs – 21:43

Nem értek ilyen magas szinten a zenéhez, de Audacity-it már használtam hasonló célra. Gondolom itt a fő probléma az, hogy neked mit jelent a csend és talán az ilyen célú felhasználásra ez nem jó, de nekem józan paraszt ésszel itt a csend az, ahol még nincs zongora hang egy bizonyos hatérérték alatt :)

Szóval fogod az Audacity-t, beállítod a határértéket dB-ben, az időtartamot ezredmásodpercben (0.001 a legkisebb érték, amit az enyém elfogad) és aztán Truncate. Előtte persze CTRL + a és akkor nem csak az elejéről szedi ki, hanem mindenhonnan, ahol csendet talál.

Vagy ennél azért komplikáltabb?

Hozzáállás kérdése, h mennyire lesz komplikált a dolog. Pro szinten ez valószínűleg rettentően komplikált!  Az egy kérdés, hogy mennyire lehet alkalmas  az Audacity, ffmpeg, Sox a csend és a hang automatizált szeparációjára. A Sox eddigi tapasztalatom alapján úgy tűnik kevésbé... 

Bár nehéz ezt megítélni annak tükrében, h pontosan azzal sem vagyok tisztában, h mit várok tőlük.  Azaz az első lépés annak meghatározása lenne ezredmásodperc pontossággal, h hol kell vágni! Ezt követően lehetne kísérletezni azzal, hogy  be tudom-e úgy paraméterezni az automatizált vágószoftvert, hogy a jó helyen vágjon. 

A kézi szerkesztésre az Audacity kevésbé hatékony, mint az általam használt. Pl a hangfájl vizuális megjelenítője kifejezetten csapnivaló. Össze-vissza változtatja a nagyításnál meg kicsinyítésnél a vastagságot meg az arányokat. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Írj egy programot, amely egy adott küszöbértéknél triggerel, illetve ehhez képest időben visszamegy az első nullátmenetig. Attól a mintától kezdődik a hang. Ne feledd, nem feltétlen van a minták között nulla, előjelváltás is lehet.

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

Hát igen valami ilyesmi kéne, csak egyfelől ez a  küszöbérték dolog nem annyira egyértelmű, másfelől meg nálamnál okosabbak már írtak ilyen programokat lásd Sox pl. - és az se működött olyan frankón. Szal ez a kabát kicsit nagy lenne rám, attól tartok. :-)

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Márpedig én is úgy indulnék el, ahogy locsemege. Az, hogy "nálad okosabbak" csinálták nem jelent semmit, mert lehet, hogy nekik más volt a céljuk, más volt a mintájuk, stb.

Plusz amit csinálnék az az, hogy:

 * Alapból programmal dolgoznám fel

 * A programot paraméterezhetővé tenném (akár mintánként), hogy újrafeldolgozható legyen az egész gombnyomásra

 * A paramétereket verziókezelném

 * És az eredményt többféle beállítással kipróbálnám

Simán el tudom képzelni, hogy az eredményben végül más szempontok lesznek fontosak, mint amit most gondolsz - amikor majd kipróbálod az egészet egyben, akkor jössz rá, hogy mi nem jó. Ezért ha megvan a lehetőség a feldolgozást újrafuttatni, akkor ezt meg is fogod tenni.

A program nem volna nagyon bonyolult  ahogy elképzelem, a mintákkal nem kell feldolgozást csinálni, maximum tényleg annyit, hogy az elején valahogy 0-ból induljanak a minták, ehhez kell valami trükköt csinálni, mert a 0 ugye nem egész mintapontnál lesz. Na, de az is lehet, hogy ez nem is számít... Ki kell ezeket a dolgokat próbálgatni.

A PC feldolgozásból adódó késleltetést egyébként lehet csökkenteni, ha a hangkártya puffer méretét csökkented. Ugye úgy működik, hogy 1 pufferrel mindig előre kell dolgozni a PC-nek, de ha kicsi a puffer, akkor az kevesebb latency-t ad. Persze annyival több interrupt jön, de egy mai PC-n a hang feldolgozása nem lehet gond. (Ha gond, akkor az driver issue lesz, vannak driverek, amik sokáig blokkolják a kernelt, és így nem tud a rendszer real-time működni. Olyan vasat kell venni, amivel ilyen nincsen. Régebben próbálkoztam ilyesmivel, az volt a tapasztalatom, hogy volt olyan driver, ami miatt nem tudott rendesen real-time lenni a kernelem. Ezért én ha ilyet akarnék építeni, akkor most úgy csinálnám, hogy egy célgépre tenném a hangprocesszálást valami nagyon kikönnyített Linuxszal, amire például GUI-t sem tennék, így real time tudna maradni a kernel.)

Teljesen real-time sosem lesz a dolog. A legjobb digitális zongoráknál is van latency - pedig ott aztán kimaxolják a dolgokat. Igaz, egy nagyságrenddel kisebb, kb ms alatti. Ugye, külön gépre lehetne tenni a hangfeldogozást, de akkor két gépet kéne használnom, mert a kottát is látni akarom, meg adatott esetben felvenni amit játszom, megnézni YT tutoriált h kéne játszani stb.
Ha valamelyik egyéb futó program hirtelen sok erőforrást igényel akkor az be tud zavarni a hangfeldogozásba és ilyenkor un. XRUN-t kezd dobálni a rendszer némi recsegés kíséretében, amíg rendeződnek a dolgok. Erre lehet számítani pl ha böngésző meg van nyitva. Néha belefér egy-egy recsegés -túlélhető-,  csak ne felvétel közben legyen! De amúgy ez pro szinten komoly probléma lehet. 

A linuxsampler nem tud több magon futni. Tulképp az lehetne, hogy dedikáltan kap egy magot -  ez most jutott eszembe. Bár az is igaz, hogy nem csak a linuxsampler dolgozik, hanem futnak egyéb effektek, vannak fájl műveletek stb.

Az jutott még eszembe, h meg fogom nézni más zongora hangminták hangfájljai hol kezdődnek, azaz hol vágták őket! 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

15-20ms vagy kisebb latency esetén én már nem érzek késést a gitár - usb hangkártya - effektező szoftver - usb kimenet - hangfal láncolatban. Megpengetem a húrt és azonnal szól.

11 éve Windows XP-n, P4 2 ghz, 512 MB ram, asio driverrel, noname usb hangkártyával nekem 5 ms latencym volt, guitar rig2-vel és egyéb impulse-response elven működő erősítő és hangláda vst effektekkel. 

Az 5 ms latency jó érték a zongorához is (nekem). De mondjuk a dzsessz zongorista aki 1 ms alatti késleltetésű digitális zongorához szokott  azért lehet, h "furcsának" találná. :-). Ugye az ASIOnál az van hogy nem enged több programot hozzáférni a hangkártyához egyszerre. Ez elég frusztráló tud lenni! Szeretek YT tutoriált nézni a zongorázás közben, h mégis h kéne játszani amit épp tanulok. Vannak külön programok amivel ez az excluzivitás probléma áthidalható, de hát milyen hackelés már ez? 

Van olyan DAW szoftver aminél pl be lehet állítani, hogy ha elkerül róla a focus, akkor engedje el az ASIO drivert. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Mi a cél? Egy analog jelforrasra  egy masikat is bekeversz, egy dolog -a celnak akar meg is felelhetsz vele. Persze lehet tisztan digitalisan is illeszteni, ugyelve a jitterre stb, de nem biztos hogy a celhoz ez szukseges.

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

Ugye az a probléma lett felvetve, h a windowsos ASIO driver kizárólagosan használja a hangkártyát az adott applikációból és mást nem enged hozzáférni, így nem tudom a youtube-os zongora oktató tutoriált nézni a zongorázással egyidejűleg.   Erre van szoftveres megoldás pl. az ASIOLink ( ami fizetős cucc volt, de meghalt a fejlesztője az örökös meg feltehetően nem tudott vele mit kezdeni és inkább elérhetővé tette ingyen.)  Szal tulképp ez megoldja a problémát bár kicsit körülményes használni.

A két hangkártya elegánsabb megoldásnak tűnik! Tehát pl lenne egy frankó USB-s amin keresztül menne a zongora kizárólagosan, minden egyéb meg az alaplapi kártyán keresztül - és akkor az a kérdés, hogy kössük össze ezeket, hogy fejhallgatóban szóljon a zongora is, meg yt video is?  Fejhallgató az USB-be van bedugva, és akkor drótozzuk össze egy igazi kábellel az alaplapi outját az USB injével? Ha van keverős monitor funkció az USBkártyán akkor kész is vagyunk :)
Vagy van erre szoftveres megoldás, amihez nem kell igazi kábel? Mondjuk ha mindkét kártya a saját órajele után megy, akkor abból elég nagy zúgás-búgás lesz, nem?

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

DirectSound? (Ez most windows, vagy linux egyalltalan?) emlekeim szerint nekem az asio eszköz mellett siman szol minden mas egyeb is, nincs kizarolagos mukodes.  Nem konfiguracios hiba?

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

Windows. Ugye van a hangkártyának gyári drivere is. Ott is ugyan ez a jelenség ha maximális mintavételen akarnád használni. Tehát 192kHz állítva, a Cakewalkban ezt a kártyát kiválasztva, csak a Cakewalk fogja tudni használni. Alacsonyabb frekin a gyári driver enged több programot is hozzáférni a kártyához. ASIO drivert az alacsonyabb latency miatt szokás használni, és emlékeim szerint ott nem függött a a kizárólagosság a mintavételtől. Tulképp pont ez az értelme ennek ASIOLink nevű programnak h ilyenkor "valahogy" megoldja h másik program is hozzáférhet. Tehát mehet egyszerre Cakewalk meg Yt-os video az ASIO-s alaplapi hangkártyával.  

De momentán ez csak elméleti kérdésként merült fel. A windowsos gépem perpill félre van téve.  Linuxon meg nincs ezzel gond. Legalábbis amióta megszűntek a flashplugines-s YT videók :)

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Nekem nincs ilyen kizarolagossagi problemam az asio driverrel, viszont a felesegem laptopjanak alaplapi recsegoje asioval ugyanezt csinalja, szvsz ezek az eszkozok arra jok maximum, hogy azon keresztul halljad a skype hangjat, de komolyabb munkakhoz mar nem elegendo.

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

Oké, my fault! Erről zagyválok: ASIO4ALL - ez általános és ingyenes driver mindenféle kártyához. Írják is a kizárólagosságot :

Q: Why do I get an error 'Could not start ASIO' or some such? (READ THIS ESPECIALLY IF YOU ARE HAVING PROBLEMS WITH LOGIC!)

A: (Version 1.x) ASIO4ALL requires exclusive access to the audio device. More often than not, starting the driver fails because the audio device is already in use.

Lehet specifikus ASIO drivered is, ami másképp működik!

Persze kell majd egy normális hangkártya! Rémlik, mintha Te írtad volna valahol korábban, h a PCie-es RME kártyád van. Tévedek? Gondolom az aztán ultra kicsi latencyvel dolgozhat ha egyből a PCIe Busra van rádugva, és nem USB-n kell szaladgálnia jeleknek! Asszem az nekem az túlzás lenne, és marha drága is. Akárcsak a thunderbolt-os újabb csodák  pl UAD  ráadásul azokhoz már olyan proci is kell, ami tudja kezelni. Sz'al egyenlőre az 50.000 alatti kategóriából lesz majd valami USB-s. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Az Asio4All-t használom az asszony gépén, ha hirtelen az van kéznél és olyan munkát kell csináljak, ami ezt igényli - ez egy kényszermegoldás, alkalmatlan mindenféle komplexebb feladatra, nem ajánlom. A célhardverben pedig olyan kártya van (igen, RME-t használok jelenleg), aminek az Asio drivere normálisan van megírva, ott ilyen gond nincs. Ergo, az általad használt driver (hangkártya) a fos. Érdemes használt kártyák között szétnézni (szvsz pl. valamilyen M-Audio PCI-e kártya is jó lehet a feladatra, egy a lényeg: az alaplapi felejtős!) Az UAD ágyúval verébre-kategória, ha csak egy produkciós munkaállomáshoz kell, ahol nincs szükség virtuális effektparkra, akkor még használtam is overkill, annyival pedig nem jobb, mint amennyivel drágább.

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

Kösz a tippet! Amúgy az a tapasztalatom az alaplapi cuccokkal, hogy fejhallgatóval elég jól szólnak. AKG-K601-es fejhallgató van rendszeresítve a zongihoz a semleges hangja miatt. Ha ezt dugom be az alaplapi kis zöld jack csatlakozóba, akkor eltünteti a zajokat és jól szól. 120 Ohm impedanciája van. Ez a csatlakozó kombinált lineout/phone csati. Ha a zongorám erősítőjének line in-jére kötöm, akkor úgy élvezhetetlenül zajos lesz. Van egy kis USB Behringer kártyám is. Sajnos az csak 48kHz/16Bit-et tud. Mondjuk aktuálisan most olyan zongora hangmintákat használok, szal ehhez épp jó. De ennél is tiltom a bemeneti portokat, mert különben azok zajt generálnak. De így szépen szól akár fejhallgatóval,akár a zongira kötve. 

Nincs szükségem az UAD dsp-s effektjeire. Sokat bohóckodtam már különböző effekt pluginekkel, és az a tapasztalatom, h ha eleve rossz a hangminta, ami fel van véve, akkor azt aztán effektezhetem, de sosem lesz jó! Ha meg jó a felvétel, akkor is leginkább csak ront rajtuk az effekt. Inkább pszichológiai célzattal vannak nálam használva, h egy picit másképp szóljon mint szokott - ha épp olyanom van. Meg esetleg h legyen reverb a fejhallgatóban is. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Az UAD-hoz zárójelben: a dsp-pluginok elég jó kiegészítői az eszköznek, mindenképpen profi alapot adnak bármilyen zenei munkához, utómunkához, de egyáltalán nem tartom megkerülhetetlennek.

"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

A fel- és lekeverés - azaz a hang "hirtelen" megszólalása és elhallgatása - ~30ms felkeverés és ~60-120ms lekeverésből áll. Már, ha úgy zenét kevergetsz.

Egy hangszer hangjának megszólalása nagymértékben függ annak a fizikai adottságaitól. Pl. ha rátaposol egy orgona legmélyebb sípjának a pedáljára, akkor jól lehet hallani, hogy a 6-8m hosszú levegőoszlop nem azonnal szólal meg, hanem 0,5-0,8s szükséges a rezgés kialakulásához. Ezt a jelenséget kiválóan lehet hallani és megfigyelni.

A zongora húrjai hasonlóan viselkedhetnek. A "felkeverődéskor" valószínűleg egyedi burkológörbe szerint változik az amplitúdója. A hangszerkesztőben ezt a burkolót kell definiálni (alak, hossz), és a burkoló szerint elvégezni a csend -> hang átmenet kialakítását. A lecsengést hasonlóan.

További módosító és nehezítő tényezők lehetnek:

  • a csillapító/tompító pedál(ok) függvényében a fel és lefutás
  • a csillapítást megszüntető pedál utáni zengés
  • a fenti miatt a harmonikus húrok megszólalása
  • mi van, ha ütögeted a billentyűt és még nem csengett le az előző ütésnél keletkezett hang? milyen az átmenet?
  • a magas és mély húrok eltérő mehanikájából eredő eltérő hatások
  • a doboz hatása
  • és még rengeteg minden, amire hirtelen nem gondoltam

A megoldáshoz rengeteg mérés, számolás, statisztika is kell. Sok szerencsét!

Tudtam h Rád számíthatok :) 

A célformátum az SFZ lenne, linuxsamplerrel. Az SFZ-ben van rengeteg opcode, ADSR envelope is. Illetve maga a linuxsampler megold sok dolgot. Tanulmányoztam pár zongora SFZ fájlt van köztük olyan zongora ami elég jól is szól, persze nem igazán "pro grade" - olyan nagyon nagy varázslás nincs bennük. Lényegében meg kell adni, hogy melyik hangmintát használja adott billentyűnél és leütési erősségnél és kész is. Illetve global/group paraméterként meg vannak adva a burkológörbe jellemzői. Illetve Round Robin dologgal szoktak még játszani, aminek a lényege h ugyan arra a billentyűre és leütési erősségre egyszer ilyen, másszor olyan hangot ad. Persze a két hang nagyon hasonló. Ettől um. életszerűbb a hangzás. 
Van még az un. "Silent Key" dolog. Ez az a jelenség amikor lenyomod az egyik billentyűt és megvárod míg megszűnik a hang, de továbbra is lenyomva tartod. Ilyenkor leütsz egy másik billentyűt és a létrejövő rezgés az előbbi billentyűhöz tartozó húrokat is megrezegteti. De ez nagyon extra dolog, KONTAKT féle zongoránál emlékszem ilyenre. Szerintem a linuxsampler ezt nem tudja. 

2 GB alatt lesz a hangminták mérete. Így akár RAM-ban is elfér. De az SSD is elég gyors hozzá. 

Az egész tulképp abból jutott eszembe, h a Pianoteq fizetős program (nem mintavételes, hanem fizikai modellezés alapú) demójából kinyerhető a hangzás és abból készíthető  már egy mintavételes virtuális zongora - amiért így nem kell fizetnem.  De egyenlőre a Kawai digitális zongorám hangjából próbálok összerakni egy virtuális zongorát. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

A zongorából kijövő midi jel megadja az időzítést.

Midiclockra gondolsz esetleg? Nem az időzítés a gondom, hanem h amikor már lejátszani kell a hangot, akkor olyan hangminta álljon rendelkezésre, aminek az elején "rögtön" a hang  szólal meg és ne legyen ezredmásodpercnyi szünet sem előtte. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Ezt írtad: "Zongora hangmintákat szerkesztek amiket egy digitális zongorából "nyertem" ki", ezt kifejtenéd? Hogyan rögzítetted minden egyes billentyű 64-féle leütési sebességénél külön-külön a kijövő analóg hangot? De akárhogyan is, amikor az analóg kimeneten megjelenik egy hang (amit ugye végső soron A/D konverter fogad), akkor a MIDI kimeneten megjelenik az adott billentyűvel kapcsolatos digitális jel. A kettő szinkronban van :-) Akár a MIDI jel NOTE ON és NOTE OFF jelével (pl. az első felfutó éllel és utolsó lefutó éllel) lehetne kapuzni az analóg jelet. Nem gondoltam végig, hogy a többi MIDI jel közül hogyan lehetne ezeket kinyerni.

"Az egész tulképp abból jutott eszembe, h a Pianoteq fizetős program (nem mintavételes, hanem fizikai modellezés alapú) demójából kinyerhető a hangzás és abból készíthető  már egy mintavételes virtuális zongora - amiért így nem kell fizetnem."

Ha jól értem, kimásolgatta a generált hangbankot, vagy ilyesmi...

Ez a terv. Kicsit paradox: fizetős modellezés alapú virtuális zongorából lesz ingyenes mintavételes alapú virtuális zongora készítve. :-) 

De egyenlőre még a saját digitális zongorám hangjával próbálkozom. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

> Hogyan rögzítetted minden egyes billentyű 64-féle leütési sebességénél külön-külön a kijövő analóg hangot? 
> ezt kifejtenéd?

Persze, örömmel - bár ennek a problémámhoz nincs köze! 
Előállítottam egy midi fájlt amiben egymástól 30 másodpercekre 16 különböző erősségű leütés jelét szimuláltam egy hangon. 30 másodperc elég a leghosszabb lecsengéshez is. Ezt a midi fájlt játszottam le a sz.gépen különböző hangokra transzponálva. A sz.gép persze össze van kötve midi kábellel a digitális zongorával. Így ezek a jelek bejutottak zongorába ami lejátszotta a midi jelnek megfelelő hangot. De nem csak lejátszotta, hanem rögzítette is 44,1kHz 16 bit wav formában , konkrétan egy USB pendrivera - mert szerencsére van benne ilyen funkcióra lehetőség (mivel nincs jó minőségű hangkártyám ezért csináltam így, nem akartam a hangot visszavezetni az alaplapi hangkártyára) . Így minden billentyűhöz tartozik egy nagy wav fájl egymástól kb 30 másodpercre lévő, egyre erősödő 16 hanggal. Ez a legnyersebb forrás amivel dolgoznom kell. A hangok közt  változó méretű szünetek vannak. A következő lépésben SoX -szal automatizáltan feldarabolom ezt a nagy fájlt a 16 hangnak megfelelő kis fájlokra. Itt még úgy néz ki, h a fájl kis csenddel kezdődik (kb 1-2 másodperc) utána jön a hang és a végén változó hosszúságú csend van ismét. Ami a mostani problémát jelenti az az, hogy ezt kezdő csendet miként tudom úgy levágni, h pontosan a hanggal kezdődjön a fájl. 

>  amikor az analóg kimeneten megjelenik egy hang (amit ugye végső soron A/D konverter fogad), akkor a MIDI kimeneten megjelenik az adott billentyűvel kapcsolatos digitális jel.

Pontosítsunk! A normál scenárió az az, hogy a midi jel jön a midibillentyűzetről, ami bemegy a számítógépbe. A számítógép pedig előállítja a virtuális zongora hangját a jelnek megfelelően és azt kiküldi a hangkártyára. Na most a midi jel beérkezése és a hangkártyán a hang megjelenése közt idő telik el. Ezt hívjuk latencynek v. késleltetésnek. 30 ms körüli késés már totál zavaró tud lenni a zongorázásban.  Erre a késére tenne még rá az, hogyha a hangfájl nem egyből a hanggal kezdődne, hanem lenne még az elején pár ezredmásodpercnyi szünet. Ezért lenne fontos most nagyon precízen levágni a felvett mintákról a csendet. Tulképp nem is muszáj levágni, mert rémlik mintha lenne arra lehetőség, hogy virtuális zongora programban meghatározzam a pozíciót, h honnan kezdve kell játszania a hangot a fájlból. Tehát így elég lenne csak meghatározni a hang kezdetének pozícióját. De már akkor éppen le is tudom vágni, szóval az mégiscsak tisztább ügy. 

A "note on" midi jeleket egy egyszerű grep paranccsal is ki tudod nyerni. pl jack_midi_dump | grep "note on" - ha Jacket használsz. Persze jack_midi_dump bemenetére rá kell kötni a system_capture_midi -t v. minek hívják! 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Ha a MIDI szoftveres forrásból jön, akkor a MIDI és a digitális kimenet teljesen szinkronban lesz IMHO, a MIDI time code-okból pontosan számolható a hangok közötti idő mintánként számolva. Elég egyet beállítani, és a többi különbsége számolható. Szerintem erre utalt az előző kommentelő. Ráadásul, ha ez egy szimulátor által előállított jel, akkor tuti, hogy az első nem-0 értéktől kell kivágnod, mert a szimulátorban zaj nem lesz, nem olyan mintha egy analóg zongorát vennél fel. És az is tuti, hogy a latency miatt úgy van megcsinálva, hogy az első adandó alkalommal nem-0 jelet ad ki, tehát ilyen egyszerű: az első nem 0 jel a minta eleje. Jelentéktelen felvezetésnek tűnhet a rajzolaton, de valószínűleg a tervezője úgy találta, hogy számít és kell az oda.

Ja elnézést. Én azt hittem, hogy van egy igazi fizikai digitális zongorája BZ-nek, ezen nyomkodja a billentyűket, és felveszi mindazt, ami kijön az analóg kimeneten meg a MIDI kimeneten. De egyre inkább az az érzésem, hogy valami szoftveres (VSTi ?) hangszerből akar csinálni egy másik szoftveres hangszert, vagy mit.

Jól gondoltad! A Pianoteq a jövőbeni terv lesz - tulképp azt akarom majd a vázolt módon megcsinálni, csak előtte még a saját digitális zongorám hangjával teszek egy próbát.

Ilyen: https://imgur.com/EnhKzb6

Bocs, nem értettem meg, h mit akartál mondani az előzőekben, csak most eset le a tantusz! Igazad volt! És köszi a tippet!

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Uhh, teljesen igazad van! Nem fogtam fel előbb, mit akar @lcsaszar. Pedig így most visszaolvasva egyértelmű..

Igazából van a dologban még egy emberi tényező ami bezavar, mert billentyűnként történt a felvétel, és előbb mindig a felvételt indítottam el és utána egy két másodperccel a midi lejátszást. De utána már automatikusan jön a 16 jel és a hang. Tehát csak az elsőt kell szinkronba hozni, és a többit már lehet automatikusan kivágni. Ez lesz a megoldás! 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Sima programként írtam meg. Egy zenész ismerősöm elmesélte, hogy hogy működik egy Hammond én pedig az alapján leprogramoztam és tök jól szólt. Amit sehogy sem tudtam annó megcsinálni, az az volt, hogy kis késleltetéssel rendesen szóljon, akkor még gyengébb volt a Linux ilyen téren. Végül elúntam és abbahagytam, és azóta is tervezem, hogy valamikor feltámasztom ezt a projektet.

Gondolom ott generálódott a hang és nem felvett mintákat torzítgattál.  De azért eléggé bele kell mászni egy ilyen feladatnál a zenei, meg hangmérnöki dolgokba... nem egyszerű. 
 

Nálam most 48kHz-nél 128 buffer van állítva és 5.8 ms a késés. Régi C2D proci van a gépben. De ezt bírja simán. A zongorázáskor gyakorlatilag semmi késést nem érzek. 
Mondjuk volt olyan virtuális zongora, ahol a minták eredetileg flac-ban voltak tömörítve. Nah attól egyből kiakadt. Wav-os konvertálás után helyreállt a béke :)

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Igen, már jóideje az van, hogy ha nincs valami elrontva, akkor a proci akár 44000-szer ütemezhet egy taszkot, akár mintánként képes volna végrehajtani, hogy egy "pufferbe" betölti a következő mintát, tehát akár 1 mintás pufferrel is működnie kellene. Amiért nem működik, az a rengeteg réteg, illetve a problémás driverek.

Na meg gondolom ha valaki a minta lejátszásakor inicializál egy flac dekódert, akkor az is meg fog csúszni :-). De ezt nyilván senki sem gondolta komolyan, hogy így kell megvalósítani.

Mikrokontrolleren, oprendszer nélkül ezt meg lehet csinálni. Az oprendszerek baja azok általánossága. Az alkalmazás átad egy buffert a hangszervernek, de ki tudja, mikor kapja meg a vezérlést legközelebb az alkalmazás, meg mikor a hangszerver, mert működik a háttérben még egy SQL szerver, meg bármi. :) Jó, van ütemező, de nem lehet minden igényt kielégíteni, különösképp, ha egyszerre kellene. A PipeWire egyébként nagyon ígéretes, elégedetten használom.

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

a proci akár 44000-szer ütemezhet egy taszkot, akár mintánként képes volna végrehajtani, hogy egy "pufferbe" betölti a következő mintát, tehát akár 1 mintás pufferrel is működnie kellene

Mindenki szerencséjére ez az ötlet másnak nem jutott eszébe. ;)

A puffer lényege az, hogy nehogy drágább legyen a leves, mint a hús. Tehát minden olyan esetben, amikor a X méretű puffer megszerzéséhez több erőforrás kell, mint az azon elvégzett munka, akkor gazdaságtalan, - általában hibás és átgondolatlan - a szervezés.

A gyakorlatban két műveletsor jöhet szóba. Az egyik a lejátszás, amikor tetszőleges lehet a késleltetés, persze az észszerűség, felhasználói élmény, stb. figyelembevételével. A másik a kvázi szinkron lejátszás, amikor egy előírt késleltetésnél többet nem engedhetsz meg.

Az utóbbit a feladatra kihegyezett rtos vagy célhardver (DSP) tudja csak megvalósítani. Ilyenkor az adatlánc egyes elemeit csak vezérelgeti a szoftver, de az adatokba nem nyúl bele.

A fentiekben emlegetett pufferszám az egész láncból csak az egyik driver paramétere. A többi késleltetés kiküszöbölésére jobb, ha azokat elimináljuk. Ilyen pl. a hangminták memóriába töltése.

> Mindenki szerencséjére ez az ötlet másnak nem jutott eszébe. ;)

Pedig a PC-s szoftveres szintetizálás pontosan így működik. Mac ütemezővel állítólag jól, a zenészek szerint. A késleltetlést folyamatosan próbálják levinni, 1ms-es bufferről már hallottam, az 44 minta, innen már nem akkora bakugrás elgondolni, hogy lehetne 1 buffer 1 minta is. Miért ne? A Attiny-ken az UART-ot egyetlen bájtját is puffernek hívják. Attól még hogy 1 minta van benne, attól még buffer. Nyilván ésszerűbb, ha interruptban van megvalósítani, de akár még egy processz-ütemezés is beleférhet.

A CPU-sebezhetőségek javításait ilyenkor érdemes kikapcsolni :-)

Van még az az eset, amikor több csatornán mérsz csatornánként 1 MS/s sebességgel - itt az "S" nem Siemens, hanem sample :) -, és akkor úgy vagy vele, mindegy, hogy hogyan, csak tudd megoldani, férjen bele a futásidőbe, s örülsz, ha élsz. :)

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

Úgy tűnik mostanában kezdik ezt a flac dolgot komolyan gondolni! :-/  Lehet ha nem kb 15-20 éves gépet/procit használnék fel sem tűnne!  De amúgy terhelt ez az egész sz.gépes zenélés egy csomó faszsággal! Eleve linuxra nincs igazán fejlesztés. Főleg Macre, meg  windowsra van és rohadtul megy harc a gyártók/fejlesztők között, hogy melyiknek a cucca legyen kvázi szabvány a zenészek között pl egyik ilyen a KONTAKT. Így aztán jönnek azok az igények, hogy h windowos program/plugin fusson linuxon is. Na h, gondolhatod, h miért kell i9-es proci egy zenész gépébe! És akkor ehhez jön még a linux hangrendszer összevisszasága (Alsa, Jack, PA). a @locsemege által promótált PipeWire-t még nem próbáltam. 

Mondjuk a zongoránál a diszk elérés sebessége is korlátozó tud lenni. Sata3 SSD-vel oké a dolog, nem kell aggódni, de Sata2-vel már necces. Gondolhatod h ezen az alaplapon persze Sata2-van. :-Z  Szal most RAID0-ban megy két SSD - így valamivel gyorsabb.  Hangminták pár Mb-tól a ~250 GB-ig változnak méretben. Van mindenféle. 

Ami még meg tudja borítani a gépet, az a polifónia számának a növelése. Ez rögtön látszik a proci hőfokán is :)

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Én alapból abból indultam ki, hogy a mintákat - de legalább az elejüket - mindenképpen RAM-ban kell tárolni. A diszken lehet flac, de amikor elindítod a szimulátort, akkor cache-elje be az összes lehetséges mintát (de legalábbis az elejüket, amit addig játszhat, ameddig betölti a fájlt SATA-ról, és elkezdi kitömöríteni).

 

A szimulátor, amit én csináltam, az mindent RAM-ban csinált statikusan foglalt pufferekben természetesen.

Sajnos ez nem jött be! Azt tapasztaltam, hogy totál el van csúszva a midi jel a hanghoz képest és nem lehet őket szinkronba hozni. Akár több 100 ms-dal is. Elég meglepő! Ráadásul úgy hogy a hang van előbb mint a midi jel. De különböző billentyűkhöz tartozó hangok időzítése is eltér némileg, pedig ugyan az a midi fájl, illetve ugyan azon rendszeren keresztül lettek felvéve. Igazából a midi jelekhez nem tartozik timecode. Amikor különböző eszközök közt használják vezérélésre a midit, akkor un. midiclock-ot kell használni, h azok szinkronban legyenek. Az én digitális zongorám a midiclockot nem támogatja, úgyhogy ezzel nem is foglalkoztam sosem.  Ugyan azt a midi fájlt lejátszom qtractorral és midirecieverrel rögzítem (ami hozzá tud rendelni timestampet a "note on|off" jelekhez) egyszer a laptopomon, másszor meg PC-n, akkor az időpontok illetve azok különbségei között eltérések lesznek. Olyan 1-5 ms körül. Szóval ezért a felvételeknél jelentkező több 100 ms -os eltérést nem nagyon tudom mivel magyarázni. Kizártnak tartom, h Kawai hangmintái eleve csenddel, ráadásul állandóan változó tartamú csenddel kezdődnének!
Marad a SoX a vagdosáshoz! 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Ott kell vágni, ahol kezdődik a hullám, 0-val indul, és a következő pont már ettől le vagy föl van. A másik probléma, hogy mekkora a zajszint. Ha zaj is van, akkor már elég körülményes kitalálni, hogy hol van ez a kezdet. Minél nagyobb a zaj, annál lehetetlenebb.

Ha nincs zaj, akkor programot is könnyú erre írni,átkonverálni wav-ba, lecsapni az elejéről a 44byte-os headert, aztán akár mehet megfelelő tipusú tömbbe is az egész hangninta. ... aztán ha hang[i]!=0, onnan lehet kinyomni fájlba. Ha van zaj, még lehet variálni, mennyi a zaj max kitérése, aztán ha (hang[i]<-zaj)||(hang[i]>zaj) akkor hang[i-(zaj div 2)] -tól lehet kiírni. ... még DOS+Turbo Pascal-lal kerültem szembe egyszer ilyen problémával.

-fs-
Az olyan tárgyakat, amik képesek az mc futtatására, munkaeszköznek nevezzük.

Szerencsére nem zajos a felvétel egyáltalán. Meggyőztetek. Főleg mert könnyen újra futtatható lesz a hangszabászati processzus és ha túl soknak találom a latencyt, akkor hát legfeljebb lenyisszantok még belőle. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Esetleg fordítsd meg az időt és amíg meg nem szűnik. Aztán ismét fordítsd meg az időt.

Igen,  a SoX-ban van hasonló trükk eleve. A hang végéről lehet így vágni le a csendet: reverse silence reverse.  De pont azért h ne a megszűnést figyelje.

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Szerkesztve: 2020. 12. 22., k – 01:43

Hangszabászat 2. kör: Elég jól sikerült! Két billentyűhöz tartozó hangokat újra fel kellett venni előröl, a többivel nem gond.Rejtély! SoX-szal fel lettek szabva a nagy wav fájlok. Legyártottam az SFZ fájlt is - találtam  hozzá egy javás programot, nem kellett szkriptet írni rá. Ki is próbáltam már, elég jól szól! A latency érezhető - valószínűleg szabni kell még a hangok elejéből. Még az SFZ opcode -okkal finom hangolni kell a dolgokat.  Ebbe jobban bele kell merülnöm, mert elég komplex anyag.  2,7 GB lett a méret. Ezen lehetne még csökkenteni. Mert van ilyen loop funkció az SFZ-ben. A hang lecsengésénél ezt szokták használni. Akár több másodpercet is ki lehet vágni a hangból és azt egy pár század v. tized másodperces rész állandó újrajátszásával helyettesíteni. Így kisebb lesz a méret. Mivel a forrásul szolgáló digitális zongorám eleve így állítja elő hangot ez nem jelentene érezhető minőségromlást. De elég babrás meló megkeresni minden hangnál h melyik részt loopolja és melyik részt helyettesítse a looppal.  Ezt elég nehezen tudom automatizálni. Legalábbis egyszer minden egyes hangot ( több mint 1400) fel kéne térképeznem ilyen szempontból. Lehet h kihagyom :)  Egy másik SFZ virtuális zongoránál vannak külön hangminták a kalapács mechanikájának hangjára. Azt felvették egy rendes zongoránál. Lehet h azt még megpróbálom hozzáilleszteni, csak próbaképp, h élethűbb lesz-e tőle a hangzás. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Szerkesztve: 2020. 12. 26., szo – 19:14

Nem tudom, hogy érdekel-e valakit, de azért leírom a fejleményeket.  Már most is elég élvezetes játszani ezen a virtuális zongorán, szépen szól, alig kér erőforrást pl. a DSP load olyan 5-8% körül van.

Az egyik (a kisebbik) probléma, hogy mint jeleztem korábban, az SFZ fájlt egy Javás programmal állítottam elő, amit a neten találtam. 
Ez következőt követte el: 
Előzetes és szükséges magyarázatként visszatérek arra, h különböző erősségű billentyűleütéshez tartozó hangfájlokkal dolgozom. Elméletileg -egy billentyűhöz tartozóan-  128 különböző erősséget tudna kezelni a rendszer, de ez a nagy felbontás nem feltétlenül szükséges, így a gyakorlatban csak 16 erősség van felvéve (ezek előre meghatározott MIDI értékek alapján álltak elő) és a köztük lévő erősségekhez tartozó hangzás um. számolva van (azokhoz nem tartozik felvétel). Ezért ezekhez hozzá kell rendelni a 16 felvétel közül valamelyiket, amihez képest számolja majd magát. És itt érünk a problémához. A felvett hangokhoz tartozó MIDI velocity (leütési erősség) értékek a következők 13;30;35;40;45;48;53;60;68;76;84;92;100;108;116;127. Az említett Javás progi úgy osztotta be h a 0-13 értékekhez a 13-as felvételt rendelte; 14-30-asokhoz a 30-ast; 31-35..35-ős és így tovább. Ezzel az a baj, hogy ott történik a váltás ahol a felvett hang van. Pedig nyilvánvaló, hogy mondjuk a 14-es értékhez a 13-as felvett minta áll közelebb (előnyösebb lenne az alapján számolni)  és nem a program által hozzárendelt 30-as felvétel. Tehát egy ilyen eltolást kell csinálni olyan erősségi tartományba, aminek a közepén helyezkedik el az az erősség, amihez a felvett minta tartozik. Tehát pl. a 35-ös, mintához nem a 31-35, hanem 33-38 tartománynak kéne tartoznia és így tovább szépen elosztva. Ennek előállításához saját szkriptet kellet írnom, amit végül sikerült odáig bonyolítanom, hogy egy nagy xml fájl tartalmaz mindenféle hanghoz tartozó adatokat és abból xslt-vel szedem ki amire éppen szükség van. 

A másik probléma bonyolultabb. Ez annak a megfejtésére és irányítására vonatkozik, hogy hogyan számolja ki a köztes hangokat a linuxsampler? Tehát  vegyük pl a 13-as és a 30-as felvett hangot! Ezen hangfájlok közt a vizuális megjelenítésekor is érzékelhető különbség van az alakjukban. Persze nagyon hasonlítanak egymásra, de azért ha jobban megnézzük máshol vannak a tüskék stb - gondolom el tudjuk képzelni! De nem csak ez (tehát h más a hang) a különbség, hanem h a 13 halkabb, 30 pedig hangosabb. Tehát a 14-29 köztes hangok esetén nem csak az a kérdés, h melyik mintát vegye alapul, hanem, hogy milyen "hangosság" tartozzon hozzájuk? És a helyzetet tovább bonyolítja, hogy itt eléggé eltérés van a magas ill. a mély hangokhoz tartozó billentyű  esetén. Valószínűleg nem lehet majd univerzális szabályt alkotni!  Fel kell térképezni azt, hogy a felvett mintákhoz milyen "hangossági" tulajdonságok tartoznak. Van itt Peak Level, RMS max stb  jobb és bal csatornák külön elég bonyi elsőre - meg kell érteni! Ezeket majd valamilyen rendszerbe kell szervezni, h ki lehessen számolni a köztes hangokhoz tartozó hangossági tulajdonságokat - egyenlőre valami táblázatkezelőre gondolok (itt köszön vissza az XML előnye).  További kérdés, h miként tudom úgy paraméterezni a linuxsamplert , h úgy számolja hangokat, ahogy szeretném?  Ezt SFZ fájlon belül különböző opcode -kkal lehet befolyásolni. Úgy tűnik alapvetően amp_veltrack érték lesz az, ami kell nekem. És azzal kell majd játszani, hogy melyik mintákra ill. minták csoportjaira milyen amp_veltrack értéket adok meg.  De sok opcode van és eléggé el vagyok veszve bennük egyenlőre. 

Távolabbi kilátások: a Pianoteq hangok kinyerése a demo verzióból nehezítve van két dologgal. Az egyik, h 20 percenként újra kell indítani a programot. A másik, h 8 meghatározott billentyűhöz egyáltalán nem tartozik semmilyen hang, azok némák a demóban. Mivel itt "in the box" fog futni minden, nincs DA/AD átalakítás, meg midi időzítés probléma valahogy úgy kéne h este elindítom a szkriptet és reggelre (jó pár óra múlva) ott mosolyognak rendezetten a kinyert minták. Lehetőleg semmi beavatkozásra ne legyen szükség! Lehet itt nem 16 hanem 32 különböző erősségű billentyűleütéshez tartozó hangokat fogok rögzíteni billentyűnként. Ez belefér még a 20 perces időbe. A "néma" billentyűket majd a linuxsampler fogja kiszámolni egy-egy közeli hangból transzponálva.  

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Elég változó árak vannak amúgy, de vagy windowsra v. macre a választék! A Pianoteq van linuxra, de annyira nem vagyok tőle elragadtatva amúgy. Sztem elég szintetikus|nylon hangja van. Ezzel együtt valószínűleg a legjobb opció linuxra - de a Stage (fullos) verzió rohadt drága, ráadásul még külön meg kell venni  egyes "zongorákat"  hozzá.  Más vonal, ami ingyenesen elérhető az Alexander Holm féle Yamaha C5 mintáiból készült zongora. Eredetileg oktávonként három billentyűt vett fel a többi számolva van. Aztán a legkülönbözőbb emberek ebből gyártanak mindenféle verziókat. Van még egy pár ingyenesen elérhető - jellemzően valami fizetős dolog lebutított verziója - amikkel lehet próbálkozni. De IMHO a Kawai zongimból nyert hangminták már most jobban szólnak ezeknél.

Másik h azért eléggé aljas trükkök is be vannak itt vetve marketing vonalon.  pl Ravenscroft bazira jól szól itt. Sztem ez a felvétel totál utólag lett masterelve és képtelenség ilyenre beállítani a valóságban a zongorát. (többen is írják a kommentekben, h küldje már el nekik a beállításokat) És ezt már szakértőtől is hallottam, hogy élnek ilyen eszközökkel az audio szoftvereket gyártók :-(  Szal nem mind arany ami fénylik! 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

"A Pianoteq van linuxra, de annyira nem vagyok tőle elragadtatva amúgy. Sztem elég szintetikus|nylon hangja van." - Na ja, merthogy "the instruments are physically modelled" - azaz nem létező hangszer valós hangját digtalizálták be, hanem kimatekozták, hogy szerintük hogyan szól egy zongora. Na emiatt a vegytiszta műanyag hangzás.

"Yamaha C5 mintáiból készült zongora." - azaz egy már digitalizált és szoftveresen megcsócsált, majd visszajátszott hangot darált be újra... Mint a kétszer rágott kaja... Bár látom, te is valami hasonlót akarsz elkövetni :-D

Ha az a Clair de lune szerinted "jól szól"... Lehet, de meghallgatva azt, meg egy Roland-ot, meg hab a tortán alapon egy Steinway-t - szóval zongorázni lehet a különbséget :-)

Nem, félreérted! A C5 egy valódi zongora. A Yamaha gyárt igazi zongorákat is, nem csak digitálisakat, meg motorcsónakmotort :)  Na és ennek felvett hangmintáiból van a Salamander virtuális zongora [A.H.]. Ennek mérete 2 GB körül van 48kHz 24Bit wav-ok.  És van akinek ez túl nagy méret - mert pl be akarja tölteni a szintetizátorba és ott limitált a méret - és akkor csinál belőle kisebbet pl itt Korg szintetizátorhoz, és azért élvezhető: https://www.youtube.com/watch?v=iRJWOn_c050

Persze, vágom h elég groteszk h Pianoteqből csinálok mintavételest :)

Nekem nagyon tetszik Clair de lune-os videó. Meleg, telt, vibráló hangja van, kb mintha usb-vel lenne bekötve a lelkemhez.  Rolandoknak is szép hangjuk van! Régebben mindig mentem ilyen hangszer-kiállítós-vásáros dzsemborikra, ahol lehetett próbálgatni is a cuccokat. Ott volt alkalmam kipróbálni a Rolandokat is. pl játszottam V-Pianon, ami akkoriban a csúcs színpadi zongijuk volt, konkrétan azon, amit előtte Presszer használt  a koncertjén :) SuperNATURAL hangzás lenyűgöző! 

De nyilván ez a virtuális zongora dolog egy kényszermegoldás több szempontból is, lakótelepen ezt tudom fejhallgatóval használni, nem zavarok senkit. Természetes, h valódi zongora, pláne egy Steinway összehasonlíthatatlanul jobban szól. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

"Nem, félreérted! A C5 egy valódi zongora. " - Ezt benéztem... "rendes" zongorának ilyen nevet adni... No mindegy :-)
A Clair de lune-os videó _önmagában_ tényleg jó; maga a darab a kedvenceim között van, ezért elég sokat hallgattam "rendes" zongorán előadva, neves és kevésbé ismert előadóktól, úgyhogy nehéz elfogulatlanul nyilatkoznom róla - az biztos, hogy nekem átjött (ma reggel csináltam "vaktesztet" két másik felvételt mellérakva), hogy talán nem valódi zongora.
A V-Piano persze, csúcs - nekünk csak egy XV-2020 "jutott" meg egy SRX-02 kártya bele, de itthoni zongorának ez is teljesen jó - anno pc-s vonalon is volt néhány elhalt kísérlet, de valóban minőségi zongorahangzást nem nagyon tudott semmi, pláne elviselhető késleltetés mellett... Aztán "így maradt" a cucc :-)
Ja, ezt is lehet fülessel használni :-)

Így, betűkkel szokták jelölni a zongoragyártók a különböző modelleket. pl Steinway "D" v. "B". A Yamaha meg C-vel többek közt. 

Clair de lune -os videóban egy virtuális zongora szól. Aminek az alapja - most egyébként mellékesen - egy valódi akusztikus hangszer. De az a videóban az átverés, hogy hangzást amit hallasz azt nem lehet előállítani a virtuális zongorával. Azt még utólag (a felvétel után) manipulálták um. masterelték.  

Vegyünk egy audio termékeket gyártó vállalatot, hívjuk ATGYV-nek! ATGYV gyárt fizikai és szoftveres eszközöket is. A fizikai eszközök elképesztően drágák, és a legmenőbb stúdiók tudják csak megvásárolni. Ennek megfelelően hangzásuk is első osztályú. Na most az ATGYV-nél szoftvereket is gyártanak kvázi ugyan arra funkcióra amire fizikai eszközt pl dinamikaszabályzót.  És marketing vonalon azt próbálják elhitetni a vásárlókkal, hogy szoftveres termékük nagyon hasonló, már-már ugyan olyan mint a fizikai eszköz, de persze jóval olcsóbb. Ezért csinálnak olyan videókat amiben látszólag a szoftveres terméküket használva állítja elő a gyönyörű hangzást a szereplő, miközben valójában azt a hangzást a méregdrága fizikai eszköz tudja csak produkálni. Ez egy átverés, h kispénzűek vegyék meg szoftverüket - ha már a hardware-re nincs pénzük.  Az ilyen marketing trükkök ma már nem  kivételesek. 

Sztem ebből az XV-2020-ból is ki tudnám nyerni a hangmintákat :)

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

"De az a videóban az átverés, hogy hangzást amit hallasz azt nem lehet előállítani a virtuális zongorával. Azt még utólag (a felvétel után) manipulálták um. masterelték. " - lehet, hogy pont ez az, ami érződik rajta - mint amikor túltolják a ps-t egy fotón... Vagy egyszerűen csak túl sok valódi zongorás felvételen hallottam már... Nem tudom.

A 2020 egy elég alap darab volt anno a Roland palettájában emlékeim szerint, és elég összetett szerkezstővel is megtámogatta a gyártó, úgyhogy igencsak bőséges lehetőséget adott a hangzás maszírozására, de azért koncertzongora hangzáshoz az srx-02 azért kellett hozzá :-)

Ez az SRX elég jól szól itt - máshol már kevésbé. Életteli, nyílt, tiszta hangja van Rolandos hangszínezéssel.  Vicces a honlapjukon a megfogalmazásextremely rare and elegant European piano.  Hja, azt mégsem írhatták, hogy Steinway v. Bosendorfer:) pedig sztem valahova kettő közé akarták belőni (olyan Steinway-Bosendorfer, ami Roland) ami mondjuk tekintve h a Roland japán cég elgondolkodtató...éppen Kawai-jal meg Yamahával autentikusabbak lennének ;)

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Mondjuk azért érheti meg kimenteni belőle a hangmintákat, h ha egyszer bedöglik valamiért és nem javítható, pláne h egy régebbi darab, akkor a mintákból össze lehet dobni egy virtuális zongit és nem kell egy kisebb vagyont költeni új kütyüre. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

A virtuális zongi, azaz midi-n vezérelt pécés hangkeltés... Mondjuk úgy, hogy "nem jött be" eddig, úgyhogy ha bekrepálna, akkor vagy egy másik midi-box kerül beszerzésre, vagy pedig lesz egy eladó zongorabillentyűzet, és jön helyette egy komplett digit. zongora. De ez csak az egyik oldala a dolgoknak, a másik, hogy az analóg output-ot maszírozni addig, hogy hallgatható patchkészletet tudjak belőle kreálni sem időben, sem erőforrásban nem érné meg, pláne úgy, hogy a Roland minden zongorahangot több hangmitna egymára rétegzésével állít elő, azaz layerenként (xv-editorral talán megoldható, hogy egyszerre csak egy minta legyen használva) kéne minden hangot többféle hangerővel lejátszani és rögzíteni (egy jól irányzott MIDI-fájl lejátszásával még működhet is), plusz a burkológörbékre is figyelve szeletelni a felvett analóg anyagot... Ezért írtam, hogy egy jó hangkészlet nem véletlenül kerül annyiba, amennyi...

Pedig hát sztem pc-s zongi a jövő. Legalábbis én nem vennék még egyszer kompakt digitális zongorát, olyat amibe minden bele van építve. Nem mintha ez a Kawai rosszul szólna, nincs vele különösebb bajom, de azért ha elromlana valószínűleg elég körülményes és drága lenne megjavíttatni. Szal mindenképp olyanban gondolkodnék, hogy külön billentyűzet, külön hangkártya, külön monitor hangfalak és PC. Így ha bármelyik komponenssel van baj, csak annak az árát bukom. Ráadásul sokkal nagyobb terem van kreatívkodni egy ilyen felállásban. Anno még kevésbé értettem a dolgokhoz és ezért vettem kompakt zongit, bár akkor is felmerült bennem már az ebben rejlő veszély. 

Amúgy ennél az XV-2020 + SRX kártya kombónál is az lehet, h a valód hangminta az nagyon kevés benne. És ebből a kevés mintából számítgatják ki - hasonlóan a Pianoteqhez - a hangzást. Ad abszurdum lehet, h csak egyetlen zongora billentyűhöz tartozó hangot/hangokat manipulálnak a teljes spektrumban. Egy alapvetően mintavételes alapú zongoránál az adatbank mérete nagyon nagy lenne 100GB+. Annak kezelése, röptében való manipulálása már egy erősebb PC teljesítményét igényli, amivel egy ilyen "box" nyilvánvalóan nem rendelkezik. Amúgy a modellezős Pianoteq is ki tudja akasztani a processzort, ha feltolja az ember az értékeket oda, ahol jól szólnak.  192 kHz mintavételen egy C2D-os 2.2 GHz-en prögő procit simán legyilkol.  És oké h megy 48 kHz mintavételen is, de ott meg szarul szól.  Itt egy RBPi-3 alapú "box" kapcsán lelkendeznek, h fut rajta a Pianoteq. Aztán ha beleolvas az ember akkor látja, hogy 22 kHz-en 32-es polifóniával fut ...izé totyog, ami hát a vicc kategória. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

A Roland, de a többi gyártó is jellemzően célhardverrel dolgozik, amik ezen a téren körberöhögik az "erősebb pécé teljesítménye" igényeket. Van, amit modelleznek velük, és van, amit hangminta-részletekből matekoznak össze - kifejezetten ilyen "matekozásra" épített elektronikával. És pont emiatt lehet a patchkészlet méretét elviselhető szinten tartani. Tizensok éve a pécés hanggenerálás gyakorlatilag a vicc kategória volt - próbáltam többféle megoldást is, késleltetés és "ne nyúlj a pécéhez, amikor megy a zongora" okán hamar kiderült, hogy célhardverrel jobban járunk - aztán "úgy maradt" :-D

De miért kéne módosítgatni a hangzást, ha az valójában élethű?  Ez egy marketing szöveg. Matekozásnak az a lényege - ahogy feljebb Te is utaltál rá egyébként - h azzal helyettesítsék a hangmintát. Mert ha nem helyettesítgetnék ilyen számításokkal, hanem a felvett mintákat játszanák vissza, akkor bizony ahhoz olyan drága lenne a hardware, hogy az felemésztené költségként a nyereségüket. 

pl. Itt egy 25 sec hangminta aktuálisan az F#1 billentyű 4-es velocityhez tartozó hang 7,2 MB a mérete.  Ezt egy sample -s felfogásban egy az egyben visszajátsszák.  Ellenben a fillérbaszós számítgatásnál azt csinálják, h megtartják kb az első 6 másodpercet utána pedig a hosszú lecsengési szakaszt egy tizedmásodperces rész folyamatos loop-olásával helyettesítik - és ezzel a töredékére csökkentik az eredeti fájlméretet. Nyilván az belátható, h az eredeti illetve a loopolt lecsengés nem ugyan az. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Csak néhány apró dolgot említek a matekozásból: burkológörbe, illetve felharmónikus húrok hangzása, lezárt/felnyitott állapotban lévő hangszer, satöbbi. Ráadásul amikor egy midi-s utasítás érkezik, hogy kéretik lejátszani az adott hanszeren adott magasságú hangot, megadott hangerővel, akkor az pöttyet bonyolultabban áll össze - szerintem olvass utána, hogy hogyan működik például az ős-öreg 2020-as: https://static.roland.com/assets/media/pdf/XV-2020_OM.pdf illetve nézz utána, hogy a jóval fiatalabb generációs V-Piano hogyan rakja össze a hangzást.

De ez mennyiben mond ellent annak, h a matekozás a hangmintát helyettesíti? És ez minden baj forrása...

pl A fedél állapota sample megközelítésben egy újabb kombinációs tényező. Minden pedálállás kombinálódik miden fedélállással és minden esetben fel van véve minden hang az összes leütési erősséggel. Így egy-egy billentyűhöz több ezer minta tartozik a különböző kombinációk miatt.  Brutális mennyiségű és összterjedelmű hangfájlok lesznek és ehhez kell olyan hardware ami képes ezeket tárolni és megfelelő sebességgel előrántani amikor szükség van rájuk. Ez a kompromisszum mentes megvalósítása a zongora hangjának a digitalizálásának. Mindenféle "matekozás" arra megy, h kompromisszumok árán (!) minél olcsóbban  előállítható hardware legyen elégséges a rendszerhez.  A kérdés csak az h mennyiben fogadjuk el ezt a megközelítést érvényesnek a gyártóktól? 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

A hardver egyre olcsóbb, néhány TB RAM ma már nem probléma, perzisztens RAM esetén pedig az a probléma sincs, hogy hosszan kellene indulnia egy elektromos zongorának (SSD-ről RAM-ba szedni a mintákat). Ahogy az akusztikus eszközöknél, valószínűleg az elektromos eszközöknél is mindig lesz különbség olcsóbb és drágább között. Például olcsóbb kategóriánál meg kell várni a bootolást (nem NVRAM-mal fut a zongora), nem tudom, ez mennyire akadály (folyamatosan áram alatt tartva ez a korlát kiküszöbölhető).

Azt olvastam h a Linuxsampler pl azt csinálja, h a minták elejét teszi csak a RAM-ba. A minta többi részét pedig akkor nyalja fel a diskről, amikor szükség van rá. Így kevesebb RAM is elég.  De így is tart olyan 30 másodpercig kb, amíg beolvassa induláskor a RAMba a dolgokat. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Persze, csak kérdés, hogy mihez képest akarunk spórolni. Ha egy 200k dolláros zongorát "sok RAM"-mal/SSD-vel ki lehet hozni 50k-ból, akkor az már jelentős spórolás. És akkor az a zongora elfér egy szobában, fülhallgatóval is lehet rajta játszani/gyakorolni. Állítólag más megszólaltatni egy nagyobb, mint egy kis zongorát (tömegből kifolyólag), így a "bárhol" való gyakorlás lehetősége új lehetőségeket is nyithat.

"És ez minden baj forrása" - Egy V-Piano szerinted hogy szól? Sz@rul? Pedig a milliós árba beleférhetne sokszáz GB-nyi hangminta és az azt feldolgozni képes dsp-mennyiség, de valamiért mégsem ezt csinálták. Ugyanis sem idő, sem erőforrás nincs valamennyi paraméter valamennyi lehetséges kombinációjához tartozó hangminta feljátszásra és utána annak az utómunkájára. A "kompromisszum mentes megvalósítás" az egy legfeljenn elvi lehetőség, de nem véletlen, hogy a hangszergyártók (nem csak a Roland) nem ebbe a csak hangminta alapú irányba mentek el. És saccra a gyártói oldalon nálad meg nálam a témához sokkalta jobban konyító szakemberek dolgoznak.

V-Piano nagyon szépen szól. De ez a kijelentés azzal terhelt, hogy az általam meglehetősen korlátozott számban próbált különböző zongorák összehasonlításával mondom. És esetleg akkor döbben rá az ember, h menyire nem szólt szépen, amikor egy annál sokkal jobbat ki tud próbálni.  

Az h nincs idő felvételre, utómunkálatra könnyen cáfolható, mivel szoftveres vonalon kezdenek megjelenni olyan megoldások amikről beszélek. pl https://www.vsl.co.at/en/Bosendorfer_Imperial  295 GB-nyi hangmintával.  Nem mondhatod h rosszul szól: Jordan Rudess plays Synchron Bösendorfer Imperial 

Természetesen a Roland szakik jobban értenek a dolgokhoz, de nekik az üzletpolitika jelöli ki az irányokat. Tulképp korábban, akár 10 évvel ezelőtt nem is nagyon állt rendelkezésre olyan technológia amivel költséghatékonyan tudtak volna ilyen méretű hangbankot kezelni. Szóval így a matekosdi bizonyos értelemben kényszerpálya is volt számukra. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Ez a VSL brutális, muszáj beidéznem a linkelt oldalt: "11 Microphone Positions / With over 4,000 samples per key and almost 20,000 samples per microphone position"

Viszont az jó hír, hogy 295GB már nem egy túlságosan elrugaszkodott mennyiség. Az sem vészes indulási idő ha SSD-ről tölti be. Ha folyamatosan áram alatt van a rendszer, akkor pláne nem jelent gondot.

Ilyen esetben az is érdekes lehet, hogy hány kimeneti csatorna szükséges a megfelelő megszólaltatáshoz, mert gondolom az sem mindegy.

Még sokáig jól fognak keresni a hangszer gyártók :-)

Igen, azért még szokni kell kicsit ezeket a számokat! 

Amúgy a Jordan Rudess féle felvételnél azért van egy olyan érzésem,  h ott még át lett engedve hangzás egyékét "vason" a stúdióban és alapból nem szól ilyen dinamikával. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

Én laikus vagyok a témában, de olvasva a hozzászólásokat és Steinway vs Bösendorfer kapcsán elindulva, szerintem Zellernek igaza van: nem feltétlenül hiába kerül sokba az, ami nem olcsó.

A leírtak alapján rengeteg elméleti kihívást kell megoldani a hang előállításához (mintavétel esetén mintát is kell venni), így egy elektromos zongora esetén szerintem a befektetett idő a legdrágább, a hangfal és billentyűzet "csak" "olcsó" körítés (hang előállításhoz igazítva a minőséget - vagy jobban sikerül, vagy kevésbé), amivel könnyebb eladni. Egy kompakt zongorát be tudsz rakni a szobába, lehet használni, nem kell egyéb vackokkal bíbelődni, kábeleket nézegetni. Ha jobb hangfalra van szükséged, rá tudod dugni.

Néhány érdekes link:

 

Ugye, az első videóból, ami abból az inkább nyilvánvaló, semmint hátsó szándékból született, h szétsavazza ezt a Williams márkát - gondolom valamiféle konkurencia harc jegyében állították csatasorba ezt Yt szakértőt - nem érdemes messzemenő következtetéseket levonni, különösen technikai kérdéseket illetően!  Felhívnám arra a figyelmed, hogy a videóban elhangzik, h 12 mikrofonnal vettek mintákat. (Most tegyük fel h ezt értelmesen kivitelezték). A kérdés az az, hogy az így felvett hangmintáknak mekkora az összmérete (sztem a felvett layerek számától függően akár TB nagyságrend), és mekkora ehhez képest a termékben fellelhető hangminták összmérete (sztem kb pár MB). Ha ezt a két dolgot össze tudnánk vetni, rögtön látszódna a hangzás különbségének magyarázata. Tehát amikor felvett hangot helyettesíteni kezdik közelítő számolgatásokkal, akkor romlik el a dolog. Persze nyilván el lehet cseszni magát felvételt is rossz és/vagy rosszul elhelyezett mikrofonok/eszközök használatával, de az más kérdés. 

Ami igazából a legnagyobb probléma lehet felvétel során az annak a technikai megoldása, h a billentyűleütések erőssége közti különbség megfelelő felbontású legyen, és minden egyes billentyűn egyformán legyen reprodukálható. Ha ezt egy emberre bízzák, legyen az akár milyen képzett zongorista 12-16 különböző erősségű felbontásnál nagyobb különbséget nem fog tudni produkálni, az meg szinte kizárt h egyformán hozza minden billentyűnél. Erre a feladatra valami céleszközt kell legyártani, ami ultrapreciziósan beállítható és az nyomkodja a billentyűket a felvétel alkalmával.

Az természetes, h az eredeti akusztikus hangszernek összehasonlíthatatlanul jobb hangja van.  De egy akusztikus hangszer méregdrága dolog, kevesen engedhetik meg maguknak. Továbbá rendszeres karbantartást is igényel.  Évente többször is újra kell hangolni.  Kb külön szoba kell neki. Társasházban megértő szomszédokat igényel. Ilyen praktikus okokból előnyösebb valamiféle digitalizált megoldás. És az meg nem lehet kérdés, h ha az eredeti akusztikus hangszer hangjához minél inkább hasonló hangot szeretnénk, akkor a mintavételes megoldás a megfelelőbb. Kellően nagy számítási kapacitással és adatelérési sebességgel rendelkező eszköz le fogja tudni játszani akár mind a 12 mikrofon által felvett hangot, úgy hogy alacsony maradjon a latency. Erre egy korszerű PC/hangkártya sztem képes.  Más kérdés, h ha maga az előállítandó hangzás nem egy létező akusztikus hangszer valósághű reprodukciója akar lenni, hanem valami fikciós/elképzelt dolog, akkor kinyílnak a lehetőségek és akár valahonnan felvett mintákat torzítgatva/manipulálva, akár a  hangot szintetikusan előállítva ill. ezeket kombinálva lehet virtuális hangszereket alkotni, amik akár szubjektíven emlékeztethetnek ennek v. annak hangszernek a hangjára. 

"antiegalitarian, antiliberal, antidemocratic, and antipopular"

" Erre egy korszerű PC/hangkártya sztem képes" - arra a szintre talán má relértek a pécék, valóban. De így is baromi sok matekot kell a hangkártya célhardverére bízni, mert a PC-architektúra nem DSP-nek lett kitalálva - nagyon nem. Tetszik, vagy sem, egy tizensok éves célhardver is körberöhögi a pécéket még manapság is, ha azokba nincs belerakva kvázi ugyanaz a hangfeldolgozásra gyártott céleszköz, amit a pécé csak vezérel, de ami gyakorlatilag önállóan dolgozik. Mint ahogy anno az XV-editorral vezéreltem a 2020-as dobozt, "tekergettem szét" a mindenféle hangszereket, hangzásokat - egy olyan gépről, ami... Mondjuk úgy, nem zenélésre lett összerakva anno.

"ha az eredeti akusztikus hangszer hangjához minél inkább hasonló hangot szeretnénk, akkor a mintavételes megoldás a megfelelőbb" - Azért a roland V-Piano alkotói ezzel a kijelentéseddel... Hogy is mondjam csak, vitába szállnának :-)

Félreértetted a videót és a szándékomat is.

A videónak az volt a kiindulása, hogy meg akarta mutatni, egy mintavételes elektromos zongora nem lesz azonos az alap zongorával (ahogy Te is írod). A Williams jelen esetben egy konkrét példa, mely azt hirdette magáról, hogy lényegében 250 USD-ért olyan hangot produkál, mint az akusztikus alapja, mely 250e-be kerül (James mindenféle jelek alapján arra jutott, hogy ez egy Fazioli). Kerített egy olyan zongorát és összehasonlította, hogy mennyire igaz a gyártó kijelentése és az eredeti feltevés/felvetés. Nyilván arra jutott, hogy más a kettő.

Van egy másik hasonló is: Kawai MP-11SE vs. Concert Grand, itt egy Steinway-hez hasonlítja a Kawait. Nem szapulásról szól, mindössze szemléltetésről (amit Te is írsz: más). Ajánlom nézd meg a srácnak több videóját, szerintem érdekes. Nekem laikusként úgy tűnik, hogy két lábbal a földön jár, reális elvárásokkal, abban is megtalálja az értékelhetőt, ami kevésbé jó. Én maximálisan pozitív/konstruktív hozzáállást látok a srácban. Nem állítom, hogy minden állítását értek, béna felszerelésemmel mindent kihallok, de még laikusként is érdekes - vagy csak laikusként érdekes? :-).

Ami az én szándékomat illeti: szerintem olyan kört futsz, amit már sokan lefutottak, nagy gyártók rengeteg időt belefektettek és nem érték (még?) el a "nagy célt". Ahogy Zeller is írta. Azaz ha ki is hozol valamilyen elfogadható eredményt, kérdés, hogy mennyire értél célba, mert a "jó" teljesen egyén függő. Persze az is egy cél, hogy magadnak alkoss megfelelőt, de a leírásaid alapján én ennél univerzálisabb célt érzek. Ne érts félre, nem támadni szeretnélek, sőt, nekem szimpatikus, mennyire belevetetted magadat, de lehet, hogy éppen nem látod egy fától, mekkora erdőbe keveredtél, esetleg célszerű újratervezni. Ezenkívül a gyártók sem hiába nem komponensenként árulják az elektromos portékájukat, aminek egyszerű üzleti oka is lehet ("Pedig hát sztem pc-s zongi a jövő.").

Azt nem tudom megítélni, hogy milyen messze vagyunk a mintavételes elektromos zongora tökéletességétől. Valamikor biztos sikerül megvalósítani, az eléggé fel fogja borítani a piacot és a szemléletet (hiszen elég lesz egyetlen jó alap zongorát készíteni, legfeljebb elit helyekre kerül majd igazi, emellett bárhol lehet azonosan gyakorolni). Talán emiatt is vette meg a Yamaha a Bösendorfert: lesz megfelelő alapjuk.

Számomra az is érdekes volt a témában (vállalom: újszülöttnek minden vicc új), hogy 88+ billentyűs zongoránál a további billentyűk nem is feltétlenül azért kellenek, hogy használják őket, hanem a szokásosan utolsó billentyűk hangzását javítsák. Ez is mutatja a hangokkal szembeni elvárások komplexitását: konkrétan az elvárást is nehéz meghatározni, hiszen 88 billentyű esetén nehéz mintavételezni, milyen lenne 88+ esetén.

Két irány van: az egyik, a felvett hangminták visszajátszása és azokkal való egszerűbb matekozás (minimum ADSR "kireszelése olyanra, ahogy az tetszik), illetve a fizikai modellezés, amiben a hangszert, mint összetett fizikai rendszert próbálják matematikai modellel közelíteni, és abból "kieső" hangot próbálják előállítani.
A megoldás szerintem valahol "középen" lesz: eredeti hang rögzítése, _és_ azt kiegészítendő fizikai modellezése a hangszernek.

A két megközelítéssel már tisztába kerültem, köszi.

A két módszert a költség fogja eldönteni szerintem, én jó esélyt látok rá, hogy olcsóbb lesz kellően sok mintát rögzíteni, mint azzal azonos hangot előállítani. A szélsőséges, előállíthatatlan hangokat pedig csak generálni lehet. Kérdés, hogy modellezés esetén miként lenne ellenőrizve/tesztelve az azonosság, ez sem feltétlenül olcsó eljárás.

Az "olcsóbb lesz"-re egyelőre ne vegyél mérget: nem a memóriachipek ára/költsége az, ami irgalmatlanul megdobja a költségeket. Stúdió- és hangszerbérlés a rögzítéshez, utónunka erőforrásigénye (a "hogy szól" nem automatizálható, n+1 embernek célszerű meghallgatnia a tervezett produktumot) az, ami a rögzítendő hangminták számánál jóval meredekebben növekszik. (dupla mennyiségű hangminta rögzítése és feldolgozása több, mint kétszer annyiba kerül.)