A torz mp3

A nejem telefonja tegnap dél körül meghülyült: az egyik hangfájlja (duma1, hosszú csend, duma2, hosszú csend) "elkezdett" "duma2"-nél torzítani. A szöveg totálisan érthetetlen, ami mondjuk egy hallgatásos nyelvgyakorlásnál nem előny. Más baja amúgy nem látszik, sem ennek a fájlnak az elején, sem egyéb anyagokban nem tapasztaltunk semmi szokatlant.

A fél estét ezzel a problémával töltöttem. 3 különböző lejátszóval próbálva, ugyanaz a hiba. "Biztos megsérült a fájl" / "biztos hiba van a flashen" jellegű hibákat feltételezve másolgattam jobbra balra - a számítógép pici hangszóróin tökéletesen szóló - fájlt. Ma megpróbáltam és másik gépen, másik szoftverrel, másik telefonra átmásolva ugyanazt - még mindig gyönyörűen szólt. Egyre kevésbé értettem. Biztos ami biztos, generáltam egy MD5, egy SHA512 és egy RIPEMD-160-as hasht - és akkor néztem ki nagyon bután a fejemből, amikor a telefonokra telepített Hash Droid pontosan ugyanazokat a rusnya sztringeket köpte ki magából. Itt azért kezdtem egyre kevésbé érteni a helyzetet, bár az megnyugtató volt, hogy talán nem sérült meg a hardverben semmi, talán nem kapott be valami furcsa vírust, talán.

De akkor mi a baj?

Aztán nagy testvér második próbálkozásra felhomályosított.

google://"android distortion play mp3" - első találat superuser.com-on: https://superuser.com/questions/1079668/android-media-playback-mp3-and-… - gyorsan felkaptam egy sztereó fejhallgatót, és máris hallottam tökéletesen. Visszakapcsolva a telefon egy szál hangszórójára máris torzít (gondolom én fentiek alapján a sztereo-mono downmix miatt).

A fene egye meg, eddig soha a büdös életben nem futottam bele ilyenbe.

Mivel a CD-t bármikor újra tudom rippelni, szeretnék csinálni egy olyan verziót, aminél ugyanez a hülye hiba nem jelentkezik. Vajon mit kéne mondjak a lame-nak? Vagy a berippelt wav-on mit állítsak mondjuk sox-szal, hogy jó legyen?

(Persze tudom, kérdést fórumba teszünk, nem blogba. Akkor csak hangosan töprengek.)

Hozzászólások

Szia,

 

Ebből nekem az jön le, hogyha úgy is monóban lesz hallgatva, akkor monóba kell rippelni és így kilövöd a downmix miatti problémát.

Így van. Régen én nyelvtanulós anyagoknál szándékosan rá is mentem erre, hogy monóban kódoljam be, mert akkor ugyanaz a bitráta csak egy csatornának jut, nem osztozik rajta kettő, és sokszor ilyen beszélős anyagoknál még ront is, ha sztereó, mivel lehet, hogy a beszélő nem egyenlően hallatszik mindkét csatornán, ami zavar lehet, érthetőséget nehezítheti, stb.. Bár a topikbeli esetben inkább a fájl hibája, hogy az egyik csatorna a másiknak az inverze, és együtt interferenciával kioltják egymást csönddé.

Encodernél meg csak is LAME-et érdemes használni, bár én már évekkel ezelőtt váltottam 44,1 kHz-es anyagoknál Ogg Vorbis-ra, 48 kHz-eseknél Opus-ra, esetleg ha lejár az AAC-LC-ről a szabadalom nemsokára, akkor az aac is megfontolandó, ezek alacsonyabb bitrátán jobbak, mint az mp3, illetve 320 kbsp-nál tudnak magasabb bitrátát is. mp3-at már csak akkor használnék, ha valami legacy eszközre vagy legacy appba lesz a fájl, ami nem tud mást lejátszani.

Nem mintha az mp3-mal baj lenne, minőségre azt sem hallom rosszabbnak, de inkább próbálok haladni a korral, ha egyszer vannak modernebb, hatékonyabb kódekek, ráadásul néhány nem licencköteles, próbálom azokat használni. Licenc már az mp3-nál sincs évek óta, mióta lejárt róla minden szabadalom globálisan, és valami 1 éven belül, vagy akár idén lejár az AAC-LC is. Igazából nekem még az mp1, mp2-vel sincs bajom minőségre, jó, azoknál viszont nagy bitráta kell, a max. 384 kbps, de ha az ember rászán annyit, akkor nem szólnak rosszul, teszteltem nemrég ezeket is mp2enc (ez az egyetlen, ami tud mp1-et kódolni) és twolame (mp2 only) enkóderekkel, lossless FLAC anyagokon.

Az AAC-LC-vel viszont van egy olyan bajom, hogy hiába is jár le róla a szabadalom, a jófajta aac enkóderek mind zárt forráskódú proprietary licences programok, Apple-qaac (ez fut Wine-ban), Nero-aac (ehhez van natív linuxos bináris). Van ugyan egy FOSS enkóder, az FAAC, de az meg tényleg minőségre fossch, videók hangsávjához megfelelő lehet, de zenéhez szerintem felejtős.

A computer is like air conditioning – it becomes useless when you open Windows.” (Linus Torvalds)

Sajnos adott esetben nem a kódoló szoftveren múlt a dolog (első kisérleteim egyikében az újrarippelt anyagot Ogg Vorbisba, máskor M4A-ba kódoltattam, a hiba mind a két esetben fennállt - tetézve azzal, hogy az egyik teszt eszköz a Vorbist ráadásul nem is szerette).

Az szívás, ha valami Vorbist nem visz, akkor valószínűleg az Opus-t se vinné. Pedig ezek jobbak alacsony bitrátás audióra, mint a lame mp3.

Esetleg akkor aac, akkor is, ha jelen esetben ez az anyag hibája volt, de az alacsonyabb bitrátás minőség érdekében inkább ajánlom a Nero-AAC-t (ez tud AAC-LC és AAC-HE-t is), illetve Fraunhofer FDK AAC (ezt csak AAC-HE-re érdemes használni). Úgy emlékszem, hogy te nem is linuxos vagy, hanem BSD-s, azon az FDK AAC az megy, valami freshport-ban vagy mire írta a net, a Nero AAC sajnos csak Win/Linux only. Esetleg Wine-ban Nero AAC, vagy az Apple-féle qaac, de az meg AAC-LC-re való csak, AAC-HE-t nem tud, ami pedig pont ilyen alacsony bitrátás anyagokra kell igazán. Az Apple-qaac egyébként is nyűgös, egy spéci script szedi ki az iTunes telepítőjéből, és Wine kell a futtatásához, ha kéred, adok a kész qaac.exe binárishoz linket.

A computer is like air conditioning – it becomes useless when you open Windows.” (Linus Torvalds)

De akkor mi a baj?

Vasreszelék a hangszórón?

Viccen kívül én notebook hangszóróval jártam így, hogy bizonyos hangokat torzított, majd kiganézva jó lett.

"tegnap dél körül meghülyült"

Egyik napról a másikra mono lett a telefon hangszórója? Vagy mi történt?

Az történt, hogy most először játszotta le az ominózus fájlt, ami ezt az élvezhetetlen hangminőséget produkálta.És ami számomra kissé furcsa, hogy mint írtam, semelyik másik fájllal nem csinál(t) ilyet. és a júzer azért júzer, hogy ne teljesen pontosan írja le a hibát.

Nehezítő tényező volt, hogy az általad felvetett információ is elhangzott (*). Ráadásként ugyanez a saját telefonomon is megtörtént: egyszer nálam is rosszul szólt, másik alkalommal tökéletesen. És kellett hozzá némi fejvakarás, hogy feltűnjön, hogy a rossz esetben a telefon saját hangszóróján (azaz monóba keverve), a jó esetben pedig egy sztereó fülesen keresztül hallgattam.

(*) "Délelőtt még nem volt semmi baja."

Mentsd csak az egyik csatornát az mp3-ba:

sox stereo.mp3 mono.mp3 remix 1,2 0

vagy valami ilyesmi

„Niemand ist unnütz! Man kann immer noch als schlechtes Beispiel dienen!”

dzsolt

Mentsd csak az egyik csatornát az mp3-ba:

sox stereo.mp3 mono.mp3 remix 1 1

A "duma", ha egyébként nem lényeges a sztereó információ, úgy monósítható, hogy kiválasztod az egyik csatornát. (Ezt olyan mondta, akinek digitális hangmérnök a végzettsége.(Nem én.) Tehát vita nincs!)

Az egy hangszórós lejátszás alapértelmezetten ("sox nyelven beszélve" ;)): remix 1,2 - azaz a két sztereó csatornát összeadja és automatikusan fél hangerőt állít be az egyetlen kimenő csatornán. A kérdéses esetben pont ez működik rosszul.

Az eredeti kérdésre a válasz: Nem tudjuk mit bűvészkedett az alkotója. Ha mégis szükséges a sztereó visszaállítása - és ez éppen lehetséges - akkor meg kell nézni hangszerkesztő programmal, hogy mi történhetett.

A superuser-es fórumban is ezt írják, ha jól értem. Ami érdekes lehet számomra, hogy szerepel ott még két megoldási javaslat is, amiből a második rész számomra megcsinálhatónak tűnik (de még mindig nem értek hozzá):

"invert one of the L/R channels,which is a better choice in the given case"

ami az én értelmezésem szerint azt jelenti, hogy a végeredmény még mindig sztereó lesz (sztereó kimenet esetén), viszont ennek a verziónak a "monósítása" esetén nem így (hanem másként, de talán érthetően) lesz rossz az eredmény. Most tekintsünk el attól, hogy valójában tényleg értelmetlennek tűnik egy locsogást sztereóban tárolni / hallgatni (bár pl. párbeszéd esetén azt gondolom, hogy van értelme az egyik csatornán az egyik, a másik csatornán a másik beszélőt hallani, és az adott esetben valóban 2, megkülönböztetendő beszélő van).

Kicsit sötétben tapogatózom, de ha jól értem, fenti eredmény elérhető a

$ sox eredeti_sztereo.wav új_sztereo.wav remix 1 2i # vagy remix 1i 2

paranccsal.

Szerk: az már látszik, hogy fentiek egyike se jó, mert (számomra érthetetlenül) a "duma1" rész totálisan elveszik (mind a két esetben).

Miért érthetetlen, ha elvész a "duma1"? Az csak annyit jelent, hogy abban a részben azonos ampitúdóban és azonos fázisban van jelen a két csatornában, így akár L-R, akár R-L nullát ad eredményül minden időpillanatra.

Egyébként szerintem megvan a megoldás. A "duma1" és "duma2" részt összefűzték egy file-ba, a míg "duma1" helyesen, azonos fázisban van keverve, addig "duma2" hibásan, az egyik csatorna invertálásával.

Én azt csinálnám, hogy "duma1" és "duma2" között elvágnám a file-t - nem split-tel, mert akkor elmúlik az mp3 header, tehát természetesen Audacity-vel -, majd a második rész egyik csatornáját invertálnám, ezt követőenösszefűzném a file-t, majd monora keverném rendesen, azaz egyik csatotnát sem invertálnám a keverés során.

Azt nem tudom, hogy a file valamilyen egyszerű, buta védelmének szánták-e ezt a megoldást, vagy csak ennyire ügyetlenek voltak, de az a megoldás, amit fentebb írtam.

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

Megnéztem Audacityben. Majd megvilágosodtam. (No jó, ez túlzás.) A frissen berippelt wav-ból csináltam egy olyat, ahol tényleg csak az egyik csatornát tartottam meg - de azt legalább 2x. Így ez most "sztereó" (khm), de a downmix nem rontja el.

$ sox sztereo.wav uj_sztereo.wav remix 1 1 # (*)

Ez most 2 csatornás, és jól szól a telefonon is, meg hangszórón is. Akkor mehet mp3-ba :-)

(*) Ezt írta bucko fentebb, kivéve, hogy azt állította, hogy ez mono lesz. Hát 2-csatornás mono. De nekem így pont jó :-)

Igen, ha a tartalom nem indokolja annak sztereóságát, nincs olyan, ami csak a másik csatornában van meg, akkor simán megteheted, hogy csak az egyik csatornát tartod meg. De fontos, hogy ne legyen olyan szövegrész, ami csak a másik csatornában van.

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

Az, hogy a hanganyag egy részét nem fogja hallani, mert ha teljesül a hanganyag egy részében az L = -R feltétel, abból bizony keverés után csönd lesz. Ha csak majdnem teljesül, akkor egy torz, érthetetlen zagyvaság. Erről szól ez a topic. :)

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

A telefonnal nincs baj, vagy hát ahogy vesszük. Fülesre kiteszi sztereoban a hangot, az úgy jó is, de saját hangszóróra monora keveri, s máris megvan a baj, mert lehet olyan jelet generálni, ami keverés után csend lesz, vagy egy torz, érthetetlen valami.

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

(*)

Háát, ha számodra a

  • sztereó *
  • több csatornás felvétel
  • lejátszás egy vagy több hansugárzón

nem teljesen tiszta, akkor a helyedben utánanéznék. Mert anélkül nehéz ám beszélgetni!

A javasolt remix éppen azért olyan, amilyen, mert egyes lejátszók nem értik az 1 csatornás felvételt, mert minden IS kétcsatornás. ;) Két hangszórón lejátszva pedig mindkettő fog szólni.

Ha a kérdéses szerkezeten jól szól a valódi sztereó felvétel, akkor - egy hangszóróra - elvégzi az (1+2)v0,5 keverést.

(*) A megszerzett tudásodhoz a vizsgakérdések:

  • Ha sztereó felvételt 4 hangsugárzón hallgatsz, akkor kvadrofon lesz?
  • Ha egy pályaudvaron 12 hangszórón szólaltatják meg a hangbemondást, akkor az
    • monofon,
    • sztereofon vagy
    • dodekafon hangzás?
  • Mindketten bekapcsoljuk a Sokol rádiónkat és a középhullámú Kossuth Rádió adását hallgatjuk.
    Sztereofon lesz-e a hangzás?
  • Egy 7+1-es hangrendszeren hány hangszóróból kell szólnia
    • a beszédnek,
    • a sztereofonikus zenének és az
    • 1930-ban a Carnegie Hall-ban készült szimfonikus felvételnek (ami vélhetően monó)?

Kösz, kell is, és fogok is majd még olvasgatni a témában. Bár mint látható, beszélgetni úgy is lehet, hogy az egyik többet tud egy témáról, a másik meg kevesebbet, vagy azt a keveset is rosszul, esetleg éppen semmit.

A történeti hűség kedvéért leírom a végső megoldást.

- még mindig motozott a fejemben a korábban már írt (máshol olvasott) "invertáljuk az egyik csatornát, és úgy javítsuk ki" megoldás

- de szöget ütött a fejemben amit locsemege írt a darabolásról meg az esetleges hibás keverésről

- meg ugye ott volt az általam nem (vagy félre)értett sox ... remix is.

Az ominózus anyag egy szöveges hangfájl, 3 jól ekülöníthető része pedig gyanúsan egy sablon kezdő és végszövege, és egy közé szúrt "tananyag" . Szerintem (!) külön-külön felvett anyagok valamilyen összevágásával állt elő. Ez szerintem "könnyedén" lehetővé teszi azt, hogy fenti probléma előálljon, pont ahogy locsemege leírta.

- Szóval szépen kikerestem, hogy ez a 3 szakasz hol kezdődik / végződik

- aztán (csakazértsem Audacity-vel hanem) a sox trim parancsával 3 részre vágtam

- a középső részt szintén sox-szal "remix 1i 2" formában átalakítottam

- végül még mindig a sox-szal összefűztem.

Majd az egészet (immár) Audacityvel ellenőriztem, ami az eredeti anyag mono-ba alakításánál szépen visszaadta a telefonon is hallható borzalmat, a fenti módon átalakítottnál pedig szépen hallható volt minden rész.

Így:

$ sox 4-Track_4.wav menetek.wav trim 0 2:05 : newfile : trim 0 3:25 : newfile : trim 9
$ sox menetek002.wav proba.wav remix 1i 2
$ sox menetek001.wav proba.wav menetek003.wav vegso.wav

Ez nekem jónak tűnik, és mivel a kívánt módon működik (szól a telefonon is, meg fejhallgatón is), asszem megállok a megoldáskereséssel.

Mindenkinek köszönöm a segítséget, iránymutatást.

Szép munka.

Mivel ismered a hanganyagot, valószínűleg helyes a feltételezésed az összevágás módjáról. Kérdés, hogy ez a hiba kósza egérsuhintás vagy szándékos rontás eredménye.

Némi rutin után érdemes az ilyen műveletsort "grafikus" módban elvégezni. Sokkal egyszerűbb a hiba helyének megkeresése és a hibás szakasz módosítása. Elvégre egy szöveg módosítására is inkább vim, mint sed a megfelelő eszköz.

Én meg legalább végigolvastam a sox képességeit. Éppen egy kvadrofon hangot fogok újramintavételezni, mégpedig egy 4 hengeres motor(-kerékpár) szivó nyomás értékeit 1 kHz -> 3/7 kHz. Ezt általában Sound Forge segítségével végzem, ami scriptelhető, de így nem kell ablakot nyitnom a nagy hidegben. ;)

Illetve eszembe jutott még egy paraszt megoldás. Szerintem az is működhet, ha például a jobb csatornát mondjuk 1 ms-mal hátrébb tolod időben, s utána kevered össze a két csatornát. Ennek hatására kijön a fedésből a két csatorna anyaga, de azért ez a „jóvanazúgy” típusú gányolás, mert az azonos fázisú 500 Hz-et kiszűri a megoldás, az ellenfázisú k * 1 kHz-en meg nem segít, ahol k egész. Szóval a korrekt megoldás az, amit az előbb írtam.

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

A sox, Audacity, stb. újratömöríti az anyagot. Helyette javaslom a lossless-cut nevű multiplatformos programot, az lehet meg tudja csinálni ezt az invertálást úgy, hogy nem tömöríti újra az anyagot. Ezek a lossless editorok tudnak könnyen olyat is, hogy az egyik csatornát törlik neked, ilyenkor sem kódolnak újra, a minősége a fájlnak nem csorbul.

Egyébként ez a fájl hibás keverésű, ezt a készítőjének fel kellett volna ismerni, hogy a két csatorna kioltja egymást, ilyen anyagot senkinek nem lenne szabad kiadnia a kezéből. Kicsit olyasmi, mintha valaki fehér háttérrel mikroszkopikus és citromsárga betűkkel adna ki egy dokumentumot. Nettó baromarcúság.

A computer is like air conditioning – it becomes useless when you open Windows.” (Linus Torvalds)

Mivel volt lehetőségen újra berippelni, ezért értelemszerűen a tömörítetlen anyaggal csináltam minden átalakítást, ezért a ki/be- tömörítgetés nem okozott problémát. A tesztekhez nem is konvertáltam mp3-ba, csak amikor már kész volt az anyag, akkor toltam rá egy lame-t.

Ellenben ezt a lossless-cut-ot köszönöm, meg fogom nézni, mert szoktam bent ilyen magasröptű feladatokat kapni, hogy a Teams-meeting felvételéből (amit sima MP4-ként kapunk meg, nem tom milyen codecekkel) dobjam ki az elején a "mindenki itt van?" , "halljuk egymást", stb részeket, aztán a szüneteket és a befejezés után véletlenül bekapcsolva maradt vackokat. Probléma nélkül megoldottam ffmpeg -codec copy -val, de lehet egy ilyen kattogtatós felülettel egyszerűbb lenne - az eddigi 3 perc helyett másfél mondjuk :-)

lame-nek érdemes ezeket a kapcsolókat megadni:
lame -V6 -mm

Vagy:
lame -abr 128 -q0 -mm

Ezek változó bitrátán, kb. átlag 120-130 kbps-ra tömörítenek, monóban, ami egy sávra overkill, de ha ez alá megyünk be bitrátában, akkor elkezdik a bemeneti anyagot alulmintavételezni, meg bizonyos magasabb frekiket szűrni.

Esetleg ha annyira nem ász minőségű az anyag, hogy mindegy, ha kicsit alul lesz mintavételezve, meg agyon lesz low-pass filterezve, akkor
lame -b 64 -mm

A computer is like air conditioning – it becomes useless when you open Windows.” (Linus Torvalds)

Idoraforditas mennyiseget nezve, elkuldtem volna vegyen masik telefont. Kiveve ha valami ifon200 terdkalacs.

Every single person is a fool, insane, a failure, or a bad person to at least ten people.

Kérdés: Ha van ilyen hanganyag, amiben a fázis vagy mittudoménmi pont úgy van eltolva, hogy összekeverve a hang torz lesz vagy kioltja egymást a két csatorna, azt az ember hogy képes hallani (fülhallgatót leszámítva)? Ugyanezen hangok a levegőben keveredve is kioltanák egymást, nem? Vagy ha van ilyen hanganyag, amit az ember képes normálisan hallani, akkor miért nincs olyan keverő algoritmus, ami az emberi hallással kompatibilis módon keveri a csatornákat?

Ha nem füles, akkor a hangsugárzók a térben helyezkednek  el. Az ember füleiben meg van egy igen bonyolult spektrumanalizátor + dsp + számítógép is. :-D No, meg a két füledhez nem ugyanakkor ér oda a hang.

Algoritmus az van, mindenféle. Csak az a kérdés, tudod-e melyiket válaszd? :-D

Két hangszóró van a tér két eltérő pontján, meg van két füled a tér másik két eltérő pontján. A jobb és bal füledbe az eltérő úthosszak miatt nem fog úgy odaérni a hang, hogy kioltsák egymást a hullámok. Nagyon extrém esetben az egyik fülednél egyetlen frekvenciára lenne kioltás, de a tereptárgyakról való reflexiók miatt ebben sem hiszek. De a másik füleddel ekkor épp hallod a hangot, s az agy kiegészíti, ha az egyik füllel az adott frekvencia hiányos, miközben a másik füllel jól hallod azt. És akkor még az is benne van, hogy jellemzően mozgatod a fejed, kicsit forgatod, pár centiméterrel valamerre elmozdulsz.

Ezzel szembe a két csatorna keverése steril, ha ellenfázisban van a jel, R = -L, L + R = L + (-L) = L - L = 0 simán kijöhet.

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

Lehet, hogy naiv vagyok, de szerintem ha a bal és jobb hangszóró egymáshoz közel van, én meg ehhez képest messzebb (példa: TV-t nézek), akkor a két csatorna hangja eléggé egyszerre fog a füleimbe érni, és már a levegőben kiolthatják egymást. Persze a reflexió meg egyebek miatt van random része, ami meg hallható lesz, de halkabb, tehát minimum torzul az is.

De ezek szerint nincs értelme olyan algoritmust írni, ami csak simán átlagolja a két oldalt minden pillanatban, mert annak nem sok köze lesz ahhoz, amit az ember hall, nem? Még ha nem is ilyen speciális hangfájlokról van szó, akár véletlen is lehetnek olyan részek a felvételben, hogy pl. egy hangszer hangja (ami nem pont középen volt) a jobb és bal oldal között pont akkora fáziseltolásban van, hogy eltorzítják egymást.

Amit felvettetél, egy érdekes szemléletmódbeli kérdés. Lineáris rendszerben érvényes a szuperpozíció tétele, így semmi baj azzal, ha a keverés során elromlik a hang, mert az lenne a valóság. Azért lenne, mert a valóságos modell nem ilyen steril, hogy hajszál pontosan összegződnek a pillanatértékek, hanem ahogy beszéltük is, a füleink között van távolság, van egy tereptárgy, ami a fejünk, vannak reflexiók, miegymás. Tehát valójában egy végtelenül leegyszerűsített modellt használunk monora keverésnél.

tr '[:lower:]' '[:upper:]' <<<locsemege
LOCSEMEGE

Maradjunk annyiban, hogy a hangtechnika javarészt fiziológia, amit a mérnökök a tapasztalat  és a fizika törvényei alapján igyekeznek támogatni. Ha néhány komolyabb szakkönyvet elolvasol, akkor rá fogsz jönni, hogy elkezdődött a "már semmit sem tudok" korszak. Ráadásul a hallás szubjektív is, a zenehallgatás gyakorolható, és ezeken kívül  van egy olyan része is, ami nem tartozik az előbbi kategóriákba, nem is mérhető, de létezik. Ez utóbbi a hallás bonyolultságából következik, amit a még oly fejlett technika is csak egyszerűsített közelítő modellekkel képes vizsgálni.

Lehet, hogy naiv vagyok, de szerintem ha a bal és jobb hangszóró egymáshoz közel van, én meg ehhez képest messzebb (példa: TV-t nézek), akkor a két csatorna hangja eléggé egyszerre fog a füleimbe érni, és már a levegőben kiolthatják egymást. Persze a reflexió meg egyebek miatt van random része, ami meg hallható lesz, de halkabb, tehát minimum torzul az is.

A való világban jobbára a "környezetet hallgatjuk".  A tévézésnél is leginkább a szobát hallod. A mérnök urak is találkoztak a dilemmáddal, hogy építsenek-e 2,5-3 méteres tévét, vagy van olcsóbb trükk? A sztereóhoz általában ez az ideális távolsága a két hangsugárzónak. (bázis távolság) Végül győzött az anyagi megfontolás és jöhetnek a trükkök. A hallás olyan bonyolult, hogy pont ezért néha könnyen át lehet verni. Ha sztereó jelnél kivonod a két csatornát egymásból, megkapod a különbségi jelet. Ha ezt felerősíted és hozzáadod az eredetihez, akkor már meg is növelted a bázistávolságot.

Hasonló a helyzet az 5+1 csatornás hangábrázolásnál, amikor a fél kilóméter hosszú űrcirkáló lövöldözik a lézerágyújával - egy 10 négyzetméteres szobában. :-D Még a legolcsóbb DVD játszóban is beállíthatod az egyes csatornák késleltetését, amivel átverheted a füledet. Ilyenkor sokkal nagyobb térből érkezőnek tűnik a hang. Lehet olyan kütyüt is kapni, amivel feltérképezhető és javítható a szoba okozta anomáliák egy része.

A fentiekkel szemben a rögzített hanganyagon végzett módosítások csak a felvétel körülményeihez képest módosítják a jelet. A jelet, mert a hangot még nem jelenítetted meg!

... hogy eltorzítják egymást.

Ahogy locsemege huptársunk is írta, ez inkább az analóg jelek szuperpozíciója. (összegzése) A torzítás - mint a topic címében és a kiderített hiba ismeretében - inkább szubjektív leírása a jelenségnek, de műszakilag helytelen. Mivel a fülünk is rendelkezik saját torzítással, az alacsony torzítású hangzugárzó nagy hangerőn ugyanolyan torzítást jelenthet a hallgató számára, mint néha a nagy torzítású hangsugárzó kis hangerő mellett. Talán ezért népszerű az elfogadhatatlan minőségű hangra ez a kifejezés.

A torzítás műszakilag azt jelenti, hogy az eredeti jelben olyan komponensek is megjelennek, amelyek eredetileg nem voltak ott. Éppen ezért nem hívjuk a hangerő- vagy hangszínszabályzást, de a keverést (szuperpozíció) sem torzításnak.

 

 

0

Lehet, hogy valami különös effekt létrehozása volt a cél. Nyelvi labor emlékeim szerint ül egy halom ember egy teremben fülhallgatóval a fején. Ha a két csatorna ellenfázisban van, akkor a hatás "fejen kívüli, térbeli, álsztereó". Érdekes hangzás, de monóra keverve kioltást eredményez.

Rákérdeztem. 10 hanganyag van ezen a CD-n, és mindegyik ilyen jellegű:

bevezető szöveg A előadó - szünet - valami figyelni való szöveg B előadó - szünet - záró szöveg A előadó.

Ez az egyetlen fájl okoz problémát a telefonon hallgatva. (illetve hát most már az se :-) )