Ca sa fie clar din start, in calculator nimic nu e stocat ca "sunet".
Sunetul in viata reala e transmis ca unde, vibratie. Orice vibreaza la intervale regulate face o frecventa - adica de cate ori face chestia aia (vibreaza) pe secunda. In cazul sunetului e vibratie de aer care ajunge de la sursa la ureche, unde, mai exact, vibreaza timpanul (o mica membrana pe care o avem in ureche) cu frecventa cu care o "agita" vibratia de aer. De exemplu, atunci cand dai cu bota intr-un butoi, plasticul (sau tabla) butoiului agita aerul inainte si inapoi sub forma de unda, ceva de genul:
...in functie de cum se misca aceasta din cauza ca l-ai pleznit, apoi, tot asa mai departe, pana la ureche. Sau cand ciripeste o pasare, corzile ei vocale "comprima si dilata" aerul astfel incat se face o frecventa specifica formei gatului pasarii.
Acum, sa incepem sa intram in pita.
Sursa producatoare de sunet care ne intereseaza pe noi acum, e difuzorul. Membrana difuzorului se misca inainte si inapoi comprimand si relaxand aerul, care mai departe... stii povestea. Cum se misca membrana? E legata la un electromagnet care o misca in functie de cum trece curentul prin acesta. Daca e curent cu plus (de exemplu +5 volti) membrana merge inainte, adica iese in fata. Daca e cu minus, membrana se trage inapoi. Tot asa de zeci de mii de ori pe secunda.
Bun. Sunetul digital.
Un fisier de sunet, adica o melodie (nicolae_guta_-_am_bani_by_nuntisibotezuri_ro.mp3) e o lista cu informatii de stari electrice pentru difuzor, iar difuzorul se misca dupa cum primeste voltajele dictate din lista aia, iar asta creaza sunetul - vibratiile difuzorului, miscarile inainte si inapoi in functie de cum primeste curent dictat de fisierul ala, curentul intra in electromagnet si misca membrana, care misca aerul, care misca timpanul.
Probabil tu vrei sa-mi zici "ba, membrana se misca numa atunci cand baga basu", dar ea se misca tot timpul, tu doar atunci o vezi pentru ca basul e de energie joasa si isi permite sa se "investeasca" mai mult in miscare. Dar asta e alta poveste...
Sample rate si bit depth
Sample rate
Cand artistu inregistreaza sunetul, placa lui audio "captureaza" voltaje din membrana microfonului la intervale regulate, adica ia sample-uri, mostre. Adica vede ce voltaj a fost in fir la momentul respectiv si scrie asta in fisier. Adica, intercepteaza curentul care vine din electromagnetul microfonului de zeci de mii de ori pe secunda, pentru ca in calculator nu-i ca-n viata reala unde sunetul e continuu, necuantificat. Si cand canta (sau vorbeste), frecventa din corzile lui devine frecventa cu care se misca membrana ->electromagnetul -> curentul din fir -> apoi se reduce la mostrele pe care le ia placa si le salveaza in fisier, iar atunci cand dai play la melodie redai aceleasi voltaje inapoi in boxe sa iti miste si tie timpanul dupa cum i s-au miscat lui corzile vocale.
Intr-o secunda sunt foarte multe oscilatii de curent, pentru ca sunt multe frecvente, dar toate oscileaza undeva intre
-5 si 5 volti.
Placile audio moderne normale au sample rate de 44100 Hz (44.1KHz), adica salveaza voltajele primite de 44100 de ori pe secunda si le stocheaza in fisier sub forma de informatie sau le trimite direct in boxe, dupa caz. Cand redai sunetul, placa audio nu mai trebe sa faca niciun "snapshot", ci doar genereaza voltajul in functie de starile din fisier.
Placile audio profesionale, "excentrice" sunt capabile de un sample rate de 96 KHz sau 192 KHz! Asta din urma e de trei ori mai mult decat ce putem noi sa percepem.
Da' boss, noi nu percepem 44KHz, ci doar undeva in jur de 22KHz!
Stiu. Noi percepem maxim 22 KHz. Dar tehnica digitala dubleaza asta ca sa cuprinda si partea de jos a undei (polaritatea -minus ), altfel n-ar fi 22Khz, pentru ca n-ar avea opusul ca sa poata forma o unda digitala completa. Deci pana la urma tot 22KHz iese din boxe.
44KHz (sau 96KHz... etc) e doar frecventa la care se face sampling la unda si nu frecventa finala. Tehnica asta de dublare, frecventa asta de sampling se numeste frecventa Nyquist, numita dupa inginerul Harry Nyquist.
Chestia e simpla. Cand sunetul e ascutit, subtire ("sss" "iiiiii" "țțțț") e frecventa inalta, cere energie mai multa, trebe facute mai multe sample-uri ca sa poata reda sunetul ala. Cand sunetul e gros, labartat ("ooommm" "mmmmm" "bum bum bum") e de frecventa joasa si nu cere atata energie, prin urmare sunt mai putine sample-uri.
Acum probabil intelegi de ce se aunde mai "infundat" un sunet pe care-l salvezi cu un sample rate scazut - pentru ca nu-s salvate frecventele mai inalte deoarece sampling-ul nu s-a facut mai des, sare peste ele si salveaza doar ce-si "permite", ce cere energie mai putina, joasele, frecventele reduse.
Asta e motivul pentru care auzi doar bass-ul prin perete lui vecinu' (sau vecinu' prin al tau).
Acum probabil intelegi de ce se aunde mai "infundat" un sunet pe care-l salvezi cu un sample rate scazut - pentru ca nu-s salvate frecventele mai inalte deoarece sampling-ul nu s-a facut mai des, sare peste ele si salveaza doar ce-si "permite", ce cere energie mai putina, joasele, frecventele reduse.
Asta e motivul pentru care auzi doar bass-ul prin perete lui vecinu' (sau vecinu' prin al tau).
Bit depth
Sunetul nu are doar o frecventa, adica mai subtire sau mai gros, ci si o amplitudine, adica mai tare sau mai incet. Daca sample-rate-ul are treaba cu frecventa, bit depth-ul are treaba cu amplitudinea undei. Dar daca n-ar fi amplitudine, n-ar fi nici frecventa, pentru ca o unda trebuie sa fie ceva ce oscileaza in amplitudine, altfel n-ar fi nicio frecventa de "amplitudini".
Bit depth inseamna "adancimea bitilor", pe care il intelegi astfel: degeaba are sample rate mare daca n-are la ce amplitudine sa faca sample-urile. Degeaba ai facut multi carnati daca esti la dieta si nu-i mananci. Degeaba ai parapanta daca n-ai dealuri destul de inalte de pe care sa sari.
Bit depth-ul face amplitudinea, iar sample rate-ul ia mostre din amplitudinea aia, ambele astfel reconstruiesc sunetul. Sunt complementare.
Cand sunetul e complex, adica are multe nivele de amplitudine (cum ar fi o fractiune de secunda dintr-o melodie), ai nevoie si de un sample rate mai mare, ca sa nu rateze amplitudinile mai dese.
Numarul maxim de biti din bit-depth se mai numeste si rezolutia sunetului, sau a placii audio. (8 bit, 16 bit, 24 bit).
Bitrate
Atatia termeni, frate... "bit rate", "bit depth", bit incolo, bit incoace.
Bitrate-ul e un concept mult mai general, care ne ajuta sa masuram viteza, sau calitatea, in cazul asta. Bitrate-ul unui fisier audio e sample rate-ul lui combinat cu bit depth-ul lui, ca sa "dea" o unitate de masura, ca sa putem masura fluxul de sunet digital.
Dar pe asta il stii mai bine decat crezi. Ai vazut (sau ascultat) mereu melodii de 192 kbps, 224 kbps, 320 kbps, ei bine acesti "kbps" e bit rate-ul. Cati kilobiti pe secunda ies din calculator in difuzoare, asta-i bit rate-ul. Cu cat mai multi biti ies din fisier/boxe, cu atat se aude melodia mai bine, pentru ca inseamna ca are sample rate+bit depth mare, care impreuna dau cantitate de biti per total mai mare.
"Rate" inseamna mai precis viteza, si anume cea de intrare/iesire. Cu cat e mai mare viteza, cu atat e mai mare cantitatea.
Bitrate-ul se aplica si la video, nu doar la audio.
Bitrate-ul e un concept mult mai general, care ne ajuta sa masuram viteza, sau calitatea, in cazul asta. Bitrate-ul unui fisier audio e sample rate-ul lui combinat cu bit depth-ul lui, ca sa "dea" o unitate de masura, ca sa putem masura fluxul de sunet digital.
Dar pe asta il stii mai bine decat crezi. Ai vazut (sau ascultat) mereu melodii de 192 kbps, 224 kbps, 320 kbps, ei bine acesti "kbps" e bit rate-ul. Cati kilobiti pe secunda ies din calculator in difuzoare, asta-i bit rate-ul. Cu cat mai multi biti ies din fisier/boxe, cu atat se aude melodia mai bine, pentru ca inseamna ca are sample rate+bit depth mare, care impreuna dau cantitate de biti per total mai mare.
"Rate" inseamna mai precis viteza, si anume cea de intrare/iesire. Cu cat e mai mare viteza, cu atat e mai mare cantitatea.
Bitrate-ul se aplica si la video, nu doar la audio.