16 vs. 24 bit Audio Recording Demystified

Diskussion om mysterierna bakom bitdjup, samplingsfrekvenser och ljudkvalitet

av Tweak

Audio is DATA!

Den här artikeln kommer att hållas så enkel som möjligt. Den är bara utformad för att få den nya personen att sätta sig in i frågorna och ge en stark känsla av perspektiv på vad som verkligen är viktigt. Vi kommer att tala om bitdjup och samplingsfrekvenser, hur dessa översätts till lagringsbehov, och sedan tala om de subjektiva skillnaderna mellan de två metoderna för att spela in din musik. Kort sagt, hur förhåller sig 24-bitarsinspelningar till den ”ljudkvalitet” som vi alla vill ha.

tweakspeak2 Ingen hänvisning till 16-bitars eller 24-bitars ljud som ”bithastighet”. Det kallas korrekt för bitdjup och proffsen kommer att bli så irriterade att de måste korrigera dig.

När jag först gav mig in på digitalt ljud var det en mycket enklare värld. Produkter som spelade in och genererade digitalt ljud var alla 16 bitars. Kompaktskivor, den viktigaste metoden för musikdistribution, har digitalt ljud som har ett bitdjup på 16 bitar och en samplingsfrekvens på 44,1 kHz.

Graduellt började det dyka upp produkter med ett högre bitdjup – en 18-bitars trummaskin, 20, sedan 24-bitars effektprocessorer. Sedan tog inspelningsmaskinerna steget till 24 bit. I dag är ditt ljudgränssnitt förmodligen 24 bit och låter dig välja samplingsfrekvens efter eget val, 44,1, 48, 88,2, 96 och till och med 192 khz. Flerspårsinspelare varierar mellan 16/44,1 och 24/96. När du köper en sådan måste du bestämma dig för vilken väg du ska gå och göra rätt första gången.

Så vad betyder alla dessa siffror och hur viktiga är de? Det är där vi kommer att gå in på. Först måste du ha dessa definitioner under kontroll.

Först av allt ska du veta att vi talar om data. Ettor och nollor. Det är vad vi skapar, gott folk! Allt är en lek med siffror och vad vi gör är att sätta siffrorna i ett format som låter bra.

Bitdjup hänvisar till antalet bitar som du har för att fånga ljudet. Det enklaste sättet att föreställa sig detta är som en serie nivåer, som ljudenergin kan skivas i vid varje given tidpunkt. Med 16 bitars ljud finns det 65 536 möjliga nivåer. Med varje bit högre upplösning fördubblas antalet nivåer. När vi kommer till 24 bit har vi faktiskt 16 777 216 nivåer. Kom ihåg att vi talar om en bit av ljud som är frusen i ett enda ögonblick i tiden.

Nu kan vi lägga till vår vän tiden i bilden. Det är där vi kommer in på samplingsfrekvensen.

Samplingsfrekvensen är antalet gånger ditt ljud mäts (samplas) per sekund. Med Red Book-standarden för CD-skivor är samplingsfrekvensen 44,1 kHz eller 44 100 skivor per sekund. Så vad är 96 kHz samplingsfrekvens? Du har gissat det. Det är 96 000 skivor av ljud som samplas varje sekund.

Så låt oss sätta ihop allt nu. Detta för oss till bithastigheten, eller hur mycket data per sekund som krävs för att överföra filen, vilket sedan kan översättas till hur stor filen är. Din cd-skiva är 16 bit, 44,1 så det är 44 100 skivor, var och en med 65 536 nivåer. Ett nytt ljudgränssnitt kan spela in 96 000 skivor per sekund med nästan 17 miljoner nivåer för varje skiva. Om du tycker att det är mycket data har du rätt, det är det verkligen. Bithastigheten brukar uttryckas i Mbit/sek. Men du behöver inte göra all denna matematik. Jag ska göra det åt dig. Det här är inte ett viktigt område i inspelningsprocessen att bli distraherad på. Det som är viktigt för dig är hur detta översätts till din hårddisklagring.

Utrymme som krävs för av stereo digitalt ljud

Bit Djup	Samplingsfrekvens	Bit Rate	Filstorlek för en stereominuter	Filstorlek för en tre minuter lång låt
16	44,100	1.35 Mbit/sek	10,1 megabyte	30,3 megabyte
16	48 000	1.46 Mbit/s	11,0 megabyte	33 megabyte
24	96 000	4.39 Mbit/sek	33,0 megabyte	99 megabyte
mp3-fil	128 k/bit-hastighet	0.13 Mbit/Sec	0,94 megabyte	2,82 megabyte

Så du ser hur inspelning med 24/96 mer än tredubblar din filstorlek. Låt oss ta en 3 minuter lång flerspårig låt och räkna ihop siffrorna. Bara för att sätta ovanstående i större relief inkluderade jag standard MP3-filens specifikationer.

Hårddiskkrav för en flerspelare.spår 3 minuters låt
Bitdjup/samplingsfrekvens	Antal monospår	Storlek per monospår	Storlek per låt	Sånger per 20 gigabyte hårddisk	Sånger per 200 gigabyte hårddisk
16/44.1	8	15.1 megs	121 megs	164	1640
16/48	8	16.5megs	132 megs	150	1500
24/96	8	49.5 megs	396 megs	50	500
16/44.1	16	15.1 megs	242megs	82	820
16/48	16	16	16.5 megs	264 megs	74	740
24/96	16	49.5 megs	792 megs	24	240

Bemärk att dessa storlekar inte räknar med eventuella out-takes som du kan ha spelat in men inte raderat och att de förutsätter en linjär inspelningsmetod från början till slut av låten för varje spår. De tar inte heller hänsyn till hårddiskens sektorstorlek, vilket gör att mycket utrymme på hårddisken blir tomt. Den verkliga världen kan variera.

Så du bör notera två saker nu:

1. Inspelning med 24/96 ger kraftigt ökad ljudupplösning – över 250 gånger mer än vid 16/44.1

2. Inspelning med 24/96 tar ungefär 3 1/4 gånger mer plats än inspelning med 16/44.1

Slut på den tekniska diskussionen. Är du fortfarande med mig? Låt oss gå in i det stora hela.

Bör du spela in med ett högt bitdjup och en hög samplingsfrekvens?

Nu kommer vi till den subjektiva sidan av hur musik låter vid dessa olika bitdjup och samplingsfrekvenser. Ingen kan egentligen kvantifiera hur mycket bättre en låt kommer att låta inspelad med 24/96. Bara för att en 24/96-fil har 250 gånger högre ljudupplösning betyder det inte att den kommer att låta 250 gånger bättre; den kommer inte ens att låta dubbelt så bra. I själva verket kanske dina icke-musikaliskt intresserade vänner inte ens märker skillnaden. Du kommer förmodligen att göra det, men förvänta dig inget dramatiskt. Kan du höra skillnaden mellan en MP3-fil och en wave-fil? Om så är fallet kommer du förmodligen att höra skillnaden mellan olika samplingsfrekvenser. Till exempel är skillnaden mellan 22,05 kHz och 44,1 kHz mycket tydlig för de flesta musikälskare. Ett tränat öra kan se skillnaden mellan 32 kHz och 44,1 kHz. Men när 44,1 och 96 kHz jämförs blir det riktigt subjektivt. Men låt oss försöka vara lite objektiva här.

Använd 24 bit

eller 32 bit float om det finns tillgängligt

Låt oss prata om samplingsfrekvens och Nyquistteorin. Denna teori går ut på att den faktiska övre tröskeln för ett digitalt ljudstycke kommer att nå sin topp vid halva samplingsfrekvensen. Så om du spelar in med 44,1 kommer de högsta frekvenser som genereras att ligga runt 22 kHz. Det är 2 kHz högre än vad en typisk människa med utmärkt hörsel kan höra. Nu kommer vi in på det riktiga voodoo. Audiofiler har sedan det digitala ljudets början hävdat att vinylskivor på ett analogt system låter bättre än digitalt ljud. Det finns faktiskt bevis för att analog inspelnings- och uppspelningsutrustning kan mätas upp till 50 kHz, vilket är mer än dubbelt så mycket som vår hörtröskel. Här är det stora mysteriet. Teorin är att ljudenergin, även om vi inte hör den, existerar som har en effekt på de lägre frekvenser som vi hör. Tillbaka till Nyquist-teorin: en samplingsfrekvens på 96 kHz kommer att översättas till en potentiell ljudutgång på 48 kHz, vilket inte är alltför långt ifrån den finaste analoga ljudåtergivningen. Detta får en att anta att det är samma princip som gäller. Ljudet förbättras på ett tröskelvärde som vi inte kan uppfatta och det gör det vi kan höra ”bättre”. Som sagt, det är voodoo.

Fördjupad klass: Vad är 32 bitars float point-processing? De flesta större sequencers och många av de bättre flerspåriga inspelningsmaskinerna återger ljud temporärt i ett 32 bitars floating point-format. Detta ska inte förväxlas med 32-bitars inspelning. I grund och botten läggs de extra bitarna till filen efter inspelning för att ge generöst utrymme för ljudmatematik i den digitala domänen. Innan filen skickas ut kommer den att gå igenom 24-bitskonverterarna i ditt gränssnitt. Jag tänker på ”floating point” som en skalbar decimalpunkt i en beräkning. Att ha 32 i stället för 24 register för beräkningar kommer att ge ett mer exakt resultat. Det möjliggör också vissa beräkningar som teoretiskt sett skulle vara omöjliga med strängar av 24 siffror.

Tänk dig en 16-kanalig ljudmixer som summerar, dvs. ”adderar” och matriserar 16 uppsättningar av 32 tal 44 100 gånger per sekund. Det är mycket matematik! Lägg nu till alla dessa smarta plugins som gör sin matematik ovanpå varje kanal och den där superhårda tegelväggsbegränsaren i slutet av din kedja. Yo! Vi är på gång med siffrorna, kompis!

Men när data når 24-bitskonvertern ”trunker” 8 bitar eller skärs bort. Men ändå är det matematiska resultatet mer exakt. Allt detta sker bakom din rygg och du behöver inte tänka på det.

Men ska man spela in med hög samplingsfrekvens? Okej! Kom ihåg nu att samplingsfrekvensen i enormt annorlunda än bitdjupet. Det beror på vem du frågar. En del människor säger ”Allt kommer att sluta som 44.1 hur som helst” när cd:n bränns. Andra kommer att säga att när ett ljudgränssnitt bearbetar och mixar ljud med 96 kHz blir resultatet bättre och förblir bättre även efter den slutliga konverteringen till 44,1. Och så gott som alla andra ståndpunkter tas också. Vissa säger att 16/44,1 är tillräckligt bra för CD, det är tillräckligt bra för mig. Andra säger gör 24/44.1 eftersom det inte är så mycket mer utrymme och det ökar signal-brusförhållandet. Det finns ett argument som säger att 24/88.2 är överlägset 24/96 eftersom det är en konvertering med jämnt antal som går tillbaka till 44.1.

Bitdjup. Ok, detta är evangeliet enligt Tweak! Använd 24 bit för varje inspelning om du har denna funktion. Jag har under det senaste decenniet trott på att 16 bit var rätt väg att gå och jag har absolut ändrat mig. Oavsett vad du spelar in är detta sant. Om du har en bra mikrofon, en mycket bra förförstärkare och ett rent ljudsystem och spelar in mycket dynamiska instrument som akustiska gitarrer, klassiska orkestrar, acapella-sång, kommer skillnaden att vara där. Men det är inte så att 24 bitar data gör ljudet bättre. Det gör det faktiskt inte. Vad det gör är att det ger ljudet mer utrymme att andas i det digitala ljudets numeriska värld. Kom ihåg att vi talar om siffror, beräkningar, inte analoga vågformer. Med 24 bitar data som avgränsar ditt inspelningsmedium är det möjligt att spela in extremt dynamisk musik, med mycket tysta mjuka passager och extraordinärt högljudda passager. Det är mindre troligt att tysta passager kommer att kämpa för att hålla sig över brusgolvet i ditt system. Man kan spela in utan komprimering. Man kan spela in på lägre nivåer, med mer utrymme. Detta säkerställer att enstaka toppar inte avbryts i toppen och ger konverterarna lite utrymme att andas. Eftersom du inte pressar gränserna för din bandbredd kommer dina instrument att låta klarare, och sången kan låta ”renare”, låten kommer att mixas bättre och det kommer att finnas mindre brus. Det är alltså inte så att 24-bitars inspelningar låter bättre. I själva verket kan de låta lika dåligt eller sämre än 16 bitars inspelningar. Men 24 bitar ger inspelaren ett brusgolv och utrymme för att skapa en utmärkt inspelning. Det är ett verktyg, och i rätt hand kan det blåsa bort dig, ljudmässigt.

Korg MR1000 1-Bit 5.6MHz Mobile Recorder

Med den orörda trovärdigheten och den ultimata flexibiliteten hos 1-bit-tekniken ser den nya, förvånansvärt prisvärda MR-1000 till att dina slutmixar och inspelningar på plats aldrig är föråldrade. Justera: Det nya DSD-formatet lovar att kunna spinna av kopior av våra masterinspelningar med vilken samplingsfrekvens som helst. Läs den här artikeln från Korg

När det gäller samplingsfrekvensen ska du använda en samplingsfrekvens på 44,1 om du inte har goda skäl att inte göra det. Om du gör ljud för video kanske du vill använda 48 khz eftersom många redigerare endast använder den hastigheten. Vissa typer av musik verkar gynnas något av den höga upplösningen 88,2 eller 96 khz. Akustiska instrument, som gitarrer, slagverk och naturligtvis sång, dvs. saker med känsliga höga frekvenser, verkar gynnas, men det är subtilt. Låt oss säga att du har ett ljudgränssnitt för 399 dollar med inbyggda förförstärkare. Om du byter ut din förförstärkare och konverterare mot bättre kommer du att få en större ljudskillnad vid 44,1 än om du spelar in vid 96 kHz.

När du är inne i sequencern kan ljudfiler konverteras till 32 bit för bearbetning och konverteras tillbaka till 24 eller 16 på vägen ut. Så mitt råd är att spela in med minst 24 bitar/44,1 och gå upp till en samplingsfrekvens på 88,2 eller 96 om du tycker att ditt material motiverar det (och du har diskutrymme).

Hur är det med 192khz-frekvensen? Ok, låt mig få dig att tänka på hur tillverkarna av ljudgränssnitt planerar att få dig att köpa deras produkter. Ett företag kommer ut med 192 så känner alla att de måste göra det annars förlorar de försäljning. Det är hype enligt min åsikt. Om du vill fylla hårddiskar snabbare, varsågod och använd det. Vi har diskuterat detta länge och intensivt på forumet. I slutändan är det ingen som kan se skillnaden.

Hur uppnår vi ljudkvalitet?

Människor frågar mig hela tiden, och jag rycker till varje gång de gör det: ”Vilken utrustning (fyll i det tomma… ljudkort, förförstärkare, kabel, inspelare, sequencer) ger mig den ”bästa” ljudkvaliteten?” Jag ryggar tillbaka eftersom jag föreställer mig personen som går ut och köper en förförstärkare för 500 dollar och sedan stoppar in den i sin studio, ansluter mikrofonen och konstaterar med sorg att det ”låter likadant”, ”kanske lite bättre”, um, ”svårt att säga”. Varför i helvete är det så? Huvudskälet är att allt är ett stort system och att det bara är lika rent som dess smutsigaste panoreringspott. En brummande kabel kan utplåna de vinster som gjorts av en i övrigt välklingande utrustning. En orörd mikrofonförförförstärkare som är ansluten digitalt till ett ljudkort med störningar kommer att besegras. Hela kedjan måste vara av proffskvalitet, från förförstärkare, in och ut ur konverterare, till monitorer av högsta kvalitet. Men om du har en bra signalkedja kommer även dina 16-bitarsinspelningar att låta bättre än 24/96 med genomsnittliga förförstärkare och vanliga omvandlare och monitorer.

Lynx Studio Technology Aurora 16 16-kanals digital ljudomvandlare

Den nya Aurora-serien av digitala ljudomvandlare från Lynx Studio Technology erbjuder oöverträffad ljudkvalitet och kontroll i modeller med åtta och sexton kanaler i ett enda rackutrymme. Aurora 16 har 192 kHz analog till digital och digital till analog konvertering med kontroll på frontpanelen av alla routing- och samplingshastighetsalternativ. Utökade funktioner i Aurora är tillgängliga via dator med Lynx AES16 eller via infrarött med hjälp av kompatibla bärbara datorer och handhållna Pocket PCs. Baksidan har Clock- och MIDI In och Out-kontakter och ett LSlot-fack, för valfri användning av ADAT, Firewire och andra ljudgränssnitt.

Men låt oss vara riktigt tydliga: det är inte bara utrustning. Det är teknik. Någon med en Neumann U87 på 2 700 dollar och en förstklassig Great River-förförstärkare kommer ändå att få en fruktansvärd inspelning om mikrofonen inte är välplacerad eller om rummet lyfter fram oönskade egenskaper. Om du komprimerar för mycket på en sång under inspelningen kommer den att låta dåligt, oavsett vilken utrustning du har. Allt detta för att säga, positivt, att när du vet hur du använder eq, processorer och plugins kommer du att vara på väg att uppnå en mix av hög ljudkvalitet. Detta för mig till den punkt jag vill ta upp. En person som verkligen känner till och arbetar med sin utrustning kan leverera högre ljudkvalitet på 16 bit med mindre utrustning än en person som bara kopplar in och går på 24/96-inspelare av högsta klass. Tekniken är lika viktig som utrustningen, som är viktigare än bitar och hastigheter. Och det finns bara en sak som är viktigare än teknik och utrustning.

Den viktigaste punkten sparas till sist, och jag har sagt det förut och kommer att säga det igen. Bra musik inspelad på ett uselt kassettdäck kommer att vinna fler hjärtan än en skit polerad på 24/192. Din talang är viktigare än allt annat, och det går inte att köpa. Så kom ihåg att öva, arbeta på din teknik, när du har råd att göra det, uppgradera din signalväg, och sedan när ljudkvalitetens pärlemorsportar öppnas, så betrakta 24/96 som du skulle betrakta en fin finish på ett välgjord konstverk.

Jag förblir

Rich the TweakMeister

Potenta inlägg från Studio-central

En teknisk titt på samplingsteori i icke-tekniska termer
Vad är ljudkvalitet?
24/96 vs. 16/44
Den stora 9:an
När kommer vi att ha 32 bit?
Varför och när 192 kHz?
Vilken upplösning och vilket bitdjup är bäst att spela in med?

Gå till nästa lektion

Gå till föregående lektion

Coolt citat:

”När musiken är som bäst är den inte i behov av något nytt; ju äldre den är, ju mer man är van vid den, desto starkare är dess effekt.”

Goethe (1749-1832), tysk poet och dramatiker.

Tweaks artiklar om grundläggande studiokoncept

Anslutning av ljudet
MIDI-grundläggande
MIDI-datas många funktioner
Ljudgränssnittet
Signalflöde Dator-baserad studio
Signalflödet i en MPC Hip Hop Studio
Signalflödet i en MultiTrack Studio
Sätt ihop din studiorigg
Studioinstallation i ett nötskal
5 heta tips
Bygg ett tyst rum
Förståelse av MIDI-gränssnitt
Kriget mot brummet
Multipla videovisningsskärmar
Latency och hur man Deal
Word Clock
TimeCode
Allt om kablar
Digitala ljudkonverterare
Bitdjup och samplingsfrekvens
Studiomonitorer
Impedans för musiker
Hur man ställer in en Patchbay
Rumakustikens grunder
Prislista för studiomonitorer
Akustikprodukter
Katalog över MIDI-gränssnitt

16 Bit vs. 24 Bit Audio