Som vist i artikkelen punktprøving diskretiseres et båndbegrenset analogt signal i tid ved at det tas punktprøver av signalet. Diskretisering av en kontinuerlig punktprøve av signalet kalles for kvantisering. Kvantisering vil, som vi kommer tilbake til, føre til en unøyaktighet i overførte amplitudeverdier som kalles kvantiseringsstøy. Dette skyldes at alle amplituder i et kvantiseringsintervall vil bli tilordnet den samme amplitudeverdien ved kvantiseringen.
Det er prinsipielt to forskjellige måter å foreta kvantisering på. Ved absolutt kvantisering kvantiseres hver punktprøve for seg, mens kvantisering av forandringen i signalet fra foregående prøvetidspunkt betegnes differensiell kvantisering.
Vi skal her ta for oss absolutt kvantisering, som kan være uniform eller ikke-uniform. Som vi skal se, er uniform kvantisering enklest å realisere, mens det vil være en fordel å bruke ikke-uniform kvantisering for noen fysiske signaler.
Ved uniform kvantisering deles det aktuelle amplitudeområdet opp i like intervaller. En punktprøve blir tilordnet en verdi som f.eks. er lik midtpunktet i det intervallet den faller i, se figur 1. Opplysning om i hvilket kvantiseringsintervall punktprøven ligger, blir så overført til mottaker.

Fig. 1. Punktprøving og kvantisering av et analogt signal.
Ved pulskodemodulasjon (se koding) overføres informasjonen om kvantiseringstrinnets høyde i binær kode, og for b binære siffer blir antall kvantiseringstrinn:
| (1) |
I figur 1 er vist et signal som er kvantisert til 7 nivåer, idet det benyttes en binærkode der første siffer angir fortegnet. En utbredt notasjon er bruk av toers komplement for å representere negative verdier.
Som det skjønnes av det foregående, må kvantiseringen etterfølges av koding. Dette betegnes ofte som den egentlige Analog/Digital-omforming. Kvantisering og koding er således nært knyttet sammen. Mens kvantisering henspeiler på mengdeoppdeling, vil valget av kode bestemme hvordan denne mengden skal representeres.
Kvantisering representerer som nevnt en tilnærming, idet antall verdier må være endelig, ved pulskodemodulasjon gitt ved antall biter (bits). Tilnærmelsen kan gjøres på flere prinsipielt forskjellige måter, tre er vist i figur 2. I figur 2a foretas normal avrunding, d.v.s. alle brøkdeler under en halv rundes ned, og alle over en halv rundes opp. Ulempen med denne metoden er at utgangssignalet er null når inngangsnivået faller under en halvt kvantiseringstrinn. Det samme gjelder i ennå større grad for absoluttverdi-trunkering som er vist i figur 2c. I tillegg oppstår nullgjennomgangs- ('cross over') forvrengning.

Fig. 2. Prinsipielle kvantiseringsmetoder.
I figur 2b er vist nedad trunkering, der f.eks. -3,3 rundes ned til -4 og ikke til -3. Ulempen her er at utstyringsområdet blir noe usymmetrisk, idet det blir ett trinn mindre til positive enn til negative signalverdier. Er antall kvantiseringsintervaller mange, er feilen uten større betydning (ca. 0,03 promille for 16bit binærkode).
I figur 3 er vist effektspekteret for tale. Som for andre aktuelle signaler, vil amplituden avta med frekvensen, og den vil nærme seg null når en kommer høyt nok opp i frekvens. I praktiske systemer vil en i de fleste tilfeller båndbegrense talesignalet ved hjelp av filter før det digitaliseres. Dersom signalet båndbegrenses for mye, vil det gå ut over forståeligheten. Ved en lavpassbegrensning på ca. 3,5 kHz vil forståeligheten være ca. 90 %, men den faller drastisk når begrensningen foretas under ca. 2 kHz.

Fig. 3. Effektspekter for tale.
Ved tale vil de lave amplituder forekomme mye hyppigere enn de høyere, slik at amplitudefordelingen vil være tilnærmet eksponentiell, som vist i figur 4.

Fig. 4. Amplitudefordelinger.
Tale er et eksempel på praktisk forekommende signaler som ikke har uniform amplitudefordeling og der dynamikkområdet, d.v.s. forskjellen mellom overstyringsgrensen og laveste akseptable signalnivå, ofte er meget stort. Dynamikkområdet for tale må være stort av hensyn både til den store forskjellen det er i nivå for den enkelte bruker og særlig mellom forskjellige brukere.
Siden sannsynligheten for lave amplitudenivåer er større enn for høye, kan følgelig feilen som oppstår ved kvantiseringen, reduseres ved å legge kvantiseringstrinnene tettere ved lave amplitudenivåer, som vist i figur 5.

Fig. 5. Ikke-uniform kvantisering.
Et annet moment som taler for ikke-uniform kvantisering, er at maksimal informasjon overføres dersom det sørges for at alle intervaller er like sannsynlige.
Disse to kriterier vil ikke føre til eksakt samme krav til kvantiseringstrinnene, men de vil trekke i samme retning.
For realisering av ikke-uniform kvantisering benyttes en teknikk kjent som kompansjon, d.v.s. kompresjon med etterfølgende ekspansjon. Kompresjon utføres på sendersiden og innebærer en reduksjon av variasjonene i det midlere signalnivå i overensstemmelse med en spesifisert lov. Tilsvarende innebærer ekspansjon en økning av variasjonene i det midlere signalnivå på mottakersiden. Ved kompansjon må da resultatet være at det fås tilbake et signal som er mest mulig likt det opprinnelige signalet.
Innen telefoni finnes bl.a. to kompressorkarakteristikker for tale som er anbefalt av ITU-T. Disse er nærmere beskrevet nedenfor.
Når signalet kvantiseres, forandres størrelsen av punktprøven til signalet litt, idet alle punktprøver i et intervall D i gis verdien a i. Dette er ekvivalent med at det tilføres en støy, kvantiseringsstøyen. Denne kan beregnes dersom amplitudefordelingen (sannsynlighetstetthetsfunksjonen) f(a ) for signalets amplitude a i punktprøvingstidspunktene kjennes, se figur 6a.

Fig. 6. Amplitudefordelingen f(a ) for signalets amplitude a .
Kvantiseringen antas så fin at sannsynlighetstetthetsfunksjonen er tilnærmet konstant over et kvantiseringsintervall, se figur 6b. Når D i betegner bredden til kvantiseringsintervall nr. i og a i amplituden i intervallets midtpunkt, blir midlere kvadratiske feil for dette kvantiseringsintervallet:
![]() |
(2) |
Midlere kvadratiske kvantiseringsfeil, kvantiseringsstøyen, blir:
![]() |
(3) |
hvor P(i) er sannsynligheten for at punktprøven er i kvantiseringsintervall nr. i og K er antall intervaller.
Kvantiseringen er uniform dersom D i er konstant for alle i, d.v.s. dersom Di = D. Kvantiseringsstøyen blir da:
![]() |
(4) |
Middelenergien i samplene for sinusformede signaler med RMS-verdi A er gitt som A2. Dette gir signal/støy-forholdet:
![]() |
(5) |
Forutsetningen for (5) er selvfølgelig at amplituden i det samplede signalet ligger innenfor det totale kvantiseringsområdet, ellers fås overstyring (som kan redusere signal/støy-forholdet til mindre enn 1).
Når det benyttes b antall biter, er den maksimale RMS-verdien gitt ved (forutsatt dobbel representasjon av 0):
![]() |
(6) |
Dette gir det midlere signal/støy-forholdet for sinusformede signaler:
![]() |
(7) |
Med tilnærmelsen 2b > > 1 blir (7) uttrykt i dB:
| (8) |
Ligning 8 kalles 6 dB - regelen. Den viser at hvert nytt bit vil øke signal/støy-forholdet med 6 dB og er grunnleggende for fastleggelse av antall biter når kravet til signal/støy-forholdet er spesifisert. For eksempel gir 16 bit uniform kvantisering (pulskodemodulasjon) omkring 98 dB i signal/kvantiseringsstøy-forhold, mens 14 bit gir ca. 86 dB.
Ofte opereres med det maksimale signal/støy-forholdet. Dette fremkommer ved å se på den maksimale signal-amplituden. Signal/støy-forholdet gitt ved (7) og (8) må da modifiseres ved å multiplisere A med en faktor tilsvarende 3 dB. Ligning 8 går da over til å bli:
| (9) |
Dersom alle amplitudeverdier opptrer med like stor sannsynlighet, vil uniform kvantisering gi det høyeste signal/støy-forholdet. For f.eks. talesignaler vil imidlertid amplitudefordelingen ikke være uniform. Signal/støy-forholdet vil dermed være høyere ved ikke-uniform enn ved uniform kvantisering med samme antall kvantiseringstrinn.
For å kunne beregne signal/støy-forholdet for ikke-uniform kvantisering, må en kjenne til amplitudefordelingen og den benyttede kompresjonskarakteristikk. Nedenfor er signal/støy-forholdet beregnet for ikke-uniform kvantisering ved eksponentiell amplitudefordeling og en kompresjonskarakteristikk kalt A-loven. Av resultatet fremgår at omtrent samme signal/støy-forhold her oppnås ved 8 bit som ved 12 bit når uniform kvantisering benyttes, m.a.o. en betydelig forbedring.
Det paradoksale med støy-betraktningen er at støyen maskeres av det kraftige og bredbåndede signalet, slik at støyen ikke kan høres/ses. Og dersom det ikke er noe signal, er det heller ikke noe støy. Sistnevnte er forskjellig fra den analoge verden, der støyen også kan være tilstede uten noe signal. Som det imidlertid kan ses av (5), reduseres signal/støy-forholdet med mindre amplituder, som for analoge signaler.
I tilfeller med svake signaler (smal- eller bredbåndede) eller smalbåndede signaler har kvantiseringsfeilen karakter av forvrengning. Denne lar seg ikke maskere av signalets naturlige harmoniske innhold. Dette er illustrert i figur 7 der det anvendes som eksempel en ren sinustone og uniform kvantisering. Samplingsfrekvensen er 7 ganger sinustonens frekvens. Det ses at det blir tale om harmonisk forvrengning, med et kraftig innhold av de høyere harmoniske.
Hvis samplingsfrekvensen derimot står i et ikke-heltallig forhold til sinustonens frekvens, oppstår det også subharmoniske- samt sum- og differense-toner som i audiosystemer kjennetegnes ved å være mer øretrettende enn (analog) harmonisk forvrengning. Hvis samplingsfrekvensen står i et forhold til sinustonen på andre måter, som vil være tilfellet i de langt fleste tilfeller, blir forholdene uoverskuelige. Forvrengningsproduktene brer seg utover hele frekvensbåndet, og det vil oppstå både subharmoniske, høyere harmoniske, samt sum- og differensetoner. Støybetraktningen foran vil gi en idé om størrelsen, men ikke om frekvenssammensetningen.

Fig. 7. kvantiseringsfeilens natur.
Et uttrykk for den totale harmoniske forvrengning (Total Harmonic Distortion, THD) ved uniform kvantisering kan finnes ut fra energibetraktning, d.v.s. som forholdet mellom kvantiseringsstøyen i (4) og middelenergien i samplene med amplitude S (RMS-verdi), gitt som S2. Dette gir den totale harmoniske forvrengning lik det inverse av signal/støy-forholdet gitt av (5):
![]() |
(10) |
Her er vi interessert i å finne distorsjonen for forskjellige amplitudeverdier. Det kan være praktisk å uttrykke THD ved forholdet mellom signalamplituden S og den maksimale signal-amplituden A benyttet tidligere. Ved maksimal amplitude A var signal/støy-forholdet gitt ved (når det benyttes b antall biter):
| (11) |
Siden den totale harmoniske forvrengning er lik det inverse av signal/støy-forholdet, kan følgelig forvrengningen finnes som:
![]() |
(12) |
Her har vi uttrykt forvrengningen ved forholdet mellom den aktuelle signalamplituden S og full utstyring A (Effektforholdet er (S/A)2 ). Med tilnærmelsen 2b > > 1 og uttrykt i % kan (12) skrives som:
![]() |
(13) |
Når amplituden er den maksimale (S = A), fås en distorsjon som er meget liten selv for få biter (0,001 % for 8 bit uniform kvantisering, mikroskopisk for 16 bit). Distorsjonen vil imidlertid øke ved redusert signalnivå. Er amplituden redusert i forhold til full utstyring med 70 dB, vil forvrengningen være så høy som ca. 0,15% selv ved 16 bit. Reduseres amplituden ytterligere, kan det f.eks. fås overharmoniske med et spektrum som vist i figur 8a.
Kvantiseringsfeilen forandres således fra å være støy ved høye signalnivåer til forvrengning ved lavere signalamplituder. Dette er en viktig observasjon som ikke lar seg benekte. Ikke minst fordi den menneskelige hørsel har vist seg svært følsom overfor forvrengning ved lave signalnivåer som har sin opprinnelse i kvantiseringen, har det vært fokusert på metoder for å maskere denne forvrengningen (uten å være nødt til å øke antall biter).

a.

b.
Fig. 8. Overharmoniske komponenter (a) fjernet vha. Dither (b).
Som tidligere nevnt, kan ikke-uniform kvantisering være veien å gå, idet kvantiseringstrinnene legges tettere ved lave amplitudenivåer. Denne metoden kan også kombineres med en teknikk som kalles dithering.
Denne teknikken benyttes i noen systemer, og hensikten er å fjerne korrelasjonen mellom signalet og kvantiseringsfeilen ved lave signalnivåer. Teknikken går ut på å addere et analogt støysignal til signalet før kvantiseringen. Dette har den effekt at kvantiseringsfeilen blir ukorrelert til signalet. Dette støysignalet, som kalles Dither, maskerer ikke bare kvantiseringsstøyen, men sørger også for at det digitale systemet kan kode amplituder mindre enn det minst signifikante bit.
Den menneskelige hørsel er meget god til å skille ut smalbåndede signaler under støyterskelen, idet øret oppfører seg som 1/3 oktav filter med en smal båndbredde. Kvantiseringsfeilen som gis karakteten av hvit støy v.h.a. Dither, blir midlet av øret, og den originale smalbåndede sinusbølgen høres uten forvrengning.
M.a.o. vil tillegg av Dither forandre kvantiseringsfeilens digitale natur til hvit støy, og øret kan skille ut signaler med nivåer godt under ett kvantiseringstrinn.
Målinger bekrefter også slagkraften til Dither. Dersom THD måles på kvantiserte signaler med og uten Dither, vil forvrengningen som oppstår uten Dither (se figur 8a), forsvinne når støy adderes til målesignalet før kvantisering, se figur 8b.
Det samme gjelder ved intermodulasjonsmålinger, se figur 9. Som eksempel er benyttet et testsignal bestående av to toner på henholdsvis 1 og 2 kHz. Her vil kun de to testsignalene forefinnes etter kvantiseringen når Dither anvendes, se figur 9b.

a.

b.
Fig. 9. Intermodulasjonskomponenter (a) fjernet vha. dither (b).
Prisen en må betale ved anvendelse av Dither, er en liten økning i den bredbåndede grunnstøyen (se figur 8b og 9b), men denne er neglisjerbar sammenlignet med det høye signal/støy-forholdet som normalt has i digitale systemer der Dither benyttes.
Ved tale vil de lave amplituder forekomme mye hyppigere enn de høyere. Følgelig kan kvantiseringsstøyen reduseres ved å benytte ikke-uniform kvantisering. Samtidig kan informasjonkapasiteten økes ved at en sørger for at intervallene har tilnærmet samme sannsynlighet.
Overføringssystemet for tale må også ha et stort dynamikkområde av hensyn til den store forskjellen det er i nivå for forskjellige brukere.
For realisering av ikke-uniform kvantisering i praktiske PCM-systemer benyttes kompansjon, d.v.s. kompresjon med etterfølgende ekspansjon. Kompresjonen utføres på sendersiden, mens ekspansjonen gjøres på mottakersiden. Ved kompansjonen er resultatet at talesignalet som fås tilbake, ideelt sett er likt det opprinnelige signalet. Figur 10 viser forskjellige metoder for å oppnå ikke-uniform kvantisering.

Fig. 10. Metoder som gir ikke-uniform kvantisering
Vi skal her ta for oss to kompressorkarakteristikker for tale som er anbefalt av ITU-T. Etter en innledende beskrivelse av karakteristikkene, følger en betraktning omkring oppnåelig signal/støy-forhold og dynamisk område.
Innen telefoni finnes to kompressorkarakteristikker for tale som er anbefalt av ITU-T. Den ene er m -loven, som f.eks. benyttes i USA. Dette er en logaritmisk kompresjonskarakteristikk generelt gitt ved:
| (14) |
hvor y er utgangssignalet (normalisert), x er inngangssignalet (normalisert) og m er en positiv parameter. For ikke-uniform kvantisering av tale benyttes m = 255.
Den andre kompressorkarakteristikken er A-loven, som f.eks. benyttes i Europa. Dette er en kompresjonskarakteristikk som er lineær for små og logaritmisk for store verdier av inngangssignalet. Denne er generelt gitt ved:
![]() |
(15) |
A er en positiv parameter. For ikke-uniform kvantisering av tale benyttes parameteren A = 87,6.
Negative inngangssignaler gir negative utgangssignaler med samme karakteristikker. A-loven har et normalisert område på ± 1 og er delt inn i en lineær og en ikke-lineær del. Den lineære delen sørger for at spenningen ut er null når inngangsspenningen er null; den logaritmiske delen sørger for at utgangsspenningen er 1 når inngangsspenningen er 1. Kompresjonskarakteristikken er kontinuerlig for inngangsspenningen lik 1/A. A har en verdi relatert til nødvendig dynamisk område for systemet. Jo større verdi på A, desto høyere kompresjon oppnås.
A-loven er anbefalt av ITU-T i en segmentert utgave med 15 segmenter som vist i figur 11.

Fig. 11. Segmentert A-lov
Ved direkte binær koding etter den segmenterte A-lov, består kodeordet av 8 binære siffer. Et siffer angir fortegnet, de neste tre angir intervallet og de siste fire gir posisjonen innen intervallet.
Kvantiseringsstøyen for A-loven
Kvantiseringsstøyen for kompresjon i h.h.t. A-loven kan finnes ved å betrakte den lineære kvantiseringen til det komprimerte signalet betinget av den ekvivalente ikke-lineære kvantiseringen til det ukomprimerte inngangssignalet.
Inngangsspenningen vil åpenbart bevege seg på på den lineære og logaritmiske delen av kompresjonskarakteristikken. For å bestemme midlere kvantiseringsstøy, er det dermed nødvendig å kjenne til sannsynligheten for at inngangsspenningen befinner seg i den lineære eller logaritmiske delen av karakteristikken. Dette krever kjennskap til amplitudefordelingen (sannsynlighettetthetsfunksjonen) til inngangsspenningen. Her er det av spesiell interesse å se på fordelingen til et typisk talesignal. Denne kan antas å være tilnærmet eksponentiell.
Betegnes amplituden a , kan amplitudefordelingen uttrykkes som:
![]() |
(16) |
der s er den normaliserte talespenningen (RMS-verdi). Signal til kvantiseringsstøy-forholdet kan da vises å bli:
![]() |
(17) |
hvor:
![]() |
Signal/støy-forholdet er konstant med verdien 1/k2 for store verdier av s og faller med 2 dB for s = 1/A. Karakteristikken er vist i figur 12.

Fig. 12. S/N-karakteristikk for kompresjon etter A-loven
Systemet er dermed konstruert slik at spenningen (RMS-verdi) generert av lavesttalende bruker, er lik 1/A. Dette vil i praksis gi et konstant signal/støy-forhold for alle brukere. Signal/støy-forholdet er en funksjon av både A og K, som dermed velges til å gi et akseptabelt resultat for et spesifisert dynamisk område.
Målinger viser at de fleste brukere (98%) har en RMS-verdi på talenivået (spenningsverdi) som ligger innenfor ± 13 dB av brukerens RMS-middelverdi.
Forholdet mellom høyeste og laveste verdi på talestyrkens RMS-verdi er kjent som det brukbare lydstyrkeområde (Useful Volume Range, UVR), og det vil således være lik 26 dB med utgangspunkt i statistikken som her er brukt for talesignal. Koderens dynamiske område vil i realiteten overstige denne verdien med omtrent 26 dB. Grunnen til dette er at det for de fleste brukere vil være ± 13 dB individuell variasjon omkring deres RMS-verdier (99% av tiden). Det totale dynamiske området er således UVR + 26 dB, som vist i figur 13.

Fig. 13. Dynamisk område for ikke-lineært PCM-system
I figuren er spiss-verdien normalisert til 0 dB. A = 87,6 er den anbefalte verdien av ITU-T. Denne verdien gir nettopp UVR = 26 dB. Signal/støy-forholdet er 38 dB, idet det benyttes 8 bit kode (K = 256). Verdien på UVR kan økes, men dette skjer på bekostning av signal/støy-forholdet. F.eks. vil UVR = 30 dB (A = 141) gi et signal/støy-forhold på 36 dB med 8 bit PCM kode.
Det kan være av interesse å finne det antall kvantiseringstrinn (antall bit) som må benyttes for å oppnå samme verdi på UVR og signal/støy-forhold for en lineær koder (d.v.s. uniform kvantisering) som for den ulineære koderen anbefalt av ITU-T. For å finne dette, antas det at sannsynligheten er 98% for at talesignalet befinner seg innenfor den lineære koderens område (± I/2), m.a.o.:
![]() |
(18) |
Dette gir:
| (19) |
Signal/støy-forholdet for den med høyeste talenivå er dermed:
![]() |
(20) |
Hvis S/N for den mest lavttalende skal være 38 dB, følger det at S/N for den mest høyttalende må være 38 + 26 = 64 dB, d.v.s.:
![]() |
(21) |
Idet K = 2b, gir dette b = 11,3, der b = antall bit. M.a.o. er det nødvendig med 12 bit ved uniform kvantisering (lineær koder) for å oppnå samme UVR og S/N som for ulineær koder med kompresjon i h.h.t. A-loven. Kompansjonen medfører således en effektiv båndbreddebesparelse på 33%.
Ved bruk av m-loven (m = 255 og 8 bit implementering) oppnås det også et småsignal signal/støy-forhold og dynamisk område ekvivalent med 12 bit uniform PCM, slik at de to kompressorkarakteristikkene kan betraktes som likeverdige i så måte.
|
Copyright©1996 Knut Harald Nygaard |