MPEG - standard för att komprimera
ljud och bild
Ljud med rimligt god
kvalitet kräver åtminstone 16 bitars upplösning och över 40 000 samplingar i
sekunden. Vill man ha stereoåtergivning ska dessutom siffrorna multipliceras
med två, vilket ger ungefär 1,5 Mbit/s. För lagring och överföring av rörliga
bilder krävs ännu mycket större kapacitet. Det här är siffror som med dagens
minnen och överföringshastigheter blir helt orimliga. På något sätt måste
datamängden minskas utan att bild- eller IjudkvaIiteten
går förlorad. Processen att ta bort överflödig information kallas komprimering.
När informationen sedan ska användas, till exempel avlyssnas i en Ijudanläggning, måste den ursprungliga informationen
återskapas, dekomprimeras. Komprimeringen kan göras med eller utan förluster.
Utan förluster innebär att alla ursprungliga data kan återskapas ur den
komprimerade datamängden. Sådana metoder tillåter dock bara att datamängden
minskas till hälften av den ursprungliga, storleken. Och det är inte
tillräckligt, För att minska datamängden ytterligare krävs att man kan urskilja
information som faktiskt inte behövs, information som ingen saknar. Vid
bildöverföring finns färgnyanser som inget öga kan urskilja och vid Ijudåtergivning finns ljud som örat inte uppfattar. Tillåter
man att onödig information går förlorad kan man minska datamängden med 80 eller
90 procent. (Frågan vad som verkligen är onödig information är dock en sak som
kan diskuteras i det oändliga, framför allt när det gäller Ijudåtergivning).
Stillbilder och film
Om lagring och
överföring av bild och ljud ska fungera krävs att alla är överens om hur
kompression och dekompression ska gå till. Det behövs
med andra ord standardisering. Och sådana standarder finns nu, antagna av IS0.
Den första standarden som antogs gällde komprimering av stillbilder. Den kallas
populärt för JPEG eftersom den utarbetats av något som heter Joint Photografic Experts Group. Vid nyåret antogs också en
standard för rörliga bilder, kallad MPEG, Motion Pictures experts Group.
Rörliga bilder går att komprimera mer än stillbilder. Varje bild behöver ju
inte lagras var för sig. Istället kan man koda första bilden i en sekvens och
sedan information om förändringarna. Om något år väntas även den andra
versionen av MPEG antas, kallad MPEG nivå 2. Beteckningen nivå används eftersom
det är en vidareutveckling av den första versionen. Varje avkodare som följer
nivå 2 kan också hantera all information som kodats av en komprimeringsalgoritm
som följer MPEG nivå 1 .
Ljud som inte hörs
Rörliga bilder
åtföljs så gott som alltid av ljud. Därför finns också en underavdelning till
MPEG som heter MPEG Audio. Den kommande versionen heter alltså MPEG Audio nivå 2. Det är den komprimeringsstandarden som ska
användas när digitala radiosändningar kommer igång 1995 i Sverige och övriga
Europa. MPEG audio nivå 2 är en Iätt förändring av
kodningsmetoden Musicam. Genom att tillämpa MPEG
Audio kan datamängden komprimeras från 16 bitar per sampel till 2,5 bitar per
sampel i genomsnitt. För en stereoöverföring minskar alltså datamängden från
drygt 1,5 Mbit/s till 256 kbit/s. Eller med 83 procent om man så vill. Förhoppningen
är att man ska kunna driva komprimeringen ännu längre genom att utnyttja
likheter mellan de två stereokanalerna. Ljudkomprimeringen bygger på att allt Ijud som når örat inte uppfattas. Svaga ljud dränks ofta av
starkare Ijud. Fenomenet kallas maskering.
Ett starkt ljud i ett
visst frekvensområde gör att andra Ijud i samma (och
angränsande) frekvensområden måste ha en viss styrka för att höras. Denna
minsta styrka kallas maskeringströskeln. Ljud som ligger under
maskeringströskeln behöver alltså inte lagras. Örat självt har också en så
kallad hörtröskel. Ljud under vissa nivåer uppfattas inte av örat. Denna
hörtröskel är starkt frekvensberoende. Bäst hör vi vid frekvenser mellan 2 och
5 kHz: Även ljud under hörtröskeln kan alltså sorteras bort. Enligt MPEG Audio
delas hela det hörbara området mellan 0 och 20 000 Hz upp i 32 frekvensband.
Varje frekvensband tilldelas en kapacitet som maskeringssituationen för
ögonblicket kräver. Vid själva Ijudkodningen utförs
två parallella operationer. Dels bestäms en skalfaktor för varje frekvensband,
dels maskeringströskeln. Därefter sorteras ljud som inte går att uppfatta bort.

Många företag bakom
MPEG utvecklades från
början som en standard för att komprimera data för interaktiva CD-skivor, så
kallade CD-I. Men användningsområdena är många. Digital ljudöverföring är en
användning liksom olika typer av hantering av ljud och bild i datorer. Om det blir
något för digital teve är däremot osäkert fortfarande. Oavsett hur det går med
den digitala teven kan man utgå från att MPEG kommer att få starkt genomslag.
Som metod att koda data för så kallade multimediatillämpningar
i datorer är detta redan ett faktum. Det starka genomslaget kan man också se om
man skärskådar vilka företag som deltar i arbetet att utforma standarden. I
MPEG-kommittén sitter betydelsefulla tillverkare av både datorer och
konsumentprodukter, liksom komponenter. Bland deltagarna märks Digital
Equipment, IBM, Intel, JWC, Matsushita,
NEC, Philips, SGS-Thomson, Sony och Texas
Instruments.