Mpeg

MPEG - standard för att komprimera ljud och bild

Ljud med rimligt god kvalitet kräver åtminstone 16 bitars upplösning och över 40 000 samplingar i sekunden. Vill man ha stereoåtergivning ska dessutom siffrorna multipliceras med två, vilket ger ungefär 1,5 Mbit/s. För lagring och överföring av rörliga bilder krävs ännu mycket större kapacitet. Det här är siffror som med dagens minnen och överföringshastigheter blir helt orimliga. På något sätt måste datamängden minskas utan att bild- eller IjudkvaIiteten går förlorad. Processen att ta bort överflödig information kallas komprimering. När informationen sedan ska användas, till exempel avlyssnas i en Ijudanläggning, måste den ursprungliga informationen återskapas, dekomprimeras. Komprimeringen kan göras med eller utan förluster. Utan förluster innebär att alla ursprungliga data kan återskapas ur den komprimerade datamängden. Sådana metoder tillåter dock bara att datamängden minskas till hälften av den ursprungliga, storleken. Och det är inte tillräckligt, För att minska datamängden ytterligare krävs att man kan urskilja information som faktiskt inte behövs, information som ingen saknar. Vid bildöverföring finns färgnyanser som inget öga kan urskilja och vid Ijudåtergivning finns ljud som örat inte uppfattar. Tillåter man att onödig information går förlorad kan man minska datamängden med 80 eller 90 procent. (Frågan vad som verkligen är onödig information är dock en sak som kan diskuteras i det oändliga, framför allt när det gäller Ijudåtergivning).

Stillbilder och film

Om lagring och överföring av bild och ljud ska fungera krävs att alla är överens om hur kompression och dekompression ska gå till. Det behövs med andra ord standardisering. Och sådana standarder finns nu, antagna av IS0. Den första standarden som antogs gällde komprimering av stillbilder. Den kallas populärt för JPEG eftersom den utarbetats av något som heter Joint Photografic Experts Group. Vid nyåret antogs också en standard för rörliga bilder, kallad MPEG, Motion Pictures experts Group. Rörliga bilder går att komprimera mer än stillbilder. Varje bild behöver ju inte lagras var för sig. Istället kan man koda första bilden i en sekvens och sedan information om förändringarna. Om något år väntas även den andra versionen av MPEG antas, kallad MPEG nivå 2. Beteckningen nivå används eftersom det är en vidareutveckling av den första versionen. Varje avkodare som följer nivå 2 kan också hantera all information som kodats av en komprimeringsalgoritm som följer MPEG nivå 1 .

Ljud som inte hörs

Rörliga bilder åtföljs så gott som alltid av ljud. Därför finns också en underavdelning till MPEG som heter MPEG Audio. Den kommande versionen heter alltså MPEG Audio nivå 2. Det är den komprimeringsstandarden som ska användas när digitala radiosändningar kommer igång 1995 i Sverige och övriga Europa. MPEG audio nivå 2 är en Iätt förändring av kodningsmetoden Musicam. Genom att tillämpa MPEG Audio kan datamängden komprimeras från 16 bitar per sampel till 2,5 bitar per sampel i genomsnitt. För en stereoöverföring minskar alltså datamängden från drygt 1,5 Mbit/s till 256 kbit/s. Eller med 83 procent om man så vill. Förhoppningen är att man ska kunna driva komprimeringen ännu längre genom att utnyttja likheter mellan de två stereokanalerna. Ljudkomprimeringen bygger på att allt Ijud som når örat inte uppfattas. Svaga ljud dränks ofta av starkare Ijud. Fenomenet kallas maskering.

Ett starkt ljud i ett visst frekvensområde gör att andra Ijud i samma (och angränsande) frekvensområden måste ha en viss styrka för att höras. Denna minsta styrka kallas maskeringströskeln. Ljud som ligger under maskeringströskeln behöver alltså inte lagras. Örat självt har också en så kallad hörtröskel. Ljud under vissa nivåer uppfattas inte av örat. Denna hörtröskel är starkt frekvensberoende. Bäst hör vi vid frekvenser mellan 2 och 5 kHz: Även ljud under hörtröskeln kan alltså sorteras bort. Enligt MPEG Audio delas hela det hörbara området mellan 0 och 20 000 Hz upp i 32 frekvensband. Varje frekvensband tilldelas en kapacitet som maskeringssituationen för ögonblicket kräver. Vid själva Ijudkodningen utförs två parallella operationer. Dels bestäms en skalfaktor för varje frekvensband, dels maskeringströskeln. Därefter sorteras ljud som inte går att uppfatta bort.

Många företag bakom

MPEG utvecklades från början som en standard för att komprimera data för interaktiva CD-skivor, så kallade CD-I. Men användningsområdena är många. Digital ljudöverföring är en användning liksom olika typer av hantering av ljud och bild i datorer. Om det blir något för digital teve är däremot osäkert fortfarande. Oavsett hur det går med den digitala teven kan man utgå från att MPEG kommer att få starkt genomslag. Som metod att koda data för så kallade multimediatillämpningar i datorer är detta redan ett faktum. Det starka genomslaget kan man också se om man skärskådar vilka företag som deltar i arbetet att utforma standarden. I MPEG-kommittén sitter betydelsefulla tillverkare av både datorer och konsumentprodukter, liksom komponenter. Bland deltagarna märks Digital Equipment, IBM, Intel, JWC, Matsushita, NEC, Philips, SGS-Thomson, Sony och Texas Instruments.