Hem > internets, krypto > VoIP och fonetik

VoIP och fonetik

Ett mycket spännande paper trillade ner i min malkorg igår morse. Det har den något torra titeln Uncovering Spoken Phrases in Encrypted Voice over IP Conversations och handlar om hur så kallad side-channel-data (eller sidokanaldata, i försvenskningens namn) tydligen kan användas för att läsa krypterad VoIP-trafik utan att faktiskt behöva knäcka krypteringen.

Det är ju, kan vi lugnt säga, ganska oroande. Nu när jag har skummat artikeln tänkte jag att det vore fin public service att försöka blogga på någerlunda lättfattlig svenska om vad det här innebär. (Har jag fel någonstans så rätta mig gärna, jag är inte direkt matematiker eller lingvist i första hand…)

Attacken som beskrivs bygger, utan att gå in för mycket på tekniska detaljer, på en svaghet i de system som används för att förvandla talade ljud till kompakta och krypterade datapaket som snabbt och säkert kan skickas över nätet. När du för ett samtal via t.ex. Skype hackas ditt tal upp i mindre bitar (~20 millisekunder) som sedan var och en komprimeras, ungefär som när ljud från en CD förvandlas till en MP3-fil, krypteras och skickas som datapaket över nätet till den du talar med. Alla paketen är alltså krypterade, och du kan inte fånga strömmen av paket på vägen och läsa av den (såvida du inte är kinesiska regeringen och har övertygat Skype om att ge dig tillgång till krypteringsnycklarna…) Så attacken måste gå runt det, med hjälp av data från en sidokanal…

En del av problemet finns i komprimeringen, då den använder något som kallas variabel bithastighet (variable bit rate — VBR) för att göra paketen så små som de över huvud taget kan vara. Idén med variabel bithastighet är att vissa paket kan komprimeras betydligt mycket hårdare än andra, beroende på vilka fonem, talljud, de innehåller. Att alla inte komprimeras lika hårt beror på att komprimeringen är destruktiv, det vill säga tar bort element ur ljudet för att minimera storleken. Därför kan ett s komprimeras mycket hårdare än en komplicerad diftong — jämför med hur lätt det är att höra olika språkljud på ett bullrigt fik!

Den andra delen av problemet är att krypteringen bevarar storleken på paketen. Därmed kan du, trots att du inte kan läsa innehållet i de krypterade paketen veta storleken på paketet innan det krypterades, och det är den här svagheten som forskarna kommit på hur man utnyttjar. De matchar helt enkelt storleken på de krypterade paketen mot information om sannolikheten för att ett paket av en viss storlek innehåller ett visst språkljud. På så sätt kan de ta en ström av krypterade datapaket som de inte kan lyssna på och ändå lista ut vad som sägs i den, genom att rekonstruera språkljuden.

Nu ska vi kanske inte bli livrädda av det här. Det borde inte vara svårt att justera krypteringen för att dölja de ursprungliga paketens storlek, och forskarna rapporterar i artikeln endast 50% träffsäkerhet på en “phonetically rich corpus”, så hur användbar den här teknologin är i verkligheten är svårt att säga.

Men det lär oss någonting viktigt om kryptering och informationssäkerhet: en smart angripare kan använda ofantligt många andra sätt än svagheter i de chiffer vi använder för att avslöja vad vi försöker hålla dolt.

Kategorier:internets, krypto
  1. xor
    26 mars 2011 kl. 16:07 | #1

    Skype är sluten mjukvara, man får inte läsa källkoden. Det innebär att man inte kan veta om kryptot är bra eller inte.

    (Som svar till ett eventuellt motargumentet, att läsaren inte kan programmera och att det inte funkar så som ovan beskrivet: I vanliga fall så hade ett gäng geografiskt utspridda nördar läst skypeś krypto-kod och kanske skrivit alarmerande artiklar om hur man kan bryta kryptot, om det hade varit öppen mjukvara. Nu kan inte nördarna göra det. Så de enda man kan lita på är ett profithungrigt företag som samarbetar med Kina för att övervaka människor.)

    Om man får lov att vara lite paranoid, så är det kanske inte så osannolikt att Skype samarbetar med västerländska auktoriteter också. Vi vet redan att de största ISParna i USA har skickat alla människors information till NSA sedan slutet av 1990-talet. Vi vet från wikileaks-läckor att IPRED och Datalagringsdirektivet har stått på den amerikanska upphovsrättsindustrins önskelista i flera år innan de blev lagar i EU. Vi vet att det är sannolikt att facebook och google lämnar ut information till myndigheter, bara från att läsa hur myndigheternas begäran till twitter såg ut när de begärde ut information om wikileaks.

    Att skype inte samarbetar med västerländska auktoriteter kan vara ett felaktigt antagande.

    Om man vill ha sin privata information privat så bör man aldrig någonsin använda mjukvara som inte noggrant har gåtts igenom av hackare och nördar (dvs, använd bara öppen mjukvara).

  1. 09 maj 2011 kl. 16:11 | #1

Lämna en kommentar

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Logga ut / Ändra )

Twitter-bild

You are commenting using your Twitter account. Logga ut / Ändra )

Facebook-foto

You are commenting using your Facebook account. Logga ut / Ändra )

Ansluter till %s

Follow

Get every new post delivered to your Inbox.