OpenSSL je knižnica implementujúca radu algoritmov z oblasti kryptografie. Jej súčasťou je command-line utilita, ktorá umožňuje vyrobiť si vlastnú Certifikačnú Autoritu, šifrovať, podpisovať a podobne. O tom som už písal na inom mieste. Nedávno som ale potreboval použiť AES šifrovanie z programu, a tak som sa na OpenSSL pozrel trocha inak - a o svoje skúsenosti sa chcem s vami podeliť.
Ako som už spomínal, potreboval som použiť AES. Je to symetrický šifrovací algoritmus pracujúci na blokoch pevnej dĺžky. Pre jeho použitie je potrebné najprv vytvoriť šifrovací kľúč stanovenej dĺžky. Šifrované dáta samozrejme chceme chrániť heslom - ktoré ale má byť ľubovoľne dlhé. Tento rozpor môžeme jednoducho vyriešiť tým, že z užívateľom zadaného hesla spočítame hash a ten sa potom použije ako šifrovací kľúč. Ako možno viete hashovacia funkcia je funkcia, ktorá pre ľubovoľné vstupné dáta vygeneruje blok dát pevnej dĺžky. Pritom má tú vlastnosť, že je ťažké nájsť iné vstupné dáta, pre ktoré hashovacia funkcia vrátí rovnakú hodnotu a teda aj minimálna zmena vstupných dát znamená zmenu vo výstupe hashovacej funkcie. Ako však zrátať hash? Opäť prichádza na pomoc OpenSSL. Ponúka niekoľko hashovacích algoritmov. Ja som si zvolil SHA1.
#include <openssl/sha.h>
...
SHA_CTX c;
unsigned char sha1[32];
SHA1_Init(&c);
SHA1_Update(&c,password,(unsigned long)strlen(password));
SHA1_Final(sha1,&c);
Ako ste si možno všimli, premenná sha1 je pole 32 bajtov, ale SHA1 produkuje 160 bitový hash
- teda 20 bajtov. 32 potrebujeme kvôli AES, ktoré môže použiť kľúče dĺžky 128, 192 alebo 256 bitov
1. Ak by sme chceli počítať SHA1 z dlhších dát, môžeme volať
funkciu SHA1_Update()
opakovane:
SHA1_Init(&c);
while ((length=read(fd,block,sizeof(block)))>0)
SHA1_Update(&c,block,(unsigned long)length);
SHA1_Final(sha1,&c);
Keď už máme blok dát, ktorý môžeme použiť ako šifrovací kľúč, môžeme ho použiť pre inicializáciu AES algoritmu v OpenSSL:
#include <openssl/aes.h>
...
AES_KEY encryptionKey;
int keyBits=192;
AES_set_encrypt_key(sha1,keyBits,&encryptionKey);
Algoritmus AES (podobne ako iné blokové šifrovacie algoritmy) môže pracovať v rôznych módoch. Mód ECB je jednoduchší, pretože výsledok šifrovania bloku dát závisí len od kľúča a vstupného bloku dát. Zložitejší (a bezpečnejší) je CBC, pri ktorom výsledok šifrovania N-tého bloku závisí od výsledku šifrovania bloku predchádzajúceho. Pre situáciu, ktorú som potreboval riešiť ja, však postačoval ECB mód:
unsigned char *inputBlock;
unsigned char *outputBlock;
int enc=AES_ENCRYPT; // for decryption AES_DECRYPT
AES_ecb_encrypt(inputBlock, outputBlock,&encryptionKey,enc);
Ak enc
má hodnotu AES_ENCRYPT
, tento kód zoberie
16 bajtov (128 bitov) plaintextu z inputBlock
a umiestni zašifrovaný blok 16 bajtov na outputBlock
.
Ak má enc
hodnotu AES_DECRYPT
, tak inputBlock
ukazuje na zašifrované dáta a dešifrované dáta budú uložené na
outputBlock
.
Funkcia pre šifrovanie v CBC móde má trocha viac parametrov:
void AES_cbc_encrypt(const unsigned char *in, unsigned char *out,
const unsigned long length, const AES_KEY *key,
unsigned char *ivec, const int enc);
length
je počet bajtov na vstupe, ivec
je "inicializačný
vektor", ktorým sa prenáša informácia medzi jednotlivými blokmi.
Problémom pri použití blokovej šifry je zistenie, koľko bajtov vlastne má mať výstup. Na výstupe totiž dostaneme vždy násobok veľkosti AES bloku - 16 bajtov. Riešenie je v použití "zarovnania" - angl. padding. To sa spravidla implementuje tak, ako to predpisuje PKCS#5. Teda tak, že bajty, ktoré chýbajú v poslednom bloku, sa vyplnia hodnotou určujúcou koľko bajtov treba odobrať od konca dešifrovaných dát tak, aby sme dostali správnu dĺžku. Ak napríklad potrebujem zašifrovať 25 bajtov dát, tak nájdeme najbližší násobok 16 (veľkosť AES bloku) - to je 32. Bajty od 26 po 32 pred zašifrovaním vyplníme hodnotou 7 (teda 32-25). Po rozšifrovaní potom stačí zobrať posledný bajt a podľa neho vieme, koľko bajtov bolo použitých pre padding. Ak na vstupe už máme násobok veľkosti bloku, umelo doplníme na vstupe jeden blok obsahujúci len padding.
Pri prehrabávaní sa v OpenSSL som narazil na ďalší kus funkcionality,
ktorý sa mi hodil. Chcel som výsledok šifrovania zapísať do textovej
formy, ktorú možno prenášať ako tlačiteľný text. V praxi sa na tento
účel používa kódovanie BASE-64. Po krátkom pátraní som prišiel na to, že
existujú prinajmenšom dve kódovania BASE-64. Jedno ponúka libc vo funkciách
a64l()
a l64a()
- zodpovedajú POSIX-u,
ale všetci používajú MIME-BASE 64, ktoré používa inú sadu znakov. A
práve tento druhý variant ponúka OpenSSL.
Okrem hashovacích a šifrovacích funkcií OpenSSL obsahuje aj knižnicu nazvanú BIO - čo je abstrakcia sady vstupných a výstupných funkcií. Ide vlastne o sadu metód, ktoré fungujú ako čierna skrinka. Možno do nich na jednej strane zapisovať a na druhej strane čítať. Jednou takouto metódou je "mem". Vyrobí ju funkcia BIO_s_mem() a do všeobecného rozhrania ju obalí BIO_new():
#include <openssl/bio.h>
#include <openssl/evp.h>
...
BIO bio=*BIO_new(BIO_s_mem());
Na takto získanú premennú je možné použiť BIO_write()
a BIO_read()
:
int BIO_read(BIO *b, void *buf, int len);
int BIO_write(BIO *b, const void *buf, int len);
Metóda "mem" má tú vlastnosť, že tie isté dáta, ktoré do nej zapíšeme, z nej
aj prečítame. Ďalšou metódou je napr. tá, ktorú vracia funkcia
BIO_f_base64()
. Má tú vlastnosť, že to, čo do nej zapíšeme,
si táto metóda ukladá v kódovaní MIME-BASE64 a to, čo z nej prečítame,
je zasa spätne dekódované. Dve metódy možno zreťaziť použitím funkcie
BIO_push()
:
BIO *mem=BIO_new(BIO_s_mem());
BIO *b64=BIO_new(BIO_f_base64());
BIO *bio=BIO_push(b64,mem);
Pri takomto zreťazení dáta zapísané do bio
môžeme prečítať z mem
a dostaneme MIME-BASE64 zakódované
dáta. Naopak MIME-BASE64 kódované dáta zapísané do mem
môžeme prečítať z bio
a dostaneme pôvodná dáta.
Uvoľnenie dát spojených so štruktúrou BIO robí funkcia BIO_free()
.
Pokiaľ boli viaceré BIO
štruktúry zreťazené, uvoľní ich naraz
BIO_free_all()
. Chovanie týchto stavebných blokov môžeme
ovplyvniť napr. nastavením flagov funkciou BIO_set_flags()
.
Napr. volanie
BIO_set_flags(b64,BIO_FLAGS_BASE64_NO_NL);
zariadi, že text generovaný takouto metódou nebude automaticky ukončený znakom nového riadku. Okrem "mem" a "base64" existujú rôzne ďalšie BIO metódy, ktoré napr. vedia zo vstupných dát zrátať SHA1 alebo MD5, nastaviť ako vstup(alebo výstup) súbor či socket, šifrovať ich atď. Napr. nasledujúci kúsok kódu číta MIME-Base64 kódované dáta a tlačí na štandardný výstup pôvodné nekódované dáta:
BIO *fl=BIO_new_file("inputfile.dat","r");
BIO *b64=BIO_new(BIO_f_base64());
BIO *bio=BIO_push(b64,fl);
char ch;
while (BIO_read(b64,&ch,1)>0)
printf("%c",ch);
BIO_free_all(bio);
A tento vypíše SHA1 vstupného buffra.
char sha1[20];
memset(sha1,0,sizeof(sha1));
BIO *sha1bio=BIO_new(BIO_f_md());
BIO_set_md(sha1bio,EVP_sha1());
/* to discard the written data after calculating SHA1: */
BIO_push(sha1bio,BIO_new(BIO_s_null()));
BIO_write(sha1bio,buffer,bufferLength); /* can be called several times */
BIO_flush(sha1bio);
BIO_gets(sha1bio,sha1,sizeof(sha1));
for (i=0;i<sizeof(sha1);i++)
printf("%02x",sha1[i]&0xff);
printf("\n");
OpenSSL je rozsiahla knižnica a my sme sa len dotkli niektorých tém. Ale dúfam, že vás zaujali.