# TD 4 - Codes de Hadamard, entrelacement

# 1) Code de Hadamard. 

Soit $k>1$ un entier. Le produit scalaire de deux vecteurs $x=(x_1, \ldots, x_k), y=(y_1, \ldots, y_k) \in \mathbf{F}_2^k$ est $\langle x, y \rangle=\sum_{i=1}^kx_iy_i \pmod 2$.

On définit le code de Hadamard
\begin{align*}
\mathrm{Had}_k: \mathbf{F}_2^k & \rightarrow \mathbf{F}_2^{2^k}\\
x & \mapsto (\langle x, y \rangle )_{y \in \mathbf{F}_2^k}
\end{align*}
ainsi que le code de Hadamard augmenté $\mathrm{Had}^+_k: \mathbf{F}_2^k \rightarrow \mathbf{F}_2^{2^{k-1}}$, en considérant uniquement les vecteurs $y=(1, y_2, \ldots, y_k)$.

a) Montrer que $\mathrm{Had}^+_k$ est bien un code, i.e., une fonction injective.

b) Montrer que $\mathrm{Had}^+_k(1, 0, 0, \ldots, 0)=(1, 1, 1, \ldots, 1)$ et, pour tout $x \in \mathbf{F}_2^k$ différent de $0$ et $(1, 0, 0, \ldots, 0)$, le poids de $\mathrm{Had}^+_k(x)$ est $2^{k-2}$. En déduire que $\mathrm{Had}^+_k$ peut corriger toute erreur d'un nombre de bits strictement inférieur à $2^{k-3}$.

*Exemple:* le code utilisé par Mariner 9 ($k=6$) permet d'envoyer un message de 6 bits en utilisant 32 bits de mémoire, et de corriger jusqu'à 7 erreurs. Par contre, un code qui répète 5 fois un message de 6 bits nécessite de 30 bits de mémoire, mais sa distance minimale est 5; il permet donc de corriger au plus 2 erreurs.

c) Écrire une fonction qui code un message avec le code de Hamming augmenté $\mathrm{Had}^+_6$.

In [4]:
import numpy as np
def had_6(message):
    pass

**Le code de Hadamard est localement déchiffrable**. On va voir ici une propriété intéressante du code de Hadamard : il est *localement déchiffrable* au sens où on peut récupérer avec grande probabilité un bit spécifique du message envoyé uniquement en lisant une petite partie du message encodé. 

1) **Un exemple** - On considère un code de Hadamard non-augmenté : $Had_k$ de paramètres $[2^{k}, k, 2^{k-1}]$. On encode un message $m$ de longueur $k$, le message encodé est noté $c$. On rappelle que les bits de $c$ sont indexés par les vecteurs de $\mathbb F_2^k$. On choisit un indice $1\leq i\leq k$ et on essaie de retrouver $m_i$. Vérifier que $c_{\epsilon_i} = m_i$ (où $\epsilon_i$ est le $i$ème vecteur de base). On peut donc récupérer $m_i$ en regardant un seul bit de $c$.
2) Maintenant on suppose qu'il y a au plus une proportion $\delta$ d'erreurs réparties aléatoirement dans le message. On note $r$ ce message reçu avec erreurs. Expliquer pourquoi la méthode précédente assure une probabilité $1-\delta$ d'avoir une erreur en décodant $m_i$. On va voir comment améliorer cette probabilité en consultant plus de bits du message reçu $r$. On choisit $q>0$ éléments $(v_1,...,v_q)$ de $\mathbb F_2^k$ au hasard et on consulte l'ensemble des $r_{v_1},...,r_{v_q}$ ainsi que les $r_{v_1 + \epsilon_i},...,r_{v_q + \epsilon _i}$.
   Expliquer pourquoi $c_{v_j + \epsilon_i} + c_{v_j} = m_i$. En déduire une méthode pour retrouver $m_i$ avec une grande probabilité. Faire une application numérique avec $\delta = 0.1$.


# 2) Comparaison des taux de correction

Le but de cette partie est de voir comment le niveau de bruit du canal de communication influence le choix de code correcteur à utiliser. 

On considère un canal de communication qui transmet des bits d'information avec une probabilité d'erreur de $p<<1$. On encode les message avec un code $C$ de paramètres $[n,k,d]$. Si l'on veut transmettre un message de $m$ bits, on le découpera en morceaux de longueur $k$ qu'on encodera blocs par blocs. 

1) Exprimer en fonction de $p,n,k,d$ la probabilité, pour un bloc donné, que le code correcteur ne réussise pas à corriger le bruit du canal ?
2) Quelle est la probabilité qu'un message de longueur $m$ (on peut supposer $m$ divisible par $k$ pour simplifier) n'arrive pas à être transmis correctement ?
3) Faire une application numérique avec $p = 10^{-4}$ pour les codes de Hamming $[7,4,3]$, le code de Golay binaire étendu $[24,12,8]$, le code de Hadamard $[32,6,16]$. Que se passe-t-il avec $p=0.1$? En déduire les avantages et inconvénients de chacun.

# 3) Correction des bursts : l'entrelacement

Très souvent dans un canal de communication réel les erreurs arrivent par paquets (des "bursts"), toutes au même endroit ; comme les rayures sur un CD. 
L'entrelacement est une opération qui change l'ordre des symboles à l'émission pour
les remettre en ordre à la réception. Ceci permet de diluer les bursts sur plusieurs paquets encodés. On va s'intéresser à l'**entrelacement en blocs**. Pour cet entrelacement, on écrit les symboles issus du codeur à l'émission dans une matrice mémoire ligne par ligne et on les relit colonne par colonne. A la réception, l'opération inverse est effectuée pour rétablir l'ordre initial. 


On considère un code $[n,k,d]$. Un long message à transmettre $x$ est divisé en paquets de longueur $k$ avant d'être envoyé. On suppose que les erreurs arrivent systématiquements par bursts de taille $D$. Sans entrelacement, le message peut être non-déchiffrable dès que $D > t$ (où $t$ est le taux de correction). 
On considère maintenant un entrelacement par blocs de longueur $q >0$. On regroupe le message codé par paquets de longueur $q*n$ (donc $q$ blocs de taille $n$) et on les écrit dans une matrice $n \times q$ ligne par ligne . On envoie ensuite par le canal de transmission les coefficients de la matrice, colonne par colonne.

1) On suppose qu'une erreur de type "burst" de longueur $D$ arrive lors de la transmission. Quels sont les bits affectés et comment sont-ils répartis dans les blocs ? En déduire la taille maximale d'un burst qu'on peut systématiquement corriger.

2) **Inconvénients de l'entrelacement.** Quels inconvénients possibles voyez-vous à l'utilisation d'un entrelacement par blocs ?

3) Ecrire une fonction python ``entrelace(message, n,q)`` qui entrelace un message (une ``str`` de caractères) par des blocs $k,n$. On supposera que le message est de longueur un multiple de $n$ pour simplifier. Si ce n'est pas le cas, la fonction rajoutera des ``'0'`` à la fin du message pour que sa longueur soit un multiple de $n$. La fonction numpy ``np.ravel()`` pourra être pratique à utiliser.

In [5]:
def entrelace(message,n,q):
    pass