# TD5 - Lexicodes et algorithmes gloutons

Le but de ce TD est de montrer comment construire des codes correcteurs de distance $d$ prescrite à l'avance, en utilisant un *algorithme glouton.* Il y a essentiellement deux manières de procéder : soit en générant les vecteurs du code l'un après l'autre en les forcant à respecter la distance $d$, soit en générant une matrice de contrôle vecteur par vecteur.

On s'intéressera en particulier aux codes lexicographiques, ou lexicodes, qui sont des codes correcteurs d'erreurs générés de manière gloutonne et possédant des propriétés remarquablement bonnes. Par exemple, ils atteignent quasiment (à 1 près) les meilleures bornes connues pour les codes linéaires binaires. 
Ils ont été découverts indépendamment par Vladimir Levenshtein ainsi que par John Horton Conway et Neil Sloane. Les codes lexicographiques binaires sont des codes linéaires et incluent les codes de Hamming ainsi que les codes de Golay binaire.

# 1) Lexicodes  

Un lexicode de longueur $n$ et de distance minimale $d$ sur un corps fini est généré en commençant par une liste comportant uniquement le vecteur nul $(0,...,0)$, puis en ajoutant itérativement le prochain vecteur (dans l'ordre lexicographique) ayant une distance de Hamming minimale $d$ par rapport aux vecteurs déjà ajoutés. L'algorithme s'arrête quand on ne peut plus rien ajouter à la liste.

1) Construire à la main le lexicode de longueur $4$ et de distance $2$ à coefficients dans $\mathbb F_2$. Vérifier que c'est un code linéaire. Quelle est sa dimension ?

Une propriété surprenante des lexicodes est que ce sont toujours des codes linéaires (ce qui n'est pas évident à partir de la construction). Malheureusement, la preuve demanderait trop de temps pour ce TD. Vous pouvez en lire une dans l'article de Brualdi et Pless mentionné plus bas.

3) Ecrire une fonction python ``lexicode(n,d)`` qui génère le lexicode de distance minimale d de longueur $n$. Le tester sur $(n,d) = (7,3)$ et $(n,d) = (23,7)$. Que retrouve-t-on ?

4) Majorer la complexité de l'algorithme en fonction de $n$ et $d$.

5) Montrer que tout élément $x$ qui n'est pas dans le code est à distance au plus $d-1$ d'un élément du code. En déduire qu'un lexicode atteint la borne de Gilbert-Varshamov vue en cours.

In [1]:
import numpy as np
def lexicode(n,d):
    pass

# 2) Codes de Gray
Les codes de Gray sont une variante des lexicodes inventée par Brualdi et Pless en 1993 (https://www.sciencedirect.com/science/article/pii/009731659390085M) L'idée est de remplacer l'énumération lexicographique des vecteurs par une énumération plus intelligente qui améliore l'efficacité de l'algorithme.

1) L'ordre de Gray sur $\mathbb F_2^n$ est une façon d'ordonner tous les vecteurs tel que la distance de hamming entre un vecteur et le suivant dans la liste est toujours d'exactement $1$. Construisez à la main un ordre de Gray sur $\mathbb F_2^3$.
2) On considère $(v_1,...,v_{2^n})$ la liste des vecteurs de $\mathbb F_2^n$ dans l'ordre lexicographique ($v_1=(0,...,0),$ etc). Pour $v$ un vecteur, on appelle $G(v)$ le vecteur $v + S(v)$ où $S(v)$ est le shift vers la droite (on rajoute un $0$ à gauche et on oublie le bit le plus à droite). Par exemple, si $v = (0,1,1,1)$, on a $S(v) = (0,0,1,1)$ et $G(v) = (0,1,0,0)$. Montrer que $(G(v_1),...,G(v_{2^n}))$ est un ordre de Gray. Codez ceci dans une fonction ``gray(n)`` qui renvoie le code de gray du vecteur binaire qui représente $n$ en base $2$.
3) Créez une variante de la fonction ``lexicode`` qui énumère cette fois les vecteurs dans l'ordre de Gray. On l'appellera ``gray_code(n,d)``. La comparer avec ``lexicode`` pour des petites valeurs de $n$ (ça devrait donner des codes de même taille). La différence apparaît pour des valeurs de $n$ trop grandes pour être calculées ici avec l'algorithme fait en TD.

In [3]:
def gray_code(n,d):
    pass

# 3) Algorithme glouton pour les matrices de contrôle

Une autre manière de générer des codes linéaires de distance $d$ prescrite est de construire à l'aide d'un algorithme glouton une matrice de contrôle dont les vecteurs sont tels que le cardinal minimal d'une famille liée soit $d$. 
La méthode est la suivante : on part du vecteur $(0,...,0,1)$ en ajoutant itérativement le prochain vecteur (dans l'ordre lexicographique) qui n'est pas une combinaison linéaire de $(d-2)$ précédents. On s'arrête quand on ne peut plus ajouter de vecteurs. 

1) Rappeler les dimensions d'une matrice de contrôle pour un code $[n,k,d]$. Appliquez l'algorithme à la main pour un code avec $d=3$ et $n-k = 3$. Que retrouve-t-on ?

2) Ecrire une fonction ``control_matrix(d,l)`` qui génère une matrice de contrôle à $l$ lignes, de distance minimale $d$ avec cette technique (toujours sur $\mathbb F_2$). La tester en essayant de retrouver les deux codes de Golay binaires.

En fait, l'article de Brualdi et Pless mentionné plus haut montre que cet algorithme construit *exactement* une matrice de contrôle pour le lexicode de la partie 1. 