# TD 3 : Codes de Reed-Solomon

Le but de ce TD est d’étudier les codes correcteurs de Reed-Solomon.
Cette grande famille de codes sert notamment en pratique pour les CD et DVD, certaines transmissions
type ADSL ou satellites, des sondes spatiales, les QR codes.
Une idée majeure de ces codes est d’exploiter, en plus de la structure linéaire, des résultats sur les
polynômes. Ces codes linéaires, sur un corps fini $\mathbb F_q$ , sont de distance maximale ($d = n − k + 1$) et il
existe des algorithmes de décodage assez rapides (en temps polynomial) ne demandant pas de stocker
des tables de syndromes.




# 1. Généralités

On fixe $\alpha_1, \dots, \alpha_n$ dans $\mathbb{F}_q^\times$ deux à deux distincts et $v_1, \dots, v_n$ dans $\mathbb{F}_q^\times$.  

Un code de Reed-Solomon généralisé $[n, k, d]$ sur $\mathbb{F}_q$ est un code linéaire dont une matrice de contrôle est  
$$
V_{n-k, n}^{(\alpha)} \cdot D_n^{(v)} \quad \text{où} \quad
V_{n-k, n}^{(\alpha)} =
\begin{pmatrix}
1 & 1 & \dots & 1 \\
\alpha_1 & \alpha_2 & \dots & \alpha_n \\
\alpha_1^2 & \alpha_2^2 & \dots & \alpha_n^2 \\
\vdots & \vdots & & \vdots \\
\alpha_1^{n-k-1} & \alpha_2^{n-k-1} & \dots & \alpha_n^{n-k-1}
\end{pmatrix}
\quad \text{et} \quad
D_n^{(v)} =
\begin{pmatrix}
v_1 & 0 & \dots & 0 \\
0 & v_2 & \dots & 0 \\
\vdots & \vdots & & \vdots \\
0 & 0 & \dots & v_n
\end{pmatrix}.
$$

On appelle les $\alpha_i$ les localisateurs du code et les $v_i$ les multiplicateurs du code.  
Si $n = q-1$, le code est dit primitif. Si $\forall i, v_i = 1$, le code est dit normalisé.  

On note $\mathrm{GRS}$ (generalised Reed-Solomon) un tel code.
Un code RS est un GRS tel que $n$ divise $q − 1$ et tel qu’il existe $\alpha  \in \mathbb F_q$ d’ordre multiplicatif $n$ vérifiant
pour tout $i$ entre $1$ et $n$: $\alpha_i = \alpha^{i-1}$ et $v_i = \alpha^{b(i−1)}$ (pour un entier $b$ fixé). On note parfois $RS(n, k)$
un code RS de paramètres n et k.
 
**1.** (Matrices de Vandermonde) Soit $k$ un corps, $m \leq n$ des entiers et $(\alpha_1,...,\alpha_n) \in k^n$ distincts deux-à-deux. On considère la matrice $V$ donnée par
   $$ V_{i,j} = \alpha_i^j.$$
    Montrer en utilisant les application d'évaluation $k[X]_{\leq m-1} \xrightarrow{ev_{\alpha_i}} k$ que $V$ est de rang maximal $m$.  Ainsi la matrice $V$ représente une application injective $k^m \to k^n$ (et sa transposée une application surjective $k^n \to k^m$).
    
**2.** En déduire que la distance du code GRS est $d= n-k+1$. On dit qu'un tel code est "MDS" (maximal distance separable)

# 2. Encodage 
On connaît par définition une matrice de contrôle du code GRS. Le but de cette partie est de trouver une matrice génératrice ce qui va permettre d'avoir un algorithme d'encodage. 

1.On va montrer qu'une matrice génératrice est donnée par $G = V_{k, n}^{(\alpha)} \cdot D_n^{(v')}$ avec des $v'_i$ explicites.  On a donc les mêmes localisateurs mais pas les mêmes multiplicateurs.

On cherche $G$ de la forme plus haut. Écrire la relation vérifiée entre $G$ et la matrice de contrôle $H$, et écrire la relation obtenue entre la $i$-ème ligne de $G$ et la $j$-ème ligne de $H$.

Interpréter la famille de relations ci-dessus comme étant 
$$
V_{n-1,n}^{(\alpha)} \cdot D_n^{(v)} \cdot t(v'_1, \dots, v'_n) = 0.
$$

En utilisant la partie $1$ , en déduire qu’il existe des multiplicateurs $v'_i$ tous non nuls. On en déduit que le dual d'un code $GRS$ est un code $GRS$.

2. En déduire une interprétation polynomiale d'un code de Reed-Solomon.

3. Ecrire une fonction python ``encode_GRS(q,k,alpha,v, m)`` qui prend en entrée un entier $k$, un nombre premier $q$, une liste $(\alpha_1,...,\alpha_n)$ de localisateurs, une liste $(v_1,...,v_n)$ de multiplicateurs, un message $m$ de longueur $k$ dans $\mathbb F_q$ et qui renvoie le code GRS de m encodé par la matrice génératrice $G = V_{k, n}^{(\alpha)} \cdot D_n^{(v)}$.

On se servira d'une fonction auxiliaire ``vandermonde_matrix(alpha,k)``.

In [11]:
import numpy as np

def vandermonde_matrix(alpha,k):
    #alpha est une liste de localisateurs, m est un entier (le nombre de lignes de la matrice)
    pass
def encode_GRS(q,k,alpha,v,m):
    pass

# 2. Décodage sans correction 

On considère un code de matrice $G$ donnée par des localisateurs $(\alpha_1,...,\alpha_n)$ quelconques, et dont le code dual a des multiplicateurs $v'_i$ tous égaux à $1$ (pour simplifier). Un message $(m_1,...,m_n)$ est donc encodé par la liste $(P(\alpha_1),...,P(\alpha_n))$ avec $P = \sum_i m_i X^i$. 

1. Expliquer comment l'interpolation de Lagrange permet de retrouver les coefficients de $P$ à partir de ses valeurs sur les $\alpha_i$.
2. En déduire un algorithme de décodage sans correction et l'implémenter dans une fonction ``decode_GRS(q, alpha, c)``. On utilisera le module python ``numpy.polynomial.polynomial`` pour gérer les polynômes. On pourra se servir d'une fonction ``polynome_interpolateur(x, y)`` qui prend une liste $(x_1,...,x_n)$ d'elements distincts de $\mathbb F_q$, une liste $(y_1,...,y_n)$ et renvoie l'unique polynôme interpolateur $P$ de degré $\leq n$ tel que $\forall i,P(x_i) = y_i $ .

Note : Il peut être utile de savoir qu'on peut calculer l'inverse modulo $q$ d'un entier $k$ dans python avec la fonction ``pow(k,-1,q)``.

3. Testez votre code sur un message encodé avec la fonction ``encode_GRS``.

In [29]:
import numpy.polynomial.polynomial as poly
#Les polynômes sont représentés par des listes ou des array numpy (au choix). 
P = [1,2,3] #représente le polynôme 1 + 2X + 3X^2
Q = [0,1,0] # représente le polynôme X
print(poly.polyval(0,P)) #évaluer en 0
print(poly.polyval(1,P)) #évaluer en 1
L = poly.polymul(P,Q) # multiplier P et Q
print(L)


1.0
6.0
[0. 1. 2. 3.]


In [27]:
def polynome_interpolateur(x,y):
    pass
def decode_GRS(q,alpha,c):
    pass

# 3. Correction d'erreurs - Algorithme de Berlekamp-Welch

Soit $C$ un code GRS de paramètres $[n, k, n-k+1]$, de localisateurs $\alpha_i$, et dont le code dual a des multiplicateurs $v'_i = 1$.

$$
C = \{(P(\alpha_1), \dots, P(\alpha_n)) \, ; \, P \in \mathbb{F}_q[X] \, \text{où } \deg P \leq k-1\}.
$$

On suppose $d$ impair et $t = \frac{d-1}{2}$. Soit $c = (P(\alpha_1), \dots, P(\alpha_n))$ et $r \in \mathbb{F}_q^n$ tels que $d_H(c, r) \leq t$.  
On voit $r$ comme un message reçu, avec un nombre d’erreurs tel qu’il soit possible de retrouver $c$. En pratique, on cherche $P$.  

Expliquons l'idée de l'algorithme de Berlekamp-Welch. On considère $$E = \prod_{i \text{ t.q. } c_i \neq r_i } (X-\alpha_i) $$
A priori, ce polynôme est inconnu du receveur car on ne sait pas où sont les erreurs. 

1. Expliquer pourquoi $$\begin{equation}
\forall i, r_i E(\alpha_i) = P(\alpha_i)E(\alpha_i)
\end{equation}$$

Si on connait les polynômes $E$ et $Q = P  \times E$ on peut retrouver $P$ par une division euclidienne de $Q$ par $E$. A priori, il est impossible pour le receveur de retrouver exactement $E$ et $Q$. Cependant, on va chercher quand même des polynômes "substituts" $E'$ et $Q'$ qui satisfont l'équation précédente.

2. Soit $E'$ et $Q'$ avec $E'$ unitaire de degré $\leq t$ et $Q'$ de degré $\leq n-t-1$. On suppose $$\forall i, r_i E'(\alpha_i) = Q'(\alpha_i)$$.

Montrer que $QE' - Q'E$ s'annule en tous les $\alpha_i$. En déduire $QE' - Q'E = 0$.  

3. En déduire qu'on peut retrouver $P$ à partir de n'importe quelle paire $(E',Q')$ satisfaisant les hypothèses précédentes.
4. Pour trouver une paire $(E',Q')$ algorithmiquement, justifier qu'on peut se ramener à résoudre un système linéaire.
5. En déduire que l'algorithme de Berlekamp-Welch fonctionne et corrige les erreurs de poids $\leq t$.


L'algorithme de Berlekamp-Welch est en $O(n^3)$ où $n$ est la longueur du code. Il est donc beaucoup plus rapide qu'une méthode par syndrome qui demande de stocker (et comparer) un nombre exponentiel de syndromes. Il existe toutefois des méthodes plus rapides utilisant par exemple l'algorithme de Berlekamp-Massey en $O(n^2)$. 