# TD 3 : Codes de Reed-Solomon

Le but de ce TD est d’étudier les codes correcteurs de Reed-Solomon.
Cette grande famille de codes sert notamment en pratique pour les CD et DVD, certaines transmissions
type ADSL ou satellites, des sondes spatiales, les QR codes.
Une idée majeure de ces codes est d’exploiter, en plus de la structure linéaire, des résultats sur les
polynômes. Ces codes linéaires, sur un corps fini $\mathbb F_q$ , sont de distance maximale ($d = n − k + 1$) et il
existe des algorithmes de décodage assez rapides (en temps polynomial) ne demandant pas de stocker
des tables de syndromes.




# 1. Généralités

On fixe $\alpha_1, \dots, \alpha_n$ dans $\mathbb{F}_q^\times$ deux à deux distincts et $v_1, \dots, v_n$ dans $\mathbb{F}_q^\times$.  

Un code de Reed-Solomon généralisé $[n, k, d]$ sur $\mathbb{F}_q$ est un code linéaire dont une matrice de contrôle est  
$$
V_{n-k, n}^{(\alpha)} \cdot D_n^{(v)} \quad \text{où} \quad
V_{n-k, n}^{(\alpha)} =
\begin{pmatrix}
1 & 1 & \dots & 1 \\
\alpha_1 & \alpha_2 & \dots & \alpha_n \\
\alpha_1^2 & \alpha_2^2 & \dots & \alpha_n^2 \\
\vdots & \vdots & & \vdots \\
\alpha_1^{n-k-1} & \alpha_2^{n-k-1} & \dots & \alpha_n^{n-k-1}
\end{pmatrix}
\quad \text{et} \quad
D_n^{(v)} =
\begin{pmatrix}
v_1 & 0 & \dots & 0 \\
0 & v_2 & \dots & 0 \\
\vdots & \vdots & & \vdots \\
0 & 0 & \dots & v_n
\end{pmatrix}.
$$

On appelle les $\alpha_i$ les localisateurs du code et les $v_i$ les multiplicateurs du code.  
Si $n = q-1$, le code est dit primitif. Si $\forall i, v_i = 1$, le code est dit normalisé.  

On note $\mathrm{GRS}$ (generalised Reed-Solomon) un tel code.
Un code RS est un GRS tel que $n$ divise $q − 1$ et tel qu’il existe $\alpha  \in \mathbb F_q$ d’ordre multiplicatif $n$ vérifiant
pour tout $i$ entre $1$ et $n$: $\alpha_i = \alpha^{i-1}$ et $v_i = \alpha^{b(i−1)}$ (pour un entier $b$ fixé). On note parfois $RS(n, k)$
un code RS de paramètres n et k.
 
**1.** (Matrices de Vandermonde) Soit $k \leq n$ des entiers et $(\alpha_1,...,\alpha_n) \in \mathbb F_q$ distincts deux-à-deux. On considère la matrice $V$ donnée par
   $$ V_{i,j} = \alpha_i^j.$$
    Montrer en utilisant les application d'évaluation $\mathbb F_q[X]_{< k} \xrightarrow{ev_{\alpha_i}} \mathbb F_q$ que $V$ est de rang maximal $m$.  Ainsi la matrice $V$ représente une application injective $\mathbb F_q^k \to \mathbb F_q^n$ (et sa transposée une application surjective $\mathbb F_q^n \to \mathbb F_q^k$).
    
**2.** En déduire que la distance du code GRS est $d= n-k+1$. On dit qu'un tel code est "MDS" (maximal distance separable)



**Correction.** 1. L'application d'évaluation en les $\alpha_i$
$$ ev_\alpha: \mathbb K[X]_{< k} \to \mathbb K^k$$
$$ P \mapsto (P(\alpha_1), \dots , P(\alpha_n))$$
a pour matrice dans les bases canoniques exactement la matrice de Vandermonde $V$ décrite plus haut. On peut le vérifier en évaluant sur la base canonique de $\mathbb K[X]_{\leq k} $ par exemple.
Ainsi pour montrer que V est de rang maximal il suffit de montrer que cette application linéaire $ev_\alpha$ est injective. Soit $P \in Ker(ev_\alpha)$. Alors $P$ s'annule en $n$ points et est de degré $< n$, donc $P$ est nul et $ev_\alpha$ est donc injective.  

2. On sait que la matrice de contrôle d'un code GRS est une matrice de Vandermonde multipliée par une matrice diagonale. La distance $d$ est, par le cours, le cardinal minimal d'une famille de colonnes liées. Soit $C_{i_1},...,C_{i_p}$ un sous-ensemble de $p$ colonnes. Supposons $p < n-k+1$. Alors par la question précédente, cette matrice -de taille $(n-k) \times p$  est de rang $p = \min(p, n-k)$ et donc ses colonnes sont libres. Pour $p = n-k+1$ la matrice est de taille $(n-k) \times (n-k+1)$. On voit que son rang est forcément $n-k$ donc il existe une combinaison linéaire des colonnes qui s'annule.  Par conséquent $d = n-k+1$ et la borne du singleton est atteinte.

# 2. Encodage 
On connaît par définition une matrice de contrôle du code GRS. Le but de cette partie est de trouver une matrice génératrice ce qui va permettre d'avoir un algorithme d'encodage. 

1.On va montrer qu'une matrice génératrice est donnée par $G = V_{k, n}^{(\alpha)} \cdot D_n^{(v')}$ avec des $v'_i$ explicites.  On a donc les mêmes localisateurs mais pas les mêmes multiplicateurs.

On cherche $G$ de la forme plus haut. Écrire la relation vérifiée entre $G$ et la matrice de contrôle $H$, et écrire la relation obtenue entre la $i$-ème ligne de $G$ et la $j$-ème ligne de $H$.

Interpréter la famille de relations ci-dessus comme étant 
$$
V_{n-1,n}^{(\alpha)} \cdot D_n^{(v)} \cdot t(v'_1, \dots, v'_n) = 0.
$$

En utilisant la partie $1$ , en déduire qu’il existe des multiplicateurs $v'_i$ tous non nuls. On en déduit que le dual d'un code $GRS$ est un code $GRS$.

2. En déduire une interprétation polynomiale d'un code de Reed-Solomon.

**Correction.**
1. La relation est $G ^t H = 0$ (par définition de la matrice de contrôle, les lignes de $H$ doivent être orthogonales aux lignes de $G$). Si l'on suppose que $G$ est de la forme $G = V_{k, n}^{(\alpha)} \cdot D_n^{(v')}$, la relation d'orthogonalité entre la ligne $i$ de $G$ et la ligne $j$ de $H$ s'écrit :

$$ 0 = \sum_k v_k \alpha_k^i v'_k \alpha_k^j = \sum_k v_k \alpha_k^{i+j}v'_k$$
Ca revient donc à demander que le vecteur $v' = (v'_1,...,v'_n)$ soit orthogonal aux vecteurs $(v_1 \alpha_1^{p},...,v_n \alpha_n^{p})$ pour tout $p$ compris entre $0$ et $n-2$ (c'est les valeurs possibles de $i+j$ car $0 \leq i \leq k-1$ et $0 \leq j \leq n-k-1$ ). 
On peut donc écrire ces conditions sous la forme : 
$$
A \cdot ^t(v'_1, \dots, v'_n) = 0.
$$
avec la $p$-ième ligne de $A$ égale à $(v_1 \alpha_1^p, v_2 \alpha_2^p, \dots, v_n \alpha_n^p)$ soit 
$$ A = V_{n-1,n}^{(\alpha)} \cdot D_n^{(v)}. $$

Par conséquent : comme $A$ est un produit d'une matrice de vandermonde par une matrice inversible on sait que son rang est maximal égal à $n-1$. Son noyau est donc engendré par un $n$-uplet $(v'_1,...,v'_n)$. Montrons que les $v_i$ sont tous non nuls. Supposons le contraire. Soit $I = \{i \text{ tels que } v'_i \neq 0 \}$. Alors $|I| \leq n-1$. Donc la matrice $A'$ extraite de $A$ en gardant les colonnes d'indice $i \in I$ est injective par la partie $1$. Or elle annule le vecteur $(v'_i)_{i \in I}$, contradiction;  On trouve donc bien $G$ de la forme cherchée. 

Pour finir, on voit que la matrice $G$ qu'on a obtenu est bien associée à une application linéaire injective (par la partie précédente) et donc l'image de $G$ est égale à l'orthogonal de $H$ par un calcul de dimension. Donc $G$ est une matrice génératrice du code. 

2. L'application associée à $G$ peut s'interpréter comme une évaluation de polynômes en plusieurs points via l'isomorphisme $\mathbb F_q^k \simeq \mathbb F_q[X]_{< k}$. En effet, c'est la matrice de l'application
   $$ \mathbb F_q[X]_{< k} \xrightarrow{ev_\alpha} \mathbb F_q^n$$
   $$ P \mapsto (v'_1 P(\alpha_1), \cdots, v'_n P(\alpha_n))$$

On peut donc voir le code de Reed-Solomon généralisé de la façon suivante : le message à transmettre est vu comme la liste des coefficients d'un polynôme P. Pour transmettre 
$P$, on échantillonne $P$ sur suffisamment de valeurs de manière à pouvoir le retrouver : on transmet $P(\alpha_1), ..., P(\alpha_n)$ (éventuellement multiplié par les $v'_i$). comme $n > deg P$ on peut retrouver $P$ à partir de ses valeurs sur les $\alpha_i$.

3. Ecrire une fonction python ``encode_GRS(q,k,alpha,v, m)`` qui prend en entrée un entier $k$, un nombre premier $q$, une liste $(\alpha_1,...,\alpha_n)$ de localisateurs, une liste $(v_1,...,v_n)$ de multiplicateurs, un message $m$ de longueur $k$ dans $\mathbb F_q$ et qui renvoie le code GRS de m encodé par la matrice génératrice $G = V_{k, n}^{(\alpha)} \cdot D_n^{(v)}$.

On se servira d'une fonction auxiliaire ``vandermonde_matrix(alpha,k)``.

In [14]:
import numpy as np

def vandermonde_matrix(alpha,k):
    """
    Renvoie une matrice de Vandermonde.
    
    Paramètres:
    alpha (list): Liste d'entiers de taille n.
    k (int): Nombre de colonnes de la matrice.

    Returns:
    numpy.ndarray: Matrice de Vandermonde de taille n x k.
    """
    alpha = np.array(alpha)
    n = len(alpha)
    V = np.zeros((k, n), dtype=int)
    
    for j in range(k):
        V[j, :] = alpha ** j 
    
    return V

# Exemple d'utilisation
alpha = [1, 2, 3]
k = 4
print(vandermonde_matrix(alpha, k))


def encode_GRS(q,k,alpha,v,m):
    """ Renvoie le message m encodé par un code de Reed-Solomon de localisateurs alpha (liste)"""
    m = np.array(m)
    if k!= len(m):
        return "Erreur : la longueur du message est incompatible"
    if k>len(alpha):
        return "Erreur : le message est trop long"
    V = np.dot(vandermonde_matrix(alpha,k), np.diag(v))
    C = np.dot(m, V)
    return C%q

[[ 1  1  1]
 [ 1  2  3]
 [ 1  4  9]
 [ 1  8 27]]


In [2]:
encode_GRS(5,3,[1,2,3,4], [1,1,1,1], [0,2,1]) #on encode le message [0,2,1].


array([3, 3, 0, 4])

On a donc encodé le message $(0,2,1)$ par l'array $(3,3,0,4) \in \mathbb F_5^4$ avec $\alpha = (1,2,3)$ et des multiplicateurs égaux à $1$. 

# 2. Décodage sans correction 

On considère un code de matrice $G$ donnée par des localisateurs $(\alpha_1,...,\alpha_n)$ quelconques, et dont le code dual a des multiplicateurs $v'_i$ tous égaux à $1$ (pour simplifier). Un message $(m_1,...,m_n)$ est donc encodé par la liste $(P(\alpha_1),...,P(\alpha_n))$ avec $P = \sum_i m_i X^i$. 

1. Expliquer comment l'interpolation de Lagrange permet de retrouver les coefficients de $P$ à partir de ses valeurs sur les $\alpha_i$.
2. En déduire un algorithme de décodage sans correction et l'implémenter dans une fonction ``decode_GRS(q, alpha, c)``. On utilisera le module python ``numpy.polynomial.polynomial`` pour gérer les polynômes. On pourra se servir d'une fonction ``polynome_interpolateur(q, x, y)`` qui prend une liste $(x_1,...,x_n)$ d'elements distincts de $\mathbb F_q$, une liste $(y_1,...,y_n)$ et renvoie l'unique polynôme interpolateur $P$ de degré $\leq n$ tel que $\forall i,P(x_i) = y_i $ .

Note : Il peut être utile de savoir qu'on peut calculer l'inverse modulo $q$ d'un entier $k$ dans python avec la fonction ``pow(k,-1,q)``.

3. Testez votre code sur un message encodé avec la fonction ``encode_GRS``.

In [15]:
import numpy.polynomial.polynomial as poly
#Les polynômes sont représentés par des listes ou des array numpy (au choix). 
P = [1,2,3] #représente le polynôme 1 + 2X + 3X^2
Q = [0,1,0] # représente le polynôme X
print(poly.polyval(0,P)) #évaluer en 0
print(poly.polyval(1,P)) #évaluer en 1
L = poly.polymul(P,Q) # multiplier P et Q
print(L)


1.0
6.0
[0. 1. 2. 3.]


In [16]:
def prod(liste_polys):
    #renvoie le produit d'une liste de polynômes
    P=[1]
    for i in range(len(liste_polys)):
        P = poly.polymul(P,liste_polys[i])
    return P

Rappel : le polynôme interpolateur $L_i$ qui vaut $1$ en $x_i$ et $0$ en les $(x_j)_{j\neq i}$ peut s'écrire de la façon suivante : 

$$ L_i(X) = \frac{\prod_{j \neq i} (X-x_j)}{\prod_{j \neq i}(x_i - x_j)} $$

Par linéarité, si on veut un polynôme $P$ tel que $P(x_i) = y_j$, on prend:
$$ P(X) = \sum_{i} y_i L_i(X) $$

On utilise ces formules dans l'implémentation ci-dessous.

In [10]:
def lagrange(q,i,x):
    '''Renvoie l'unique polynôme de degré < len(x) qui vaut 1 en x_i et 0 sur les autres x_j''' 
    P=[1]
    for j in range(len(x)):
        if i!=j:
            P=poly.polymul(P, [-x[j],1])
    P=pow(int(poly.polyval(x[i],P)),-1,q)*P
    return P

In [11]:
def polynome_interpolateur(q,x,y):
    '''J'utilise une fonction auxiliaire lagrange(q,i,x) qui renvoie le polynôme interpolateur qui vaut 1 en x_i et 0 en les  x_j différents de x_i.
    par linéarité, P_final  = somme des y[i] * lagrange(q,i,x)'''
    P_final=[0]
    for i in range(len(x)):
        P_final+=y[i]*lagrange(q,i,x)
    return P_final

In [15]:
P=lagrange(5, 3, [0,1,2,3,4,5]) 
print(list(int(poly.polyval(i,P)%5) for i in range(6))) #test pour vérifier si ça marche

[0, 0, 0, 1, 0, 0]


In [19]:
x=[1,2,3,4,5]
y=[0,2,0,3,4]

In [6]:
Q=polynome_interpolateur(5,x,y) #on définit le polynôme interpolateur

NameError: name 'polynome_interpolateur' is not defined

In [21]:
print(list(int(poly.polyval(i,Q)%5) for i in range(1,6))) #vérification

[0, 2, 0, 3, 4]


In [12]:
def decode_grs(q, alpha, m, k):
    polynome = polynome_interpolateur(q,alpha[:k],m[:k]) #on interpole à partir des k premières évaluations ; ça suffit pour déterminer un polynôme de degré < k.
    return polynome%q

In [17]:
m=np.array([3, 3, 0, 4]) #on essaie de décoder le message encodé précédemment
a=decode_grs(5,[1,2,3,4],m, 3)
print(np.array(a,dtype=int))

[0 2 1]


# 3. Correction d'erreurs - Algorithme de Berlekamp-Welch

Soit $C$ un code GRS de paramètres $[n, k, n-k+1]$, de localisateurs $\alpha_i$, et dont le code dual a des multiplicateurs $v'_i = 1$.

$$
C = \{(P(\alpha_1), \dots, P(\alpha_n)) \, ; \, P \in \mathbb{F}_q[X] \, \text{où } \deg P \leq k-1\}.
$$

On suppose $d$ impair et $t = \frac{d-1}{2}$. Soit $c = (P(\alpha_1), \dots, P(\alpha_n))$ et $r \in \mathbb{F}_q^n$ tels que $d_H(c, r) \leq t$.  
On voit $r$ comme un message reçu, avec un nombre d’erreurs tel qu’il soit possible de retrouver $c$. En pratique, on cherche $P$.  

Expliquons l'idée de l'algorithme de Berlekamp-Welch. On considère $$E = \prod_{i \text{ t.q. } c_i \neq r_i } (X-\alpha_i) $$
A priori, ce polynôme est inconnu du receveur car on ne sait pas où sont les erreurs. 

1. Expliquer pourquoi $$\begin{equation}
\forall i, r_i E(\alpha_i) = P(\alpha_i)E(\alpha_i)
\end{equation}$$

Si on connait les polynômes $E$ et $Q = P  \times E$ on peut retrouver $P$ par une division euclidienne de $Q$ par $E$. A priori, il est impossible pour le receveur de retrouver exactement $E$ et $Q$. Cependant, on va chercher quand même des polynômes "substituts" $E'$ et $Q'$ qui satisfont l'équation précédente.

**Correction.**

Pour $i$ tel que $r_i = c_i$ (pas d'erreur), on a simplement $P(\alpha_i)E(\alpha_i) = c_i E(\alpha_i) = r_i E(\alpha_i)$. Si $r_i \neq c_i$ (erreur), alors $E(\alpha_i) = 0$ par construction et donc les deux membres sont nuls.

2. Soit $E'$ et $Q'$ avec $E'$ unitaire de degré $\leq t$ et $Q'$ de degré $\leq n-t-1$. On suppose $$\forall i, r_i E'(\alpha_i) = Q'(\alpha_i)$$.

Montrer que $QE' - Q'E$ s'annule en tous les $\alpha_i$. En déduire $QE' - Q'E = 0$.  

**Correction.**
On a $QE'(\alpha_i) - Q'E(\alpha_i) = r_i E(\alpha_i) E'(\alpha_i) - r_i E'(\alpha_i) E(\alpha_i) = 0$ en remplaçant $Q$ et $Q'$. Or $QE'$ et $Q'E$ sont tous deux de degré $\leq n-1$ donc $QE'-Q'E$ aussi. Or ce polynôme s'annule $n$ fois (en chaque $\alpha_i$). Donc il est nul et $QE' = Q'E$.


3. En déduire qu'on peut retrouver $P$ à partir de n'importe quelle paire $(E',Q')$ satisfaisant les hypothèses précédentes.
   On voit par $2)$ que pour n'importe quelle paire $(E',Q')$ le quotient $Q'/E'$ est égal à $P$ puisque par l'équation précédente $P = Q/E = Q'/E'$.
5. Pour trouver une paire $(E',Q')$ algorithmiquement, justifier qu'on peut se ramener à résoudre un système linéaire.

Trouver une telle paire $(E',Q')$ peut se voir comme une problème linéaire en les coefficients de $E'$ et $Q'$. L'ensemble des coefficients $(E',Q')$ qui conviennent (avec $E'$ non nécessairement unitaire) est donné par le noyau de l'application linéaire
$$ \mathbb R^{t+1} \times \mathbb R^{n-t} \to \mathbb R^{n} $$ 
$$ (\text{coefficients de }E', \text{coefficients de } Q' \mapsto (r_i E'(\alpha_i) - Q'(\alpha_i))_{i=1,...n})$$

Qui est nécessairement de noyau non nul car la dimension de la source est $n+1$, supérieure à la dimension du but.


6. En déduire que l'algorithme de Berlekamp-Welch fonctionne et corrige les erreurs de poids $\leq t$.

**Correction.**

Soit $r$ le message reçu. Par la question précédente, on trouve une paire $(E',Q')$ qui convient. Comme on suppose qu'il y a eu moins de $t$ erreurs pendant la transmission, les hypothèses de la question $2$ sont satisfaites et on sait que $E'/Q'$ est égal au polynôme $P$ de départ qui a été encodé.  L'algorithme de Berlekamp-Welch **permet donc bien de corriger les erreurs de poids $\leq$ t.**


L'algorithme de Berlekamp-Welch est en $O(n^3)$ où $n$ est la longueur du code. Il est donc beaucoup plus rapide qu'une méthode par syndrome qui demande de stocker (et comparer) un nombre exponentiel de syndromes. Il existe toutefois des méthodes plus rapides utilisant par exemple l'algorithme de Berlekamp-Massey en $O(n^2)$. 