# TD 8 - Localité, codes de Tamo-Barg

Le but de ce TD est d'étudier la propriété de *localité* d'un code, et en particulier d'étudier la famille de codes linéaires locaux définis par Tamo et Barg dans https://arxiv.org/pdf/1311.3284. Dans la suite on fixe un corps fini $\mathbb F_q$.

Informellement, on dit qu'un code $C \subseteq \mathbb{F}_q^n$ a une localité $r$ si chaque symbole du mot de code $x \in C$ peut être récupéré à partir d'un sous-ensemble de $r$ autres symboles de $x$ (c'est-à-dire, est une fonction de certains autres $r$ symboles $x_{i_1}, x_{i_2}, \dots, x_{i_r}$).  

En d'autres termes, cela signifie que, pour tout $x \in C$ et tout $i \in [n]$, il existe un sous-ensemble d'indices $I_i \subseteq [n] \setminus \{i\}$, avec $|I_i| \leq r$, tel que la restriction de $C$ aux coordonnées de $I_i$ (notée $C_{I_i}$) permette de retrouver la valeur de $x_i$.  

Le sous-ensemble $I_i$ est appelé un ensemble de récupération pour le symbole $x_i$.


La définition formelle est la suivante. Étant donné un $a \in \mathbb{F}_q$, considérons les ensembles de mots de code  

$$
C(i, a) = \{x \in C : x_i = a\}, \quad i \in [n].
$$

Le code $C$ est dit $r$-local si, pour tout $i \in [n]$, il existe un sous-ensemble $I_i \subseteq [n] \setminus \{i\}$, avec $|I_i| \leq r$, tel que les restrictions des ensembles $C(i, a)$ aux coordonnées dans $I_i$ pour différentes valeurs de $a$ soient disjointes :  

$$
C_{I_i} (i, a) \cap C_{I_i} (i, a') = \emptyset, \quad a \neq a'.
$$

Le but est bien sûr de trouver des codes locaux de distance minimale $d$ la plus grande possible et de ratio $k/n$ le plus grand possible.

## 1 - Bornes pour les codes locaux

Il existe des inégalités pour les codes locaux portant sur le ratio $k/n$ et la distance $d$ qui dépendent de la localité $r$. Dans la suite, on considère un code $r$-local de paramètres $[n,k,d]$.

1) Vérifier que n'importe quel code $[n,k,d]$ est $r$-local pour $r = n-\lfloor \frac d 2 \rfloor -1$.
2) Quelle est la localité du code de répétition ternaire ?

On va maintenant montrer l'inégalité suivante : 
$$ \frac k n \leq \frac r {r+1}$$

On va admettre le théorème suivant : 

**Théorème**
Soit $G = (V,E)$ un graphe orienté à $n$ sommets. On note $d_i^{out}$ le nombre d'arêtes sortantes du sommet $i$. Alors il existe un sous-ensemble $U$ de sommets de $G$ tel que la restriction du graphe à $U$ soit acyclique (pas de boucles dans le graphe), avec 
$$ |U| \geq  \frac n {1+ \frac 1 n \sum_i d_i^{out}} $$

3) Considérer le graphe $G$ de sommets $[n] = \{1,...,n\}$ et avec une arête de $i$ vers $j$ si $j \in I_i$. On applique le théorème pour construire un sous-ensemble $U$ de cardinal $\geq  \frac n {1+ \frac 1 n \sum_i d_i^{out}}$ tel que $G_{|U}$ soit acyclique. Montrer qu'il existe un sommet $i$ dans $G_{|U}$ qui n'a aucun sommet sortant dans $G_{|U}$. En déduire que pour un mot de code $x$, $x_i$ est fonction des coordonnées $x_j$ avec $j \in [n] - U$.
4) En considérant le sous graphe sur les sommet $U - \{i\}$, montrer qu'il existe un indice $i' \in U - \{i \}$ tel que $x_{i'}$ soit aussi fonction des coordonnées $x_j$ avec $j  \in [n] - U$.  Appliquer un raisonnement par récurrence pour en déduire que pour tout $k \in U$, $x_k$ est fonction des coordonnées $x_j$ avec $j \in [n] - U$.
5) En déduire que $k \leq \frac {rn} {r+1}$.

La deuxième inégalité fondamentale pour les codes locaux est la suivante. C'est une généralisation de la borne du singleton.

$$ d \leq n-k - \bigg \lceil \frac k r \bigg \rceil + 2$$

6) Montrer que la distance minimale $d$ d'un code sur quelconque $\mathbb F_q$ peut s'écrire
$$ d = n - \max_{I \subseteq [n]} \{ |I| : |C_I| < q^k \}$$

7) Soit $U' \subset U$ de cardinal $\lfloor \frac {k-1} r \rfloor$. Montrer en utilisant l'inégalité déjà démontrée qu'il est possible de trouver un tel $U'$. Comme $U' \subset U$, le sous graphe induit $G_{U'}$ est aussi acyclique. Soit $N$ l'ensemble des indices de $[n] \backslash U'$ qui ont au moins une arête entrante provenant d'un sommet de $U'$. Expliquer pourquoi $N \leq k-1$.

Par l'argument de la question $4$, on sait que tout $x_k$ avec $k \in U'$ est fonction des $x_i$ aux coordonnées $i \in N$.  

8) Soit $N'$ l'ensemble des indices $N$ auquel on a ajouté arbitrairement $k-1 - |N|$ coordonnées dans $[n] \backslash (N \cup U') $. $N'$ est donc de cardinal $k-1$.  En utilisant les questions précédentes montrer que $ |C_{N' \cup U'}|= |C_{N'}| \geq q^{k-1}$. En déduire l'inégalité attendue en utilisant la formule de la question 6).

## 2 - Les code de Tamo-Barg

Les codes de Tamo-Barg sont des codes locaux *optimaux* au sens où ils atteignent la borne sur $d$ vue plus haut. Nous allons les construire et montrer leur optimalité. Ils ressemblent beaucoup dans leur construction aux codes de Reed-Solomon que vous avez déjà vus. Dans la suite on fixe un corps fini $\mathbb F_q$, un entier $r$ et un entier $n$ divisible par $r+1$.  On suppose que $q \geq n$.

**"Bons" polynômes**. Un ingrédient clef dans la construction de Tamo et Barg est l'existence d'un polynôme $g$ sur $\mathbb F_q$ satisfaisant les propriétés suivantes : 

1) $g$ est de degré $r+1$.
2) Il existe une partition $\mathcal A = \{A_1,...,A_{\frac n {r+1}}\}$ d'un sous-ensemble $A \subset \mathbb F_q$ de taille $n$ en ensembles de taille $r+1$ tel que la restriction de $g$ à chaque $A_i$ est constante.

On prouvera qu'il existe de tels polynômes plus tard. Pour l'instant, on en choisit un qu'on appelle $g$, associé à la partition $\mathcal A$.

**Construction du code.**
On va construire un code $(n,k)$ $r$-local avec $k$ un multiple de $r$. On prend $a$ un message de longueur $k = r \times \frac k {r}$ qu'on écrit sous forme d'une matrice $(a_ij)$ (avec $0 \leq i \leq r-1 $ et $0 \leq j \leq \frac k r -1$). Le polynôme encodeur $f_a(x)$ associé au message est défini par 
$$ f_a(x) = \sum_{i=0}^{r-1} f_i(x)x^i$$
où $$f_i(x) = \sum_{j=0}^{\frac k r -1} a_{ij} g(x)^j$$
Le mot de code de $a$ est alors défini comme la liste des évaluations
$$ (f_i(u))_{u \in A}$$ 

1) Soit $s \in A_i$ un élément. Montrer que la valeur du mot de code en les éléments $A_i \backslash \{s\} $ permet de retrouver sa valeur en $s$, i.e. $f_i(s)$. En déduire que le code est bien $r$-local. *Indice : utiliser l'interpolation de Lagrange, comme pour Reed-Solomon.*
2) On va montrer que le code ainsi construit satisfait l'inégalité
$$ d \leq n-k - \bigg \lceil \frac k r \bigg \rceil + 2.$$
i) Montrer que les polynômes $g(x)^i x^j$ pour $i = 0,...,r-1$ et $j = 0,...,\frac k r - 1$ sont linéairement indépendants. En déduire que $a \mapsto f_a(x)$ est injectif. En bornant le degré des $f_a(x)$ en déduire que le code est effectivement de dimension $k$.

    ii) Expliquer pourquoi pour un tel code linéaire (évaluation d'un polynôme en plusieurs points) la distance $d$ du code vérifie
   $$d \geq n- \max_{a\in \mathbb F_q^k} \deg f_a$$
   et en déduire que le code est optimal.

**Construction de "bons" polynômes.**
Il s'agit maintenant de montrer comment construire de tels polynômes $g$ vérifiant les hypothèses décrites plus haut. 
Tamo et Barg utilisent la technique suivante :

**Proposition :** Soit $H$ un sous groupe de $(\mathbb F_q^*, \times)$ ou de $(\mathbb F_q, +)$. Le polynôme 
$$ g(x)  = \prod_{h \in H} (x-h)$$ est constant sur les classes à gauche $c H$ (i.e. $c \times H$ ou $c + H$ selon que $H$ est un sous-groupe additif ou multiplicatif).

3) Montrer la proposition. En déduire comment construire une partition $\mathcal A$ comme dans l'énoncé à partir d'un sous-groupe $H$.

## 2 - Construction d'un exemple. 

On va construire un exemple sur $\mathbb F_{13}$ avec $n=12$, $k=6$, $d=6$ et $r=3$. 
1) Vérifier que $5$ est une racine quatrième de l'unité dans $\mathbb F_{13}$. En déduire que le polynôme $x^4$ est constant sur les classes à gauche (multiplicatives) de $H = \{1, 5, 12, 8\}$. En déduire une construction d'un code de Tamo-Barg avec ces paramètres. Quel est le polynôme associé à un message $(a_1,...,a_6)$ ?