Comme je pense souvent à des trucs inutiles, je vous livre ici un code secret de mon invention.
J’ai soumis ce code sur un site de matheux crytographes qui ont vite éludé le problème car c’est un code à l’ancienne qui n’utilise ni “clé” ni algorithme et donc ils n’ont pas les outils pour le casser.
Le cahier des charges que je me suis donné est de créer un code qui puisse résister un certain temps au cassage tout en étant assez simple pour pouvoir être lu “à l’oeil nu” par celui qui le connait.
A l’oeil nu veut dire qu’on utilise aucun tableau, ni outil mais qu’on le lit comme n’importe quel texte. Il faut quand même un petit apprentissage préalable mais qui est à la portée de tous.
Je ne sais pas s’il y a ici des gens que ça amusent, au cas où voici quelques éléments.
1- “Ceci est une ligne du code Mops”. donne :
FQARS GCNGM BSGDS JGCPD GSLUU PPACI POPOU DNRGO GQOWL BCTBS BJJFB BSGRN USXGY DOKHH SNRBC DCOYW UNNZU BYMRO BRPCU
2- “Ceci est une autre ligne du code Mops”. Donne :
EBFDO GJHDY RJDGC JQUBB BJECJ PRMUF GCRJJ DFSBD NUMJR KPJBO JBKGB OBBOY XBOTR UBUOY RDJQD ASSYR NDOFT EUVRG OBOUL KSHIA UDKWG JRPRC
Quelqu’un pourra t-il décoder ceci ?
PEQRC BCUTD ADUIE HCTRB SRUJI XSEKL ODMLD CPQDS JGJRD RCFJJ IBGCN AIJVR UNGMB CJFQA GJRAC PGBJB QBOBT JTPGP UDVBP OQSSC
Bonjour,
J’ai deux questions liées :
- est-ce un code avec du bruit (ou du sel) ? i.e “Ceci est une ligne du code Mops”. donne-t-il forcément et uniquement :FQARS GCNGM BSGDS JGCPD GSLUU PPACI POPOU DNRGO GQOWL BCTBS BJJFB BSGRN USXGY DOKHH SNRBC DCOYW UNNZU BYMRO BRPCU ?
- les espaces dans le texte chiffrés sont-ils purement pratiques (pour la lecture) ou chaque groupe de 5 lettres constitue-t-il un vrai ensemble ?
A+
SuperDéfi dit:Bonjour,
J'ai deux questions liées :
- est-ce un code avec du bruit (ou du sel) ? i.e "Ceci est une ligne du code Mops". donne-t-il forcément et uniquement :FQARS GCNGM BSGDS JGCPD GSLUU PPACI POPOU DNRGO GQOWL BCTBS BJJFB BSGRN USXGY DOKHH SNRBC DCOYW UNNZU BYMRO BRPCU ?
- les espaces dans le texte chiffrés sont-ils purement pratiques (pour la lecture) ou chaque groupe de 5 lettres constitue-t-il un vrai ensemble ?
A+
Pour la première question, tu peux le déduire avec les deux exemples qui sont très proches et dont le code est différent. Les mêmes mots présents dans les messages ne semblent pas se retrouver à l'identique dans les codes.
Le groupement par 5 est une convention utilisée par de nombreux codes. Elle ne sert qu'à simplifier la lecture. Ce n'est pas une composante du code lui-même.
Docteur Mops dit:
Je ne sais pas s'il y a ici des gens que ça amusent, au cas où voici quelques éléments.
C'est malin


Je relève quelques points.
Si on fait des statistiques sur les occurrences des lettres, on constate que le E est la lettre la plus courante dans les deux phrases d’origine (sauf si on compte les espaces comme un caractère, mais on sait que ce n’en est pas un dans les textes codés), qu’il est inexistant dans le premier texte codé et qu’il y en a trois dans le second.
Le texte doit pouvoir se lire sans table, cela exclut les codes de type Avocat, César et surtout Vigenère. Donc, cela ne doit pas être une permutation (ou alors que d’une ou deux lettre). Il doit pouvoir se lire facilement mais l’absence du E me fait rejeter tout les codes types Sand - de Musset. J’avoue que je sèche.
Pour le niveau de bruit, on a un rapport de 3,6 entre la première phrase et le premier code et de 3,66 entre la seconde phrase et le second code. Après on peut rechercher une fonction affine pour trouver le bon rapport, mais j’ai peur de m’y perdre. Les possibilités sont si nombreuses, deux caractère du code pour une lettre de l’origine, plus un bruit intercalé et une chaine de bruit au début et à la fin.
Voilà quelques pistes qui n’ont pour le moment pas abouti.
Le code Mops est il une combinaison astucieuse de code ancien, ou un tout nouvel algorithme ?
Krka dit:Je relève quelques points.
Si on fait des statistiques sur les occurrences des lettres, on constate que le E est la lettre la plus courante dans les deux phrases d’origine (sauf si on compte les espaces comme un caractère, mais on sait que ce n’en est pas un dans les textes codés), qu’il est inexistant dans le premier texte codé et qu’il y en a trois dans le second.
Le texte doit pouvoir se lire sans table, cela exclut les codes de type Avocat, César et surtout Vigenère. Donc, cela ne doit pas être une permutation (ou alors que d'une ou deux lettre). Il doit pouvoir se lire facilement mais l’absence du E me fait rejeter tout les codes types Sand - de Musset. J’avoue que je sèche.
Pour le niveau de bruit, on a un rapport de 3,6 entre la première phrase et le premier code et de 3,66 entre la seconde phrase et le second code. Après on peut rechercher une fonction affine pour trouver le bon rapport, mais j’ai peur de m’y perdre. Les possibilités sont si nombreuses, deux caractère du code pour une lettre de l'origine, plus un bruit intercalé et une chaine de bruit au début et à la fin.
Voilà quelques pistes qui n’ont pour le moment pas abouti.
Le code Mops est il une combinaison astucieuse de code ancien, ou un tout nouvel algorithme ?
Je ne suis pas un spé du code mais je connais les bases disons.
Normalement j'ai fait en sorte de résister à l'analyse de fréquence.
Pour rester dans la lignée des prédécesseurs, je ne complète en bruit que pour tomber sur une chaine de caractère de 5 lettres. Voilà pourquoi vous aurez une analyse de bruit stable. Donc on peut dire qu'elle est très bavarde cette stabilité de bruit ^^
Je confirme qu'il n'y a pas de permutation. C'est presque trop compliqué pour moi ^^
Ce n'est pas un nouvel algorithme.
C’est du charabia pour moi tout ça!
les bruits? c’est quoi?
y a un site où on peut se renseigner sur tout ce que vous racontez?
leonmars dit:C'est du charabia pour moi tout ça!
![]()
les bruits? c'est quoi?
y a un site où on peut se renseigner sur tout ce que vous racontez?
La fréquence : C'est la fréquence d'apparition de lettre dans une langue donnée. En français par exemple, on sait que :
- le E apparait en moyenne 17,26%, le A 8,40%, le S 8,08% etc.
- que les doubles fréquents sont : SS EE LL TT NN, ...
- que les premières lettres les plus fréquentes sont, L A S E C P R D
- et ainsi de suite.
Si le code utilise un signe pour remplacer une lettre, on peut retrouver celle-ci on comparant les fréquences de répétition. Il faut quand même assez de matière pour que les fréquences soient visibles.
Le bruit : Pour casser ces fréquences on peut ajouter du bruit. Les signes peuvent être codés en plusieurs signes.
On peut aussi ajouter des signes qui ne sont pas utilisés pour coder le texte clair mais pour noyer les éléments codés dans des informations qui n'ont pour but que de faire du "bruit". C'est une sorte de camouflage.
Certains codes utilisent l'effet inverse, ils utilisent un seul signe pour en coder plusieurs.
Dans le cas du code présent, on peut voir que le texte clair contient moins de signes que le texte codé. On peut donc envisager qu'il y a du "bruit" dans ce code.
Pour aider, j'ai donc avoué avoir ajouté un peu de bruit en fin de code pour que la fin contienne un paquet de 5 lettres.
Il y a donc très peu de bruit dans ce code au plus 4 lettres donc si le dernier paquet n'en contient qu'une seule.
C'est purement esthétique, le groupement en paquet de 5 lettres n'étant qu'une graphie permettant de lire le code plus facilement que si toutes les lettres étaient collées les unes aux autres. Un principe couramment utilisé dans plusieurs codes anciens.
Tu peux aller voir l'article de cryptologie sur wikipédia ou ce site :
http://www.bibmath.net/crypto/plan.php3
Pierre Berloquin a également sorti un livre récemment "Codes, la grande aventure" dont je parlerais dans le Petit Pouic n°3.
J’ai pas trop le temps/le courage de regarder. Mais j’intuite, peut être à tort, qu’on a un truc du genre :
Il faut 2 lettres pour en coder une.
La lettre à trouver est au milieu des deux autres
du genre,
pour coder D, j’ai CE ou EF etc…
pour coder B, j’ai AC, ZD, YE etc… (il faut que cela soit circulaire et, par convention, on prend l’intervalle le plus court)
Il est possible de complexifier le truc en ajoutant un décalage :
la 1 ere lettre à trouver est entre la 1 et la 4. La seconde enre la 2 et la 5, la 3, c’est du bruit, etc…
c’est la seule idée que je trouve pour :
faire suater l’analyse par fréquence
etre lisible en connaissant seulement l’alphabet.
C’est curieux, on remarque dans presque chaque groupe des “paires” de lettres identiques et des “suites” de deux lettres. Je me demande si c’est significatif, mais c’est curieux. Bon, je sais que l’unité de 5 lettres n’est pas importante, mais devant la répétition du phénomène, je me dis que ce n’est peut-être pas un hasard.
C’est bizarre, mais ça plus le fait que le Docteur parle de fréquence (qui ne serait pas une clé), de grilles (qui n’auraient pas d’utilité), ça m’évoque quelque chose où la position et l’ordre des lettres importe plus que leur nature… un genre d’ibara à plat où il faudrait repérer ce qui va ensemble avant de commencer à raisonner.
Mais pour ma part, mes compétences s’arrêtent là. Même si je dois reconnaître que ce genre de défi est plutôt prenant
Edit- tiens, je vois que JM s’est fait les mêmes remarques que moi entre-temps…
jmguiche dit:J'ai pas trop le temps/le courage de regarder. Mais j'intuite, peut être à tort, qu'on a un truc du genre :
Il faut 2 lettres pour en coder une.
La lettre à trouver est au milieu des deux autres
du genre,
pour coder D, j'ai CE ou EF etc...
pour coder B, j'ai AC, ZD, YE etc... (il faut que cela soit circulaire et, par convention, on prend l'intervalle le plus court)
Il est possible de complexifier le truc en ajoutant un décalage :
la 1 ere lettre à trouver est entre la 1 et la 4. La seconde enre la 2 et la 5, la 3, c'est du bruit, etc...
c'est la seule idée que je trouve pour :
faire suater l'analyse par fréquence
etre lisible en connaissant seulement l'alphabet.
Génial !
Mais...
Même avec 2 lettres pour en coder une tu retrouves les fréquences.
Et y'a pas de bruit sauf à la fin ^^
Bon je viens voir qu’une analyse de fréquence pouvait quand même donner quelque chose.
Il y a bien des lettres qui reviennent plus souvent.
Par contre une substitution avec les fréquences du français ne donne rien.
ouf ! ^^
Docteur Mops dit:jmguiche dit:J'ai pas trop le temps/le courage de regarder. Mais j'intuite, peut être à tort, qu'on a un truc du genre :
Il faut 2 lettres pour en coder une.
La lettre à trouver est au milieu des deux autres
du genre,
pour coder D, j'ai CE ou EF etc...
pour coder B, j'ai AC, ZD, YE etc... (il faut que cela soit circulaire et, par convention, on prend l'intervalle le plus court)
Il est possible de complexifier le truc en ajoutant un décalage :
la 1 ere lettre à trouver est entre la 1 et la 4. La seconde enre la 2 et la 5, la 3, c'est du bruit, etc...
c'est la seule idée que je trouve pour :
faire suater l'analyse par fréquence
etre lisible en connaissant seulement l'alphabet.
Génial !
Mais...
Même avec 2 lettres pour en coder une tu retrouves les fréquences.
Et y'a pas de bruit sauf à la fin ^^
Comme j'ai plusieur façon de coder une lettre, on peut facilement "pieger les fréquences". Et il faut un texte tres long...
Mais bon... C'est pas ça.
Ah mince, c’eût été trop beau… va falloir encore se creuser les méninges…
Docteur Mops dit:leonmars dit:C'est du charabia pour moi tout ça!
![]()
les bruits? c'est quoi?
y a un site où on peut se renseigner sur tout ce que vous racontez?
La fréquence : C'est la fréquence d'apparition de lettre dans une langue donnée. En français par exemple, on sait que :
- le E apparait en moyenne 17,26%, le A 8,40%, le S 8,08% etc.
- que les doubles fréquents sont : SS EE LL TT NN, ...
- que les premières lettres les plus fréquentes sont, L A S E C P R D
- et ainsi de suite.
Si le code utilise un signe pour remplacer une lettre, on peut retrouver celle-ci on comparant les fréquences de répétition. Il faut quand même assez de matière pour que les fréquences soient visibles.
Le bruit : Pour casser ces fréquences on peut ajouter du bruit. Les signes peuvent être codés en plusieurs signes.
On peut aussi ajouter des signes qui ne sont pas utilisés pour coder le texte clair mais pour noyer les éléments codés dans des informations qui n'ont pour but que de faire du "bruit". C'est une sorte de camouflage.
Certains codes utilisent l'effet inverse, ils utilisent un seul signe pour en coder plusieurs.
Dans le cas du code présent, on peut voir que le texte clair contient moins de signes que le texte codé. On peut donc envisager qu'il y a du "bruit" dans ce code.
Pour aider, j'ai donc avoué avoir ajouté un peu de bruit en fin de code pour que la fin contienne un paquet de 5 lettres.
Il y a donc très peu de bruit dans ce code au plus 4 lettres donc si le dernier paquet n'en contient qu'une seule.
C'est purement esthétique, le groupement en paquet de 5 lettres n'étant qu'une graphie permettant de lire le code plus facilement que si toutes les lettres étaient collées les unes aux autres. Un principe couramment utilisé dans plusieurs codes anciens.
Tu peux aller voir l'article de cryptologie sur wikipédia ou ce site :
http://www.bibmath.net/crypto/plan.php3
Pierre Berloquin a également sorti un livre récemment "Codes, la grande aventure" dont je parlerais dans le Petit Pouic n°3.
Merci!
Je vais regarder ça de plus près.
Il est cool ce docteur, la consultation est gratuite!

leonmars dit:Docteur Mops dit:leonmars dit:C'est du charabia pour moi tout ça!
![]()
les bruits? c'est quoi?
y a un site où on peut se renseigner sur tout ce que vous racontez?
La fréquence : C'est la fréquence d'apparition de lettre dans une langue donnée. En français par exemple, on sait que :
- le E apparait en moyenne 17,26%, le A 8,40%, le S 8,08% etc.
- que les doubles fréquents sont : SS EE LL TT NN, ...
- que les premières lettres les plus fréquentes sont, L A S E C P R D
- et ainsi de suite.
Si le code utilise un signe pour remplacer une lettre, on peut retrouver celle-ci on comparant les fréquences de répétition. Il faut quand même assez de matière pour que les fréquences soient visibles.
Le bruit : Pour casser ces fréquences on peut ajouter du bruit. Les signes peuvent être codés en plusieurs signes.
On peut aussi ajouter des signes qui ne sont pas utilisés pour coder le texte clair mais pour noyer les éléments codés dans des informations qui n'ont pour but que de faire du "bruit". C'est une sorte de camouflage.
Certains codes utilisent l'effet inverse, ils utilisent un seul signe pour en coder plusieurs.
Dans le cas du code présent, on peut voir que le texte clair contient moins de signes que le texte codé. On peut donc envisager qu'il y a du "bruit" dans ce code.
Pour aider, j'ai donc avoué avoir ajouté un peu de bruit en fin de code pour que la fin contienne un paquet de 5 lettres.
Il y a donc très peu de bruit dans ce code au plus 4 lettres donc si le dernier paquet n'en contient qu'une seule.
C'est purement esthétique, le groupement en paquet de 5 lettres n'étant qu'une graphie permettant de lire le code plus facilement que si toutes les lettres étaient collées les unes aux autres. Un principe couramment utilisé dans plusieurs codes anciens.
Tu peux aller voir l'article de cryptologie sur wikipédia ou ce site :
http://www.bibmath.net/crypto/plan.php3
Pierre Berloquin a également sorti un livre récemment "Codes, la grande aventure" dont je parlerais dans le Petit Pouic n°3.
Merci!
Je vais regarder ça de plus près.
Il est cool ce docteur, la consultation est gratuite!
Sur l'histoire des codes socrets, il y a aussi le livre de Simon Singh en livre de poche. Il m'a bien plu.
Donc, puisqu’il n’y a du bruit qu’à la fin, pour finir les lots de 5, j’en déduis ceci :
Il y a 27 caractères, l’espace est considéré comme un caractère.
Et un caractère est codé par 3 signes.
313=93. Donc, il y a 2 caractère de bruit à la fin du premier message codé.
373=111. Il y a 4 caractère de bruit à la fin du second message codé.
Krka dit:Donc, puisqu'il n'y a du bruit qu'à la fin, pour finir les lots de 5, j'en déduis ceci :
Il y a 27 caractères, l'espace est considéré comme un caractère.
Et un caractère est codé par 3 signes.
31*3=93. Donc, il y a 2 caractère de bruit à la fin du premier message codé.
37*3=111. Il y a 4 caractère de bruit à la fin du second message codé.
Bon raisonnement mais conclusion un peu rapide.
Je ne veux pas non plus vous aider trop.
Si votre compte est juste, vous obtenez un codage sur 3 caractères EN MOYENNE.
La supposition que c'est strictement 3 est un peu rapide (ce qui ne veux pas dire qu'elle est fausse).
A bah non, il n’y a que 110 caractères dans le second code
Docteur, mon patron vas te haïr