# atom.awk corrigé 2025-08-21T07:09:40Z En bricolant mon site, je me suis aperçu qu'un bout de texte non souhaité était intégré dans les entrées de mon flux. C'est parce que je passe tous mes fichiers sources en extension ".txt" pour un petit projet en cours. Le code qui me permet de générer le flux atom se charge de lister tous les fichiers txt d'un répertoire. => https://si3t.ch/code/atom.awk/ Il ignore les fichiers dont le nom commence par un "_". Cependant, là, j'ai un fichier qui n'est pas une entrée du flux, mais qui ne commence pas par un "_". J'ai donc ajouté une vérification qui devrait être là depuis longtemps : si la date de plublication indiquée sur la 2e ligne n'est pas au bon format, alors ce n'est sans doute pas une entrée de blog et le fichier doit être ignoré. Voici à quoi ressemble la regex (awk rocks!) ``` if (pubdate !~ /[0-9]{4}-[0-9]{2}-[0-9]{2}T[0-9]{2}:[0-9]{2}:[0-9]{2}Z/) { ``` On doit pouvoir faire plus court, mais j'aime autant la laisser ainsi car c'est plus clair pour moi. Elle est constituée des éléments suivants : * [0-9] : il doit y avoir un chiffre * [0-9]{4} : Ce doit être un nombre de 4 chiffres * [0-9]{4}-[0-9]{2} : Un nombre de 4 chiffres suivi d'un tiret suivi d'un nombre de 2 chiffres * [0-9]{4}-[0-9]{2}-[0-9]{2}T : Encore 2 chiffres après un tiret puis un "T" La suite c'est la même logique pour l'heure, mais c'est séparé par des ":" et pas des "-". AWK permet de tester une regex avec l'opérateur "~", et la regex est indiquée entre "/". En tout cas, désolé pour ceux qui auraient vu le mauvais billet apparaître dans leur flux. Comme il n'avait pas de date, je ne sais pas trop comment les lecteurs de flux l'auront traité. --- Une réaction? Envoyez votre commentaire par mail: => prx@si3t.ch?subject=atom.awk-corrige Ou rejoignez le salon XMPP: => fremen@chat.si3t.ch ~*´¨¨) ⹁.•´¸.•*´¨) ¸.•*¨) (¸.•´ (¸.• ;⹁.~!prx