Travaux pratiques en Python
Révision en cours... (hiver 2025).
Contexte à expliquer. Console interactive de python / help(). Thonny / assistant.
Ajouter des liens vers le cours.
Prise en main de Python
Exercice 1 : Les basiques de Python 3
À reprendre.
- variables et print - if else - while et for ··· comptages ··· dessin figures ··· procédures
Dans cette séance, on s'approprie l'environnement : l'éditeur de texte où l'on tape les programmes, l'enregistrement des programmes, l'appel à l'interprète Python dans le terminal.
Affichages
- Tester l'instruction d'affichage print de Python : afficher un nombre, une chaîne de caractères, une variable.
- Comment peut-on passer ou ne pas passer à la ligne ?
Boucles
- Écrire une boucle while qui compte jusqu'à 100. Idem avec une boucle for.
- À l'aide de boucles imbriquées, dessiner des figures géométriques : triangles et carrés, creux ou non. Idem à l'aide de procédures et de leurs paramètres.
Listes
(voir détails dans le cours Python)
- Créer une liste vide. Créer une liste contenant des éléments.
- Afficher la longueur de cette liste.
- Remplacer l'une des valeurs, enlever une case et en ajouter une autre, puis afficher à nouveau la liste.
- Utiliser une boucle pour parcourir les éléments de la liste et les afficher un par un. Passer en revue les différentes syntaxes possibles.
Aléatoire en Python
- Tester les fonctions de la librairie random suivantes : (voir détails dans le cours Python) random.randint, random.randrange, random.choice, random.shuffle.
Exercice 2 : tableaux de nombres
- Définir en Python un tableau d'entiers.
Écrire (et valider sur le tableau déjà défini) les fonctions qui :
- calcule la moyenne des nombres contenus dans un tableau donné,
- compte le nombre d'occurrences d'un élément,
- compte combien d'éléments sont supérieurs ou égaux à 10,
- recherche la valeur maximale du tableau,
- teste si un élément est présent ou non,
- etc.
Nous nous intéressons maintenant à des tableaux beaucoup plus grands. Tout d'abord nous voulons créer de tels tableaux remplis de manière aléatoire, à l'aide du module random.
Écrire les fonctions qui, pour une taille donnée n :
- fournit un tableau de n entiers aléatoires,
- construit le tableau des n premiers entiers mélangés aléatoirement.
Enfin, nous utilisons le module time (voir détails dans le cours Python) pour mesurer le temps nécessaire à l'exécution d'un bloc d'instructions.
- Sur des grands tableaux, mesurer le temps nécessaire à chacune des fonctions calculant la moyenne et recherchant un élément.
Chaînes de caractères
Premier exercice sur les chaînes de caractères
Algo parcours de chaînes, comptage de lettres.
Manipulation de dictionnaires Python
Exercice 3 : tableaux d'enregistrements, les étudiants
- Créer une promotion comme un tableau d'étudiants,
- implémenter la fonction moyenne d'un étudiant dédiée cette représentation,
- pour chaque discipline, la fonction moyenne de la promotion,
- la fonction qui trouve l'étudiant ayant eu la note moyenne maximale,
- etc.
- (à la maison) Généraliser à un type d'étudiant qui possède un nombre quelconque de notes.
Documents XML en Python
Exercice générique
- Écrire un parser qui affiche tous les événements déclenchés (début et fin de document, début et fin d'élément, feuilles textes).
- Écrire un parser qui compte le nombre de balises ouvrantes dans le document XML.
- Écrire un parser qui compte le nombre d'occurrences de chaque balise.
- Écrire un parser qui regroupe les feuilles textes non séparées par des balises.
Squelette XML indenté
Fournir un programme Python basé sur SAX qui présente les balises d'un fichier XML quelconque de manière arborescente, c'est-à-dire :
- un nom d'élément par ligne ;
- une indentation proportionnelle à la profondeur du noeud dans l'arbre.
Le championnat : calcul de statistiques et production XHTML
Écrire un programme Python qui utilise SAX pour lire un fichier de type Foot. Celui-ci devra produire les mêmes sorties que la feuille XSLT écrite précédemment et, en plus, des statistiques par équipe (nombre de matches joués, de victoires, de points, différence de buts, etc.). Étape par étape :
- sortie HTML des matches ;
- calcul et affichage de statistiques ;
- produire un sommaire de la page et le placer en fin de document ;
- faire apparaître ce sommaire en tête de page.
Films et acteurs
Écrire un programme Python pour chacun de ses formats en vue de produire des versions XHTML de ces documents :
- faire apparaître le contenu ;
- un sommaire ;
- les références résolues.
TODO list
Il s'agit d'écrire un programme Python basé sur l'API SAX et produisant une sortie HTML, bien formé et contenant un maximum d'informations de la todolist (idéalement toutes !), par exemple :
- un titre dans l'en-tête et un titre dans le corps qui reprennent le nom du propriétaire de la liste ;
- l'image associée à chaque todo ;
- le titre de chaque todo à l'aide d'un élément HTML adéquat ;
- également sa date limite ;
- ensuite, les paragraphes des commentaires ;
- puis, les items rassemblés sous la forme d'une liste HTML, les items critiques étant distingués des autres ;
- les liens (qui doivent être cliquables), les dates et les mots importants contenus dans les parties textuelles.
Extraction de méta-données
Écrire un script Python qui à partir d'un fichier SVG (comme tux ou argentina) fournit les informations suivante :
- le nom de l'auteur du dessin ;
- le titre du dessin ;
- la liste des mots clés qui lui est associée ;
- le nombre de rectangle utilisés (élément rect) ;
- la taille de ces rectangles (attributs height et width).
Sortie attendue :
-- le nom de l'auteur -- L'auteur est Rory McCann ! -- le titre du dessin -- Baby Tux -- les mots clefs -- baby linux bird penguin mascot tux animal computer cute -- les rectangles -- il y en a 4 : . 42.034428 x 39.407280 . 42.034428 x 39.407280 . 61.150040 x 211.13000 . 57.995739 x 207.72755
Fonctions utiles
À la suite de l'exercice précédent, il semble opportun de disposer des fonctions Python suivantes :
- getAttributeValue(n,a) : fournit la valeur de l'attribut nommé a et associé au noeud élément n ;
- getChildElementsByTagName(n,tag) : fournit la liste des éléments fils du noeud n et nommés tag ;
- getTextContent(n) : fournit le contenu textuel associé au noeud élément n ;
- resolveElementsPath(dom,path) : path étant une liste de noms d'éléments (e1,e2,...en), cette fonction fournit les noeuds vérifiant la requête XPath //e1/e2/.../n dans la représentation dom.
Programmer ces fonctions et les utiliser pour reprendre l'exercice précédent.
Le championnat : calcul de statistiques et production XHTML
Écrire un programme Python qui utilise DOM pour lire un fichier de type Foot et produire :
- calcul de statistiques sur le championnat (nombre de journées, de matches, taux de victoires à domicile, etc.) ;
- produire une version XHTML des matches et des résultats ;
- produire pour cette page un sommaire apparaissant en tête de document.
Caractéristiques de l'arbre DOM
- Écrire un parser qui compte le nombre de balises ouvrantes dans un document XML quelconque ;
- écrire un parser qui compte le nombre d'occurrences de chaque balise ;
- proposer et tester une fonction qui renvoie la liste des noeuds feuilles d'un arbre DOM ;
- proposer et tester une fonction qui calcule la hauteur d'un arbre DOM.
Caractéristiques d'un noeud
Écrire et tester les fonctions qui réalisent les tâches suivantes :
- déterminer si un noeud est la racine de l'arbre DOM ou pas ;
- renvoyer la liste des ancêtres d'un noeud (du noeud vers la racine, puis vice-versa) ;
- renvoyer la liste des noeud frères gauches d'un noeud donné.
Parcours d'arbres
Afficher les noeuds d'un document XML suivant les différents parcours possibles d'un arbre. En particulier, vous testerez votre programme sur un document XML représentant une expression arithmétique, comme par exemple :
<expression op="+"> <value x="5" /> <expression op="*"> <value x="7" /> <value x="6" /> </expression> </expression>
Compter des noeuds
Écrire en Python et à l'aide de DOM une fonction qui compte dans un document XML quelconque le nombre de fois où un attribut donné apparaît avec une valeur particulière. Un appel à cette fonction pourrait ressembler à :
xmlfilename = sys.argv[1] dom = parse(xmlfilename) n = CountAttributeValue(dom,'lang','fr') print n
Modifier l'arbre DOM
Reprendre le document Foot :
- le charger dans une structure DOM ;
- créer une structure DOM vide ;
- y placer toutes les informations du fichier d'origine mais organisées par équipe et non plus par journée ;
- produire un nouveau fichier XML à partir de ce DOM.
Algorithmique avancée et structures de données en Python
Exercice 4 : tableaux d'enregistrements, les restaurants
Préliminaires
-
Récupérer le dossier tp-restos.
Une liste de restaurants vous est fournie et, pour chaque restaurant, vous pouvez accéder à son nom, son adresse (à travers num et rue), sa localisation exprimée cette fois en latitude et longitude (lat et lon), sa position dans le classement (pos), sa note et le nombre d'avis qui ont été émis sur ce restaurant (votes).
Ci-dessous les premières lignes du fichier exercices.py qui montrent la récupération des restaurants, l'accès au classement et au nom d'un restaurant, et enfin une boucle sur la liste des restaurants.Votre travail consiste à poursuivre l'écriture de ce fichier, sans en modifier la première ligne.from restos import liste_restos # affichage des informations sur un restaurant, à compléter def affiche_resto (resto): print('[',resto.get('pos'),']',end=' ') print(resto.get('nom')) print() # boucle sur tous les restaurants, pour affichage for resto in liste_restos: affiche_resto(resto)
- Compléter l'affichage d'un restaurant. Appliquer à tous les restaurants de la liste.
Notes et avis
- Afficher le nombre de restaurants disponibles.
- Calculer combien d'avis ont été donnés au total. Combien d'avis a reçus un restaurant en moyenne ?
- Afficher la moyenne des notes, ainsi que l'écart-type.
- Afficher le nombre de restaurants ayant une note de 4,5 ou plus.
Localisation/identification des restaurants
- Calculer la moyenne des latitudes et des longitudes. À quel endroit correspondent ces
coordonnées (utiliser par exemple ce site
ou directement Google Maps
pour visualiser sur une carte la localisation calculée) ?
Idem avec uniquement les restaurants ayant reçu plus de 50 avis. - Indiquer si oui ou non il y a un restaurant dans la rue alphonse mercier. Idem avec la rue du port.
- Afficher la description du restaurant classé à la première position. Idem avec le restaurant placé à la dernière position.
- Afficher toutes les informations disponibles sur le restaurant la ducasse. Idem pour le restaurant qui se trouve au 14 rue des postes.
- Produire la liste des restaurants se trouvant rue du molinel.
- Identifier le restaurant ayant reçu le plus d'avis.
Coup d'œil en arrière
La liste_restos jusque là utilisée correspond à la dernière année disponible. Le code python ci-dessous vous permet d'accéder aux informations sur les restaurants pour les années précédentes.
# récupération des archives from restos import archives # constitution de la liste des restaurants 2018 liste_restos_2018 = archives["2018"]
- Reprendre les mêmes questions pour l'année précédente. Si ce n'est déjà fait, c'est le bon moment pour utiliser procédures et fonctions.
-
Quels sont les restaurants qui sont apparus lors de la dernière année ?
Des restaurants se trouvaient-ils à la même adresse ?
Quels restaurants ont disparu ? -
Identifier le restaurant qui a le plus progressé dans le classement.
Identifier le restaurant qui a chuté le plus durement. - Montrer l'évolution d'un restaurant donné au fil des années.
Adresses et rues
- Détecter les adresses partagées par plusieurs restaurants.
- Identifier la ou les rue(s) ayant le plus de restaurants.
- Trouver la meilleure rue pour les restaurants (la rue avec la meilleure moyenne de notes, ou les rues où chaque restaurant a une note strictement supérieure à 4, etc.).
- Idem avec la rue à ne pas fréquenter pour ses restaurants.
Il est possible de reprendre les deux dernières questions en jugeant une rue, non plus sur la moyenne des notes de ses restaurants, mais sur leur classement moyen.
Plus encore...
- Afficher les restaurants par ordre de classement.
- Reprendre les questions impliquant des calculs de moyennes et calculer cette fois des médianes.
- Produire une cartographie des restaurants lillois. Par exemple, une telle cartographie des restaurants est jugée satisfaisante.
Exercice 5 : Algorithmes avancés sur les tableaux
Sur les tableaux quelconques
- Implémenter une fonction index_minimum(t,d,f) qui renvoie le numéro de la case contenant la plus petite valeur du tableau t entre les cases d et f.
- Programmer un tri à bulles.
Sur les tableaux déjà triés
On suppose disposer d'un tableau de nombres rangés par ordre croissant.
- Implémenter une fonction de recherche d'un élément utilisant une boucle tant que et tirant parti du fait que les éléments sont ordonnés.
- Écrire une fonction de recherche dichotomique.
- Proposer une procédure insertion(e,t,n) qui ajoute un élément e à sa place dans un tableau t de taille n.
Autres méthodes de tri
- tri_extraction utilisant index_minimum(t,d,f) : on récupère le minimum du tableau et on le place dans la première case, on récupère le minimum du tableau privé de la première case et on le place dans la deuxième, etc.
- tri_insertion utilisant insertion(e,t,n) : prendre le ième élément et le mettre à sa place dans les i-1 premières cases déjà triées.
Exercice 6 : Comparaison expérimentale des méthodes de tri
Préliminaires
On veut dans cette séance comparer les méthodes de tri (comme le tri à bulles par exemple) en terme de temps de calcul et en fonction de la taille et de la nature des tableaux à trier.
De nouveaux points techniques sont nécessaires, essentiellement : savoir produire des fichiers texte en Python (voir détails dans le cours Python) et connaître les bases de gnuplot.
gnuplot est un outil qui permet de tracer des courbes à partir de données brutes. Par exemple, l'instruction :
$ gnuplot gnuplot> plot 'stats.dat' with lines
permet de tracer les points qui se trouvent dans le fichier stats.dat sous la forme suivante (un point par ligne, valeur en abscisse, une tabulation, valeur en ordonnée) :
100 2 200 14 300 26 400 48 500 72 600 111 700 142 800 194 900 238 1000 298
C'est ce type de fichier que l'on veut faire produire par Python (la première colonne pourrait correspondre aux tailles des tableaux considérés, la seconde aux temps de traitement nécessaires).
Fonctions à implémenter
- Écrire une fonction copie (t) qui renvoie un nouveau tableau contenant dans le même ordre les mêmes valeurs que le tableau t ; vérifier qu'une modification de la copie n'altère pas le tableau original.
- Proposer une fonction inverse (t) qui fournit un nouveau tableau contenant les mêmes valeurs que le tableau t mais dans l'ordre inverse.
-
Implémenter des fonctions pour produire des tableaux :
- une fonction tableau_premiers_entiers (n) qui produit un tableau contenant dans l'ordre tous les entiers de 1 à n,
- une fonction tableau_premiers_entiers_melanges (n) qui propose ces mêmes entiers mélangés aléaoirement,
- une fonction tableau_premiers_entiers_inverses (n) qui propose ces mêmes entiers du plus grand au plus petit.
- Proposer une procédure ligne_dans_fichier (f,n,t) dont le rôle est d'écrire dans le fichier f la valeur (numérique) de n, une tabulation, la valeur (numérique) de t et enfin un passage à la ligne.
- Écrire une fonction temps_tri_bulles (t) qui fait une copie du tableau t et renvoie le temps nécessaire au tri à bulles pour classer cette copie.
- Coder la procédure stats_melange (nmin,nmax,pas,fois) qui pour chaque taille de tableau comprise entre nmin et nmax en avançant de pas en pas produit fois tableaux mélangés aléatoirement et écrit dans un fichier le temps moyen nécessaire au tri à bulles pour classer ces tableaux.
- Même question avec la fonction stats_ordonne (nmin,nmax,pas,fois) pour des tableaux déjà ordonnés.
- Même question avec la fonction stats_inverse (nmin,nmax,pas,fois) pour des tableaux déjà ordonnés mais en ordre inverse.
- Produire à l'aide de votre code des fichiers de statistiques pour des tailles de tableau variant de 100 en 100, entre 100 et 1000, avec 5 répétitions pour chaque taille de tableau. Visualiser ces données avec gnuplot et comparer l'évolution du temps nécessaire au tri bulles selon le type de tableaux et selon leurs tailles.
- Généraliser votre code pour pouvoir également comparer les méthodes de tri entre elles : tri à bulles, tri insertion, tri extraction et tri rapide.
- Tester des modifications des méthodes de tri, calculer les écarts-types des temps de calcul sur les tableaux mélangés, explorer les possibilités de gnuplot, expliquer théoriquement les courbes obtenues.
Au final, on doit obtenir des images comme celles-ci :
Exercice 7 : Conjecture de Syracuse
Explications
Ce problème est apparu pour la première fois dans les années 30. Puis, à nouveau, à l'université de Syracuse (New York) dans les années 50. Aucune solution n'étant trouvée, le problème s'est propagé aux autres universités américaines. Dans le contexte de la guerre froide, on évoque (comme une plaisanterie ?) une manœuvre russe pour paralyser la recherche américaine.
L'énoncé de ce problème est le suivant. On part d'un entier n auquel on fait subir une transformation :
- si n est pair, on le divise par deux ;
- si n est impair, on le multiplie par 3, et ajoute 1.
Puis, on recommence sur le résultat. Par exemple, en partant de n=10, on obtient :
Conjecture : quel que soit l'entier n, on finit par retomber sur 1.
Implémentations Python
-
Définir la carte d'identité d'un entier comme l'enregistrement de :
- cet entier,
- sa trajectoire (les entiers rencontrés jusqu'à 1),
- sa durée de vol (le nombre d'entiers rencontrés avant de trouver 1),
- son altitude maximale (le plus grand entier rencontré).
- Proposer une procédure qui affiche une telle carte.
- Écrire une fonction qui permet de tester la conjecture pour un entier donné et qui renvoie sa carte d'identité renseignée.
- Écrire ensuite une fonction qui teste tous les entiers dans un intervalle donné et renvoie toutes les cartes d'identité de ces entiers.
- Utiliser cette fonction pour afficher les cartes présentant une durée de vol strictement supérieure à 100.
- Implémenter un tri à bulles pour classer des cartes par altitude décroissante.
Exercice 8 : Chiffrement et décryptage
Préliminaires
Dans cette séance, on s'intéresse au chiffrement de textes par substitution, à leur déchiffrement, et enfin au moyen de casser un tel cryptage. Un chiffrement par substitution consiste simplement à remplacer systématiquement une lettre par une autre.
Certains chiffrements par substitution sont dits par décalage ou appelés chiffre de César : dans ces cas, une lettre et sa remplaçante sont toujours séparées dans l'alphabet par le même nombre de lettres. Un chiffrement par décalage répandu sur le web se nomme ROT13 : une lettre et sa remplaçante sont à une distance de 13 dans l'alphabet (le a est remplacé par le n, le b par le o, etc.).
Par souci de simplicité, on ne considère que des textes en minuscules, sans accent et sans symbole de ponctuation. Seul l'espace est utilisé entre les mots mais n'est pas remplacé par le chiffrement.
Cette séance va nécessiter de traiter des chaînes de caractères qu'il peut être commode de voir comme des listes de caractères, ce que permet Python.
Concernant les caractères eux-mêmes, on rappelle qu'il est possible de repérer un caractère par un numéro (son code ASCII).
Nous aurons également besoin de stocker les correspondances entre lettres, ce qui peut être fait à l'aide de dictionnaires Python (que nous avions déjà utilisés pour coder des enregistrements).
Enfin, pour décrypter un texte sans connaître la règle de chiffrement, il est courant d'utiliser la fréquence d'apparition des lettres dans la langue choisie. On considérera qu'en français les lettres se rangent comme suit, de la plus fréquente à la moins fréquente :
e a i t s n l u r o d m c p v q h f b g j x y w z k
Fonctions à implémenter
On va d'abord réaliser et tester quelques fonctions pour gérer les dictionnaires, chiffrer et déchiffrer des textes.
- chiffrement_lettre (l,d) renvoie la correspondance de la lettre l dans le dictionnaire d si cette correspondance existe, renvoie la lettre l elle-même sinon.
- chiffrement_phrase (p,d) construit une nouvelle chaîne de caractères correspondant au chiffrement caractère par caractère de la phrase p à l'aide du dictionnaire d. Définir un dictionnaire et tester ces fonctions en codant une phrase quelconque.
- inverse_dico (d) renvoie un nouveau dictionnaire qui inverse les clefs et les valeurs du dictionnaire d. Tester en déchiffrant la phrase précédemment codée.
- dico_rot_13 () construit un dictionnaire correspondant au chiffrement en ROT13. Tester à nouveau pour chiffrer une phrase quelconque. Quelles solutions sont possibles pour le déchiffrement ?
On veut maintenant déchiffer un texte codé par une technique de substitution mais on ne dispose pas du dictionnaire utilisé. L'objectif est de décoder le texte mystère suivant.
Les étapes à réaliser sont les suivantes.
- compte_lettres (p) construit un dictionnaire faisant correspondre chaque lettre apparaissant dans la phrase p à son nombre d'occurrences dans cette même phrase. Tester sur le texte mystère.
- tri_bulles_dico (d) est un tri à bulles modifié pour renvoyer les clefs d'un dictionnaire d, ordonnées par valeurs décroissantes. Tester sur le dictionnaire précédemment calculé par compte_lettres.
- arrays2dict (ks,vs) renvoie un dictionnaire dont les clefs correspondent au tableau ks et qui associe pour chacune de ces clefs la valeur se trouvant à la même position dans le tableau vs. Utiliser cette fonction pour combiner le tableau fourni par tri_bulles_dico et le tableau des lettres de l'alphabet classées par fréquences décroissantes dans la langue française.
- decrypte (pc,ll) doit décrypter la phrase pc à l'aide des lettres de l'alphabet rangées par ordre de fréquence décroissante dans la langue utilisée et disponible dans le tableau ll. Décoder le texte mystère à l'aide de cette fonction.
Implémentations de types abstraits en Python
Exercice 9 : Implémentation du type abstrait « Entier »
- Implémenter le type abstrait « Entier » vu en cours en utilisant... les entiers de Python.
-
Coder les opérations addition et multiplication
sur ce nouveau type.
[ voir la correction ][ récupérer ]
-
Implémenter à nouveau le type abstrait « Entier » vu en cours
cette fois en s'appuyant sur les listes de Python
(une liste de n éléments quelconques représentera l'entier n).
[ voir la correction ][ récupérer ]
- Est-il nécessaire de recoder les opérations addition et multiplication ?
Exercice 10 : Implémentation du type abstrait « Pile »
- Implémenter le type abstrait « Pile » vu en cours.
- Écrire une fonction qui permet d'inverser une pile.
-
Écrire une fonction qui prend en entrée un texte composé
de différentes parenthèses, accolades, crochets, ouvrants ou fermants,
et qui vérifie que l'expression est bien parenthésée.
On pourra par exemple suivre les étapes suivantes :- une fonction qui prend en entrée un caractère et renvoie vrai s'il s'agit d'un symbole ouvrant et faux sinon,
- une fonction qui prend un symbole ouvrant et fournit en retour le caractère fermant correspondant,
- enfin, la fonction de vérification.
- Écrire une fonction qui évalue une
expression polonaise inversée,
composée d'entiers entre 0 et 9 et des quatre opérations élémentaires.
On pourra par exemple suivre les étapes suivantes :- une fonction qui prend en entrée un caractère et renvoie vrai s'il s'agit d'une opération élémentaire et faux sinon,
- une fonction qui prend un symbole-opération et deux entiers et qui renvoie le résultat de l'opération,
- enfin, la fonction d'évaluation.
Exercice 11 : implémentation d'un type produit
- Implémenter en Python (à l'aide de listes ou de dictionnaires)
le type abstrait « Étudiant » vu en cours (on rappelle qu'un étudiant est composé
d'un nom, d'un prénom, d'une année de naissance, d'une note en informatique
et d'une note de mathématiques).
Bien travailler en particulier la procédure dont le rôle est d'afficher un étudiant. - Créer quelques étudiants et tester chacune des fonctions.