Σκοπός
Στην παρούσα εργαστηριακή άσκηση, θα αναλύσουμε δεδομένα επιθεωρήσεων υγειονομικής ασφάλειας τροφίμων από το GOV.UK, τα οποία παρέχονται σε μορφή XML. Στόχος είναι η εξαγωγή, επεξεργασία και ανάλυση των δεδομένων με χρήση κατάλληλων εργαλείων προγραμματισμού και ανάλυσης δεδομένων.
Πηγές Δεδομένων
Τα δεδομένα είναι διαθέσιμα στη διεύθυνση:
🔗 https://ratings.food.gov.uk/open-data
Αυτά περιλαμβάνουν βαθμολογίες και επιθεωρήσεις επιχειρήσεων τροφίμων στο Ηνωμένο Βασίλειο, με πληροφορίες για το όνομα της επιχείρησης, τη διεύθυνση, την ημερομηνία επιθεώρησης, και τη βαθμολογία υγειονομικής ασφάλειας.
Βήματα Υλοποίησης
1. Λήψη και Ανάλυση του XML Αρχείου
• Κατέβασμα του XML αρχείου που περιέχει τα δεδομένα.
• Χρήση Κώδικα για ανάγνωση και ανάλυση της δομής του XML
2. Επεξεργασία Δεδομένων
• Εξαγωγή βασικών πληροφοριών όπως όνομα επιχείρησης, διεύθυνση, βαθμολογία υγιεινής και ημερομηνία επιθεώρησης.
• Καθαρισμός και μετατροπή δεδομένων σε δομή κατάλληλη για ανάλυση (π.χ. DataFrame σε Pandas ή tibble σε R).
3. Οπτικοποίηση και Στατιστική Ανάλυση
• Δημιουργία βασικών γραφημάτων για την παρουσίαση των βαθμολογιών ανά περιοχή.
• Υπολογισμός στατιστικών μέτρων όπως μέσος όρος βαθμολογίας, κατανομή τιμών, και σύγκριση ανά τοποθεσία.
4. Συμπεράσματα και Αναφορές
• Παρουσίαση ευρημάτων σχετικά με την ποιότητα και κατανομή των επιθεωρήσεων υγειονομικής ασφάλειας.
• Αναφορά τυχόν μοτίβων ή παρατυπιών στα δεδομένα.