10 Αρχές για τα ανοικτά δεδομένα. Που βρισκόμαστε;

Το Sunlight Foundation πρόσφατα δημοσίευσε δέκα βασικές αρχές σχετικά με το πώς οι κυβερνήσεις μπορούν να ανοίξουν τα ηλεκτρονικά αποθηκευμένα δεδομένα τους για δημόσια χρήση. Το αρχικό άρθρο (στα Αγγλικά) είναι διαθέσιμο εδώ. Στη συνέχεια παραθέτουμε τη μετάφραση των βασικών αρχών, καθώς και μία πρώτη αξιολόγηση της συμμόρφωσης του geodata.gov.gr με τις βασικές αρχές, η οποία θα ανανεώνεται περιοδικά.

 

Οι 10 βασικές αρχές

1. Πληρότητα

Τα σύνολα δεδομένων που δημοσιεύονται από την κυβέρνηση πρέπει να είναι όσο το δυνατόν πλήρη, αντικατοπτρίζοντας την πληρότητα της καταγεγραμμένης πληροφορίας για ένα συγκεκριμένο θέμα. Όλη η πρωτογενής πληροφορία για ένα σύνολο δεδομένων πρέπει να είναι διαθέσιμη στο κοινό, με την εξαίρεση θεμάτων που αφορούν στην προστασία προσωπικών δεδομένων. Μεταδεδομένα που ορίζουν και εξηγούν τα πρωτογενή δεδομένα πρέπει να περιλαμβάνονται, μαζί με μαθηματικούς τύπους και εξηγήσεις σχετικά με το πώς τα παραγόμενα δεδομένα έχουν υπολογιστεί. Με τον τρόπο αυτό οι χρήστες θα μπορούν να κατανοήσουν το εύρος της διαθέσιμης πληροφορίας και να εξετάσουν τα διαθέσιμα δεδομένα στο μέγιστο δυνατό βαθμό λεπτομέρειας.

2. Πρωτότυπα

Τα δεδομένα που δημοσιεύονται από την κυβέρνηση πρέπει να είναι κυρίως πρωτογενή δεδομένα. Στην έννοια αυτή, περιλαμβάνεται η πρωτογενή πληροφορία που συλλέχθηκε από την κυβέρνηση, λεπτομέρειες σχετικά με το πώς τα δεδομένα έχουν συλλεχθεί, καθώς και τα πρωτότυπα κείμενα που καταγράφουν τη συλλογή των δεδομένων. Η δημόσια διάχυσή τους θα επιτρέψει στους χρήστες να επιβεβαιώσουν πως η πληροφορία συλλέχθηκε και καταγράφηκε ορθά.

3. Αμεσότητα

Τα δεδομένα που δημοσιεύονται από την κυβέρνηση πρέπει να είναι διαθέσιμα στο κοινό όσο το δυνατόν πιο σύντομα. Όποτε είναι δυνατό, η πληροφορία που συλλέγεται από την κυβέρνηση πρέπει να δημοσιεύεται αμέσως μετά τη συγκέντρωση και συλλογή της. Προτεραιότητα πρέπει να δίνεται σε δεδομένα των οποίων η χρήση είναι χρονικά ευαίσθητη. Ενημερώσεις πληροφορίας σε πραγματικό χρόνο θα μεγιστοποιήσουν την αξία που μπορεί να εξάγει το κοινό από την πληροφορία.

4. Ευκολία στη φυσική και ηλεκτρονική πρόσβαση

Τα δεδομένα που δημοσιεύονται από την κυβέρνηση πρέπει να είναι όσο το δυνατόν περισσότερο προσβάσιμα, με την προσβασιμότητά τους να ορίζεται ως την ευκολία με την οποία η πληροφορία μπορεί να παρθεί, είτε με φυσικά, είτε με ηλεκτρονικά μέσα. Οι φραγμοί στη φυσική πρόσβαση περιλαμβάνουν απαιτήσεις για επίσκεψη σε ένα συγκεκριμένο γραφείο ή άτομο, συμμόρφωση με συγκεκριμένες διαδικασίες (π.χ. συμπλήρωση φορμών). Οι φραγμοί στην αυτοματοποιημένη ηλεκτρονική πρόσβαση περιλαμβάνουν τη διάθεση των δεδομένων μέσω της συμπλήρωσης φορμών ή συστήματα που απαιτούν ειδικές τεχνολογίες για τους διαφυλλιστές (π.χ. Flash, JavaScript, cookies, Java applets). Σε αντίθεση, προσφέροντας μια διεπαφή για τη μεταφόρτωση όλων των πληροφοριών που είναι αποθηκευμένες σε μια βάση συνολικά («μαζική» πρόσβαση) και τα μέσα για την εκτέλεση συγκεκριμένων αιτήσεων για δεδομένα μέσω μιας προγραμματιστικής διεπαφής (API), καθιστούν τα δεδομένα περισσότερο προσβάσιμα (μια πτυχή αυτού του θέματος είναι «αναζητησιμότητα», δηλαδή η δυνατότητα εύκολου εντοπισμού και μεταφόρτωσης περιεχομένου).

5. Αναγνωσιμότητα από μηχανές

Οι μηχανές μπορούν να χειριστούν ορισμένα είδη εισόδου καλύτερα από άλλα. Για παράδειγμα, χειρόγραφες σημειώσεις σε ένα χαρτί είναι πολύ δύσκολο να επεξεργαστούν από μία μηχανή. Η ψηφιοποίηση κειμένου μέσω λογισμικού OCR (οπτικής αναγνώρισης χαρακτήρων) οδηγεί σε πολλά σφάλματα ταυτοποίησης και μορφοποίησης. Για παράδειγμα, πληροφορία που μοιράζεται στον ευρέως διαδεδομένο μορφότυπο PDF, είναι πολύ δύσκολο να αναλυθεί από μηχανές. Συνεπώς, η πληροφορία πρέπει να είναι αποθηκευμένη σε ευρέως χρησιμοποιούμενους μορφότυπους δεδομένων που είναι εύκολο να επεξεργαστούν από μηχανές. (Όταν άλλοι παράγοντες καθιστούν υποχρεωτική τη χρήση δύσκολων στην ανάλυση μορφότυπων, τα δεδομένα πρέπει να είναι επίσης διαθέσιμα και σε φιλικά προς μηχανές μορφότυπους). Τα εν λόγω αρχεία πρέπει να συνοδεύονται από τεκμηρίωση σχετικά με το μορφότυπο τους και πως αυτός μπορεί να χρησιμοποιηθεί σε σχέση με τα δεδομένα.

6. Όχι διακρίσεις

Η έννοια της «όχι-διάκρισης» αναφέρεται στο ποιοι μπορεί να έχουν πρόσβαση στα δεδομένα και πως αυτοί πρέπει να πράξουν ώστε να έχουν πρόσβαση στα δεδομένα. Φραγμοί στη χρήση των δεδομένων μπορούν να περιλαμβάνουν απαιτήσεις εγγραφής, ή τη χρήση «φραγμένων κήπων» (walled gardens) όπου μόνο συγκεκριμένες εφαρμογές μπορούν να έχουν πρόσβαση στα δεδομένα. Γενικότερα, η πρόσβαση στα δεδομένα χωρίς διακρίσεις σημαίνει πως κάθε άτομο μπορεί να έχει πρόσβαση στα δεδομένα, σε κάθε χρονική στιγμή, χωρίς να οφείλει να ταυτοποιηθεί ή να αιτιολογήσει το σκοπό πρόσβασης.

7. Χρήση ανοικτών προτύπων

Η έννοια «ανοικτό» πρότυπο αναφέρεται στην ιδιοκτησία του μορφότυπου με τον οποίο είναι αποθηκευμένα τα δεδομένα. Για παράδειγμα, αν μόνο μία εταιρεία κατασκευάζει ένα λογισμικό που μπορεί να αναγνώσει το αρχείο στο οποίο είναι αποθηκευμένα τα δεδομένα, η πρόσβαση στην πληροφορία εξαρτάται από τη χρήση του λογισμικού που κατασκευάζει αυτή η μοναδική εταιρεία. Μερικές φορές το πρόγραμμα αυτό δεν είναι καν διαθέσιμο στο κοινό, ή μπορεί να είναι διαθέσιμο, αλλά να απαιτείται η αγορά του. Για παράδειγμα, το Microsoft Excel είναι ένα ευρέως διαδεδομένο πρόγραμμα επεξεργασίας λογιστικών φύλλων που προϋποθέτει την αγορά του προκειμένου να χρησιμοποιηθεί. Ελεύθερα διαθέσιμοι εναλλακτικοί μορφότυποι συχνά υπάρχουν, ώστε τα αποθηκευμένα δεδομένα να είναι προσβάσιμα χωρίς να υπάρχει απαίτηση για την αγορά άδειας χρήσης λογισμικού. Αφαιρώντας αυτό το κόστος, κάνουμε τα δεδομένα διαθέσιμα σε ένα μεγαλύτερο πλήθος δυνητικών χρηστών.

8. Αδειοδότηση

Η επιβολή «Όρων Χρήσης», απαιτήσεων απόδοσης, περιορισμών στη διάχυση, κτλ, λειτουργούν ως εμπόδια στη δημόσια χρήση των δεδομένων. Το μέγιστο άνοιγμα των δεδομένων περιλαμβάνει την ξεκάθαρη σήμανση της δημόσιας πληροφορίας ως έργου της κυβέρνησης και της διάθεσης της χωρίς περιορισμούς σε δημόσιο καθεστώς.

9. Διαχρονικότητα

Η δυνατότητα εύρεσης πληροφορίας στο πέρασμα του χρόνου αναφέρεται ως διαχρονικότητα. Η πληροφορία που δημοσιεύεται από την κυβέρνηση στο διαδίκτυο πρέπει να είναι σταθερής αναφοράς, δηλαδή πρέπει να είναι διαθέσιμη στο διηνεκές. Πολύ συχνά, η πληροφορία ενημερώνεται, αλλάζει ή διαγράφεται, χωρίς καμία ένδειξη για την τέλεση αυτής της μεταβολής. Σε άλλες περιπτώσεις, είναι διαθέσιμη ως ρεύμα δεδομένων (stream of data) αλλά δεν αρχειοθετείται. Με σκοπό την καλύτερη χρήση από το κοινό, η πληροφορία που δημοσιεύεται στο διαδίκτυο πρέπει να παραμένει δημοσιευμένη στο διαδίκτυο, με κατάλληλες διατάξεις τήρησης των διαφορετικών της εκδόσεων και αρχειοθέτησής της.

10. Κόστος χρήσης

Ένας από τους μεγαλύτερους φραγμούς στη δημοσίευση δημόσιων δεδομένων είναι το κόστος που επιβάλλεται στο κοινό για την πρόσβαση, ακόμη και αν αυτό είναι το ελάχιστο δυνατό (de minimus). Οι κυβερνήσεις χρησιμοποιούν ένα σύνολο επιχειρημάτων για τη χρέωση του κοινού με σκοπό την πρόσβαση στα έγγραφά τους: το κόστος δημιουργίας της πληροφορίας, η απόσβεση της επένδυσης, το κόστος ανάκτησης της πληροφορίας, τέλος ανά σελίδα ή ανά ερώτημα, κόστος επεξεργασίας, κτλ.

Η πλειοψηφία της κυβερνητικής πληροφορίας συλλέγεται για κυβερνητικούς σκοπούς, οπότε η ύπαρξη αυτών των τελών έχει ελάχιστη έως μηδενική επίδραση στο αν τελικά η κυβέρνηση θα παρήγαγε εξαρχής την πληροφορία. Η επιβολή τελών για την πρόσβαση αλλοιώνει τη σύνθεση του κοινού που επιθυμεί (ή μπορεί) να έχει πρόσβαση στην πληροφορία. Επιπλέον, μπορεί να αποκλείει μετασχηματισμένες χρήσεις των δεδομένων που στη συνέχεια οδηγούν σε επιχειρηματική άνθηση και άρα φορολογικά έσοδα.

 

H βαθμολογία του geodata.gov.gr

1. Πληρότητα: 6/10

Δημοσιεύουμε ό,τι πληροφορία υπάρχει διαθέσιμη στη Δημόσια Διοίκηση. Δυστυχώς όμως η αναλυτική καταγραφή της προέλευσης και επεξεργασίας των δεδομένων με σκοπό την παραγωγή της πληροφορίας είναι σε ελάχιστες περιπτώσεις καταγεγραμμένη.

2. Πρωτότυπα: 4/10

Πάλι, αντιμετωπίζουμε το πρόβλημα της απουσίας καταγραφής για την παραγωγή της πληροφορίας. Επιπλέον, αρκετά από τα πρωτογενή δεδομένα δεν είναι διαθέσιμα ακόμη από τις δημόσιες αρχές που τα παράγουν. Ο νόμος για την «Εθνική Υποδομή Γεωχωρικών Πληροφοριών» λύνει και τα δύο προβλήματα, οπότε ελπίζουμε σε 12 μήνες από τώρα η κατάσταση να έχει αλλάξει δραματικά προς το καλύτερο.

3.Αμεσότητα: 0/10

Η ευρύτερη Δημόσια Διοίκηση είναι ακόμη σε πολύ πρώιμο στάδιο ώστε να ενσωματώσει στις πάγιες διαδικασίες της τις διαδικασίες για την άμεση δημοσίευση των δεδομένων της. Υπάρχει περιθώριο μεγάλης βελτίωσης, ειδικά με την ανάπτυξη της Εθνικής Υποδομής Γεωχωρικών Πληροφοριών (ΕΥΓΕΠ) από τον ΟΚΧΕ.

4. Ευκολία στη φυσική και ηλεκτρονική πρόσβαση: 5/10

Τα δεδομένα του geodata.gov.gr προσφέρονται χωρίς την ανάγκη εγγραφής ή τη συμπλήρωση οποιαδήποτε αίτησης. Επίσης, διατίθενται μέσω Web Map Service. Θα βελτιωθούμε σημαντικά σε αυτό το κριτήριο, προσφέροντας ένα απλό API για την επερώτηση των δεδομένων.

5. Αναγνωσιμότητα από μηχανές: 8/10

Όλα τα δεδομένα του geodata.gov.gr προσφέρονται τόσο σε ανοικτά πρότυπα, όσο και σε de facto, κλειστά πρότυπα. Με τον τρόπο αυτό εξασφαλίζουμε τόσο την ανεξαρτησία από κατασκευαστές κλειστού λογισμικού, αλλά και τη διευκόλυνση των χρηστών που έχουν συνηθίσει να χρησιμοποιούν συγκεκριμένες κλειστές εφαρμογές καθημερινά στη δουλειά τους.

6. Όχι διακρίσεις: 8/10

Όλα τα δεδομένα του geodata.gov.gr (με την εξαίρεση των υποβάθρων των χαρτών) προσφέρονται με άδεια Creative Commons Αναφορά Προέλευσης – Παρόμοια Διανομή 3.0 χωρίς καμία απαίτηση εγγραφής, καθώς και σε ανοικτά πρότυπα που δεν απαιτούν ειδικές εφαρμογές για την ανάγνωση/επεξεργασία των δεδομένων.

7. Χρήση ανοικτών προτύπων: 8/10

Όλα τα δεδομένα του geodata.gov.gr προσφέρονται τόσο σε ανοικτά πρότυπα, όσο και σε de facto, κλειστά πρότυπα. Με τον τρόπο αυτό εξασφαλίζουμε τόσο την ανεξαρτησία από κατασκευαστές κλειστού λογισμικού, αλλά και τη διευκόλυνση των χρηστών που έχουν συνηθίσει να χρησιμοποιούν συγκεκριμένες κλειστές εφαρμογές καθημερινά στη δουλειά τους.

8. Αδειοδότηση: 5/10

Προς το παρόν οι περιορισμοί στη χρήση των δεδομένων του geodata.gov.gr συνοδεύονται με δύο περιορισμούς: πρέπει να γίνεται αναφορά προέλευσης και οποιαδήποτε τροποποίηση των δεδομένων πρέπει να συνοδεύεται από παρόμοια άδεια. Η διάθεση όλων των δεδομένων σε δημόσιο καθεστώς (public domain) αποτελεί θεσμικό θέμα και θα συζητηθεί στο πλαίσιο της εφαρμογής του νόμου για την «Εθνική Υποδομή Γεωχωρικών Πληροφοριών».

9. Διαχρονικότητα: 2/10

Τα δεδομένα που δημοσιεύονται στο geodata.gov.gr είναι σταθερής αναφοράς, όμως ακόμη δεν έχουμε εξασφαλίσει τη διαχρονική τους ενημέρωση από τον ευρύτερο δημόσιο τομέα. Επίσης, η αρχειοθέτηση και σταθερή αναφορά όλων των διαφορετικών εκδόσεων ενός αρχείου απαιτεί αλλαγές στον τρόπο λειτουργίας της Δημόσιας Διοίκησης. Έχουμε ακόμη πολλά περιθώρια βελτίωσης.

10. Κόστος χρήσης: 9/10

Τα δεδομένα του geodata.gov.gr διατίθενται χωρίς τέλη. Εξαίρεση αποτελούν τα υπόβαθρα της χώρας.

 

Συνολική Βαθμολογία: 5,5/10