Category: Données Ouvertes


ZoneCone devient 511 Ouvert… ou quelque chose comme ça

June 14th, 2012 — 2:49pm

Après plusieurs mois de silence et une production finalement assez faible, je fais appel à ce blogue pour ce qui sera probablement son dernier billet. Malgré le peu d’activité sur ZoneCone, les derniers mois ont été mis à contribution pour essayer donner une suite à ZoneCone et il me fait plaisir d’annoncer aujourd’hui, avec un peu de retard, que c’est chose faite: le concept développé pour ZoneCone aura l’occasion d’être pleinement exploité dans les prochains mois.

Petit retour en arrière pour expliquer la genèse de ce projet à venir: lors du développement de ZoneCone, il m’est rapidement apparu qu’il ne serait pas possible d’obtenir une couverture géographique et une qualité de données suffisante pour en faire un service vraiment utile. Les données en jeux dépendent de trop nombreux intervenants, plusieurs ne publient pas ces données et ceux qui le font utilisent des formats trop variés. Enfin, suite aux commentaires des utilisateurs et mes propres expériences, il devenait évidemment qu’une simple application web n’était pas un bon véhicule: il fallait que l’information soit rendue disponible à travers des outils déjà utilisés par les citoyens, à travers des téléphones intelligents et idéalement intégrés à des applications déjà utilisées comme Google Maps.

C’est avec cette vision et le support de James McKinney et de Nord Ouvert que nous avons déposé un projet de standardisation des données d’entraves routières auprès de GéoConnexions, un programme fédéral faisant la promotion des infrastructures de données géospatiales au Canada. Et c’est avec une certaine surprise et surtout beaucoup d’enthousiasme que nous avons appris en avril dernier que notre projet était accepté. Au mois de mai, j’ai donc réalisé le saut: travailler à plein temps avec Nord Ouvert pour développer ce projet.

Le financement obtenu est d’un montant d’environ 175k$, couvre une période de 18 mois et vise le développement de deux éléments intimement liés: Le premier élément est la mise sur pied d’un standard de données et une API dans la même philosophie que Open311 et facilitant l’accès des données d’entraves routières. Ce format sera, assez logiquement, utilisable et “implémentable” par n’importe qui selon une licence ouverte. Le second élément est une application web open source permettant de gérer et de publier des données d’entraves routières. En effet plusieurs instances gouvernementales, notamment municipales, n’ont pas les moyens de développer des outils de publication des données ni d’acquérir des logiciels souvent complexes et couteux. Cette application vise donc à combler l’information manquante, notamment venant des municipalités de moyenne taille.

De manière à rencontrer les attentes des gouvernements, le projet a été bâti avec des collaborateurs pouvant nous soutenir par leurs connaissances des besoins et du milieu. Au niveau gouvernemental, nous allons travailler avec le Ministère des Transports de la Colombie-Britannique ainsi que les villes de Montréal, Ottawa et Repentigny. Au niveau institutionnel, nous comptons sur la collaboration de Nicolas Saunier, professeur assistant spécialisé en transports à l’École Polytechnique de Montréal ainsi que le Living Lab de Montréal et l’Institut International de Logistique de Montréal. À cela s’ajoute la présence de David Eaves pour nous aider à promouvoir le standard et InstantGeo qui va représenter les “consommateurs” potentiels du format standard. Ces collaborateurs ont pour vocation de supporter le processus de design et de développement. Écoutant plusieurs acteurs ayant eu à bâtir de tels formats de données, nous allons conserver ce noyau de collaborateurs pour développer les éléments clés. En effet nos moyens demeurent limités et la coordination des différents acteurs consomme beaucoup de temps. Dans une optique d’ouverture et de communauté chère aux mouvements open source et open data, nous allons mettre en place des moyens nous permettant de partager le fruit de notre travail et prendre en compte les remarques qui émergeraient de la communauté.

Nous travaillons également à contacter d’autres villes et provinces pour prendre connaissance de leur niveau d’avancement concernant la gestion de ces données. Le travail en est encore aux étapes préliminaires et donc peu de choses à dire sur le projet pour le moment. Les choix techniques au niveau du format de données et de l’API ne sont pas encore faits et nous évaluons si nous pouvons nous raccrocher à des formats ou des logiques existantes. Pour la plateforme, elle sera développée avec le framework Django. Un site web dédié au projet devrait être mis en place dans les mois à venir. Pour l’heure ZoneCone demeure fonctionnel mais la curation que je réalisais sur les événements (pour améliorer certaines données insuffisantes) est suspendue depuis plusieurs mois car trop prenante en temps. D’ici quelques mois, ZoneCone sera probablement remplacé par une instance de la plateforme open source que nous développons. Pour toute question, vous pouvez me contacter par courriel: stephane [at] opennorth.ca

Comment » | Données Ouvertes, Rêvons un peu

Montréal dans la cour des grands

October 27th, 2011 — 9:31pm

La Ville de Montréal a annoncé aujourd’hui le lancement de sa politique de données ouvertes. Voilà depuis 2007 que j’attends cet événement et ceci se concrétise après seulement un an de vie de Montréal Ouvert qui a été un des principaux acteurs dans cette démarche, de concert avec certains représentants de la Ville.

Montréal était malheureusement en retard au Canada et notamment par rapport au G4 des données ouvertes (Edmonton, Ottawa, Toronto et Vancouver). Et autant dire ce qui est, ce n’est pas en cette fraiche journée d’octobre que nous avons soudainement effacé le retard sur ces villes.

Le bon

- En plus d’un portail attrayant et bien organisé, la Ville cherche réellement à inciter l’innovation autour des données, notamment avec l’intégration d’un forum et de différentes ressources pour intéresser les développeurs.

- Mieux que cela, la Ville ouvre même la porte d’un comité de concertation pour les étapes suivantes du déploiement des données ouvertes. Yeah!

- La licence comprend les mêmes éléments que les autres grandes villes du Canada (type Creative Commons, attribution share-alike), notamment le G4, ce qui assure une certaine cohérence et créé une sorte de standard de facto en matière de licence.

Le moins sûr

- Cette même licence contient malgré tout une clause “share alike” qui ne fait pas l’unanimité. Cependant cette limitation me semble compensée par l’uniformité avec les autres villes (y compris hors du Canada). Il faudrait juste que la Ville soit un peu plus claire sur ce qu’implique cette clause, notamment dans le cadre de mix entre différentes sources de données, car finalement personne n’a l’air certain à 100%.

- “Seulement” 13 sets de données ont été livré. Un des grands défis va être d’en amener plus. Plusieurs représentants de la Ville ont confiés qu’il y a une forte demande interne pour ouvrir les données. Il faudra voir comment ça se traduira, mais ça augure assez bien!

- Il n’y a pas d’API, “juste” des données brutes. Là encore, les représentants jurent que les choses vont avancer.

Clairement, l’optique des membres du comité de données ouvertes était de sortir quelque chose vite et avec des moyens limités pour montrer que Montréal pouvait être efficace. De ce point de vue l’objectif est rempli sans aucun doute et c’est un premier pas de géant en aussi peu de temps. Reste à voir maintenait s’il sera possible de maintenir l’effort; plusieurs autres villes ont démontrées un certain essoufflement après la première livraison de données.

Attraper le train en marche, la deuxième génération de données ouvertes

Tandis que Montréal sort enfin de sa coquille, d’autres villes, avec 2 ans d’expérience en banque, en sont déjà à dresser le bilan de leur premier cycle de vie de données ouvertes. Un des premiers constats, c’est la possibilité d’ouvrir les données entièrement via des API. Je regardais hier le site des données de la Nasa et son API, et c’est à se rouler parterre. Si le mouvement continue dans cette direction, il sera possible d’obtenir d’énormes quantités de données avec des navigateurs de données standards.

Ceci nous amène au second point: la standardisation. Tout ceci peut fonctionner si les formats de données sont minimalement uniformes. Récemment je lisais un bilan sur les données ouvertes à Rennes (malheureusement je ne retrouve pas lien…) qui soulignait entre autres la difficulté de justifier le développement d’applications (web ou mobiles) pour une agglomération de 200.000 personnes. Mon avis c’est que même pour une métropole comme Montréal, peu d’applications basées sur des données ouvertes pourraient se justifier financièrement (i.e générer des revenus à la hauteur du développement et surtout de la maintenance pérenne d’applications de qualité).

Il faut donc espérer une standardisation des formats de données “métier” pour que les investissements fait pour certaines applications se rentabilisent sur un bassin de population plus élevé. Le premier exemple qui me vient à l’esprit sont les données de transport en commun au format GTFS. Quiconque développe une application supportant le GTFS vient soudainement de s’ouvrir un marché de plusieurs dizaines de métropoles. Soudainement, ça parle un peu plus.

La bonne nouvelle, c’est que le responsable du projet de données ouvertes à Montréal a signalé qu’il est en contact avec les autres grandes villes du Canada pour tendre vers une certaine uniformisation. Bon signe pour l’avenir!

Une petite parenthèse sur ZoneCone

Les données d’entraves routières font partie du lot ouvert. Certes ces données étaient déjà accessibles, mais c’est une double bonne nouvelle. Primo ces données sont désormais couvertes par une licence ouverte, ce qui fait que ZoneCone n’est plus dans une zone grise de ce point de vue (en tous cas pour les données de la Ville). Secondo les données sont rendus disponibles au format KML qui est un peu plus standard que le VGML utilisé jusqu’à présent. Malheureusement, à l’intérieur du KML, les informations sont encore insuffisamment structurées, mais des discussions que j’ai avec la Ville depuis un certain temps tendent à me faire dire que ça va s’améliorer. La mauvaise nouvelle, c’est qu’il faut que je modifie mon code pour supporter ce nouveau format!

3 comments » | Données Ouvertes

ZoneCone.ca: génèse d’une application Open Data

September 28th, 2011 — 9:49am

Ce billet est “crossposté” avec MontréalOuvert

Se lancer dans une application “open data” est souvent plus facile qu’on croit: on commence par jouer avec des données, mettre en place une base de données, créer quelques scripts et on est parti sans même l’avoir planifié! Mais la suite nécessite de se poser quelques questions…

Les technicalités

Tout ce qui tourne autour des données ouvertes est souvent perçu comme un travail de geek. C’est vrai que ça prend des lignes de code. Cependant de plus en plus, avec des frameworks de développement et les outils existant, il est possible de faire des systèmes assez complets en assez peu de temps et avec des compétences assez limitées. Il faut apprendre à coller des blocs ensemble mais l’information est largement disponible en ligne. Je ne suis pas un développeur, j’ai appris le développement sur le tard comme beaucoup d’autres!

De même pour l’hébergement du site, il est fascinant de voir l’offre qui est maintenant disponible et la manière dont tout est rendu facilement accessible. ZoneCone est hébergé pour 20$/mois avec la possibilité d’augmenter la taille du serveur en 15 minutes et de payer le serveur amélioré uniquement au prorata du temps utilisé et sans frais de transfert. Facile… ou presque!

Certes, avoir des outils encore plus accessibles aux non-informaticiens est nécessaire, mais obtenir quelque chose de viable est plus facile qu’on ne l’imagine de l’extérieur.

Le légal

Un des points qui est rapidement venu me hanter est celui des licences des données sources utilisées par l’application. Celles du MTQ étaient couvertes par le Droit d’auteur gouvernemental pour lequel une application de type mashup est dans une zone grise. Les données de la Ville de Montréal, elles, n’étaient pas clairement licenciées.

Le risque était donc de voir l’application poursuivie en justice après le lancement. Cependant, après avoir discuté avec d’autres développeurs d’applications, des personnes de Montréal Ouvert et du Cippic, une poursuite semblait assez peu probable. De manière générale, tout le monde était d’avis que tant que l’application n’avait pas de conséquence ou d’objectif malfaisant, des organismes publics ne se risqueraient pas à une poursuite. Le principal risque était donc de voir l’application se faire bloquer l’accès aux données sources.

Le lancement

Une des questions qui s’est posée était de savoir quand lancer? Attendre que l’application soit bien développée (et surement attendre plusieurs mois de plus) ou lancer rapidement. La plupart des personnes consultées ont proposé de lancer rapidement une application pas nécessairement complétée. La raison est double: comme les startups, il est intéressant de lancer rapidement et de faire des itérations par la suite pour pouvoir prendre en compte les remarques des utilisateurs dans les évolutions de l’application.

Par ailleurs dans le cadre actuel, notamment à Montréal, le but est surtout d’attirer l’attention des pouvoirs publics sur la pertinence des données ouvertes. Sachant que le données utilisée par ZoneCone étaient parfois hasardeuses (certaines incohérences étaient évidentes), il semblait vain de perfectionner l’application puisque les résultats seraient toujours liés à la qualité des données. Ainsi ZoneCone a été lancée rapidement bien que pas vraiment finalisé (et loin de l’être encore aujourd’hui).

Et enfin, si l’application n’atteignait pas se cible, je n’aurais pas passé plus de temps que nécessaire dessus.

La communauté

L’existence d’une communauté Open data (et plus généralement “geek”) demeure un élément central dans la réalisation d’un tel projet. N’étant un expert en rien, j’avais beaucoup à apprendre et j’ai pu compter sur les conseils et l’aide de plusieurs personnes pour avancer. Bien qu’Internet permette de joindre n’importe qui dans le monde, mes expériences ont montré que le taux de réponse et la qualité des réponses des personnes rencontrées localement étaient supérieures à celles venant de plus loin. Cela peut sembler évident mais c’est un rappel de l’utilité de bâtir des communautés locales et de les faire vivre pour favoriser l’échange d’idées et le support mutuel.

Forcer (un peu) le passage

Les membres de la communauté “open data” veulent des données mais les organismes publics sont souvent hésitants. Dans ce contexte, développer une application mettant en oeuvre les données en question, même de manière partielle et incomplète, demeure un très bon moyen pour provoquer les choses!

A titre d’exemple, le groupe de travail de la Ville de Montréal sur les données ouvertes était en plein travail lors de la publication de ZoneCone.ca. Ceci a donné encore plus de force à leur initiative en rappelant aux différents échelons de gouvernance la pertinence de la démarche. Évidemment rien n’est garanti, mais une démonstration de ce qui est faisable (et une certaine couverture médiatique) demeure un très bon moyen pour faire évoluer les esprits et c’est finalement un des premiers objectifs des mouvements comme Montréal Ouvert.

Comment » | Données Ouvertes, ZoneCone

Les données ouvertes pour (essayer de) lutter contre la corruption

September 19th, 2011 — 10:27pm

Je vais me permettre de reprendre une idée proposée par un utilisateur du site, à savoir rendre disponibles des données sur les entrepreneurs réalisant les chantiers routiers pour lutter contre la corruption. Par les temps qui courent, les scandales de corruption dans le domaine de la construction routière (et pas juste là) font les manchettes à travers le Québec sans qu’il ne soit vraiment possible d’y voir quelque chose. Sur ZoneCone, il y a en permanence près de 150 chantiers actifs juste pour le MTQ et la Ville de Montréal. Ça représente beaucoup d’argent, mais aussi de manière assez éparpillée. Comment y voir quelque chose?

Mais commençons par un cas bien réel. Voilà un an, David Eaves, un gourou des données ouvertes, a publié un billet relatant comment un accès à des données sur les dons à des oeuvres caritatives a permis de mettre en évidence un mécanisme d’évasion fiscale sur des montants de 3.2G$. Vous lisez bien: 3.2 milliards de dollars canadiens. Je vous laisse lire l’article si vous voulez en savoir plus, mais grosso modo en faisant une requête d’accès à l’information sur des déclarations d’impôt, un chercheur s’est aperçu que les plus importants “fundraisers” canadiens étaient des organismes totalement inconnus dans le milieu caritatif. Évidemment, les organismes en question étaient des épouvantails pour de l’évasion fiscale. Un accès à des données publiques et une analyse quantitative ont permis de mettre à jour les rouages d’un plan certes peu sophistiqué mais ô combien efficace!

Revenons à nos moutons: des hommes politiques financés par des entreprises dont certaines sont peu scrupuleuses et qui obtiennent en retour des faveurs sous forme de contrats publics très juteux et la mafia qui trempe dans tout ceci. Dans l’affaire, c’est le contribuable qui paie le champagne à tout ce monde et notre société qui s’enlise au grand complet. Que pourrait-on faire pour rendre les rouages à un peu plus visibles ?

1. Publier les données financières des chantiers. Qui? Combien? Pour faire quoi? Ce serait un bon début. À l’image des organismes caritatifs, il serait possible de simplement sommer les montants pour voir les répartitions. Ceci devrait s’appliquer à l’ensemble des acteurs des chantiers, des firmes de génie-conseil qui ont fait les plans jusqu’au différents niveaux de sous-contractants. Si d’autres provinces ou pays se mettent à publier des données équivalentes, cela permettrait également de mettre en évidence les disparités.

2. Publier les données d’infractions fiscales des entreprises. Une sorte de resto-net des entrepreneurs. Dans mon cas je m’intéresse aux entrepreneurs soumettant pour des contrats publics, mais c’est une information très intéressante de manière plus large. Ce type de mesure augmenterait sans doute la pression de ne pas choisir les entreprises condamnées. Peut-être.

3. Publier plus ouvertement l’information des donnateurs de partis politiques. Ce genre d’information est déjà largement utilisé aux U.S.A avec des initiatives comme Influence Explorer dont le rôle n’est pas négligeable. Cependant les enquêtes récentes sur le domaine de la corruption montrent combien l’argent versé aux partis se fait souvent par des prêtes-noms. De cette manière, il est assez difficile de faire le lien direct entre les entreprises, les prêtes-noms et les politiciens, des enquêtes sont alors nécessaires.

En regardant les points précédents, on constate d’abord que chacune des propositions commence par “publier les données”, c’est l’idée des données ouvertes. Et quand je dis publier, c’est essayer de rendre cela accessible, ouvert et pérenne. Ensuite, si chacune de ces sources d’information sont intéressantes indépendamment, les combiner serait encore plus puissant puisque cela permettrait de créer des liens: quelles entreprises condamnées ont encore des chantiers actifs, pour quels montants et autorisés par qui? On peut aussi gager qu’il serait possible de mettre en évidence certains schémas récurrents dans la distribution des chantiers, les partenariats, les influences locales et bien d’autres…

Comme je dis souvent, les données ouvertes ne résoudront les problèmes de faim dans le monde, et cela ne mettra pas fin aux problèmes de corruption non plus. Cependant cela peut mettre en évidence certains rouages de la mécanique cachée de ce système corrompu et ainsi mieux le comprendre. Ce n’est pas beaucoup, mais étant donné l’actuel flou autour de toutes ces affaires, ce serait mieux que rien!

Moulin à vent

Don Quichotte, es-tu là ? (Île aux Coudres, 3 août 2009)

4 comments » | Données Ouvertes, Rêvons un peu

Back to top