Créer un portail de données avec Opendatasoft
Hello,
Bienvenue dans l’édition #37 de la newsletter DataGen ! 👋
Cette semaine, on remercie Jean-Marc pour son retour d’expérience sur Opendatasoft. 👏
Avant tout, voici quelques liens utiles :
On t'a partagé ce mail ? Inscris-toi à la communauté pour recevoir les prochaines éditions.
Ajoute-moi sur LinkedIn si ce n'est pas encore fait, je partage du contenu data chaque semaine.
Abonne-toi à la chaîne YouTube. Les interviews sont maintenant disponibles en format vidéo.
L'agenda de la semaine :
🔍 Zoom sur la création d’un portail de données.
🎙 Le podcast avec Jean-Marc, Cofondateur d’Opendatasoft.
📚 Les ressources recommandées par Jean-Marc.
C’est parti !
🔍 Zoom sur la création d’un portail de données
Ce zoom est tiré de mon échange avec Jean-Marc Lazard, cofondateur d’Opendatasoft, la solution qui permet à ses clients de déployer des portails de données. Leur objectif est de venir démocratiser la donnée pour les métiers.
La genèse d’Opendatasoft
Je te partage le post LinkedIn dans lequel j’ai synthétisé la genèse d’Opendatasoft mardi matin :
Comment ça marche ?
Un portail de données ressemble à un site internet interne sur lequel les collaborateurs vont se connecter pour identifier et accéder aux données de l’entreprise.
On retrouve 5 briques clés dans un portail de données :
1) Moteur de recherche et consommation
Les collaborateurs vont utiliser un moteur de recherche qui remontera tous les jeux de données qui auront été préalablement référencés. Ils vont pouvoir interagir avec la donnée directement via le portail en la visualisant sous différentes formes (graphs, tables, etc.).
“Ils pourront aussi télécharger la donnée sous format excel ou l’exporter vers un outil de Business Intelligence grâce à une connexion API.”
2) Préparation et description des données
Avant de pouvoir chercher la donnée, il faut la rendre intelligible. C’est à cette étape par exemple que l’on va modifier les noms un peu barbares ou les acronymes qui auront été utilisés par les équipes techniques en charge de la collecte des données. Par ailleurs, c’est là également que l’on va pouvoir identifier les données qui peuvent être croisées entre elles.
“On appelle ces informations sur les données des métadonnées. Par exemple, si je documente que 2 jeux de données contiennent des coordonnées géographiques, je pourrais détecter automatiquement que j’ai la possibilité de les croiser.”
3) Collecte auprès des sources de données
Le portail de données met à disposition des connecteurs qui vont permettre de récupérer de manière automatique toutes les données que l’on souhaite référencer.
“On peut collecter des données temps réel, des données déjà centralisées dans une plateforme ou bien issues d’objets connectés, etc.”
4) Sécurité
Les collaborateurs se connectent au portail de manière sécurisée avec leur SSO (Single Sign On). C’est ce qui permet de limiter l’accès pour chaque collaborateur aux données auxquelles il est éligible.
“Les collaborateurs peuvent trouver les données qu’ils cherchent. En revanche, le portail va leur dire : oui, tu as le droit d’y avoir accès ou non tu n’as pas le droit."
5) Monitoring de l’usage des données
Cette fonctionnalité du portail va permettre d’analyser différents KPIs tels que le volume de recherche lié aux données, les typologies de collaborateurs qui ont effectué ces recherches, les consommations associées (ex : visualisation, extraction), etc.
"Aujourd'hui, dans toute stratégie data, on doit inclure une brique d'analytics pour mesurer l'usage des données."
🎙 Le podcast avec Jean-Marc, Cofondateur d’Opendatasoft
Découvre l'intégralité de notre échange avec Jean-Marc. Il nous raconte son parcours avant Opendatasoft, nous parle des plus grandes difficultés qu'il a rencontré et nous partage sa vision du marché de la data.
"Beaucoup d'entreprises ont investi des 10 aines de millions d'euros dans du stockage et du traitement mais les équipes métiers disent : d'accord mais je n'en vois pas la couleur, ou est-elle cette donnée ?"
Liens vers l’épisode : Apple Podcasts | YouTube | Spotify | Deezer
📚 Les ressources recommandées par Jean-Marc
"On publie beaucoup de retours d'expérience de nos clients sur la mise en place de portails de données."
"Ils font beaucoup de recherches sur l'intérêt et la valorisation des données. C'est à la fois très concret avec des retours d'expérience mais il y a aussi un peu de prospective."
"C'est un livre qui parle de toutes les problématiques des modèles économiques liés à la donnée. Comment est ce qu'on crée de l'efficacité business et de la collaboration autour de la donnée ? C'est très bien."