

Si le logiciel libre et les communs numériques constituaient la meilleure piste à envisager pour reconquérir notre souveraineté numérique ? Tristan Nitot prend la parole sur le sujet.
Le média de ceux qui réinventent l'entreprise
A l'occasion de la Cloud Week Paris 2018, nous avons mené des interviews exclusives auprès d'intervenants et partenaires de l'événement phare 2018, qui réunit les experts du Cloud Computing.
Dans cette première entrevue, Emmanuel Serrurier, Vice-Président Europe du Sud chez Hortonworks, édtieur d'une plate-forme de gestion des données 100% open-source, nous parle de la gouvernance des données.
La plupart des entreprises utilisent les données pour mieux comprendre et optimiser la tenue de leurs affaires, voire-même innover dans leur activité.
Pour améliorer la pertinence des analyses, il leur faut conserver les données et donc les stocker en prenant en compte la problématique du coût de stockage.
Par ailleurs, elles utilisent des applications multiples et ont besoin de les déployer rapidement et c’est pour cette raison que les entreprises migrent massivement vers des architectures de données modernes qui intègrent la composante Cloud. Cela signifie qu’elles en viennent à héberger leurs données non seulement dans le datacenter mais aussi dans le cloud.
Elles se retrouvent ainsi confrontées à des problématiques de cloud hybride en ce qui concerne leurs données : sans une gouvernance adéquate, elles sont susceptibles de perdre en visibilité et en contrôle sur ces données.
En plus des contraintes opérationnelles que cette perte de visibilité génère pour les métiers, il peut également devenir difficile de sécuriser les données, d’assurer que leur traitement répond aux contraintes réglementaires en vigueur, et à leur évolution.
Notre plate-forme est conçue pour améliorer la gouvernance des données. De nouvelles fonctionnalités de sécurité et de gouvernance des données ont été ajoutées à Hortonworks Data Platform 3.0. Elles donnent aux entreprises des moyens supplémentaires pour les aider à être en conformité avec le RGPD. En effet, grâce au module Data Steward Studio, il est possible de retracer le parcours des données depuis leur création et ainsi d’évaluer leur niveau de confiance et de les classer en fonction de leur niveau de criticité.
Hortonworks Data Platform 3.0 a également été optimisée pour les besoins du Cloud. La plateforme prend en charge Amazon S3, Azure Storage Blob et Google Cloud Storage. Les utilisateurs peuvent ainsi opter pour une architecture de données hybride avec le fournisseur Cloud de leur choix.
La rapidité des changements dans le cloud, la variété des acteurs et des protocoles promet de poser problèmes aux entreprises. Dans ce secteur, et dans un contexte changeant, les technologies open source diminuent le risque pour les entreprises. Nous pensons que notre offre de support de la seule plate-forme Hadoop 100% open source est pour nos clients une garantie de pérennité et de sérénité concernant leurs choix technologiques dans le domaine de l’analyse de données.
Le traitement des données dans le datacenter et le cloud co-existera bientôt avec un traitement des données en “edge computing”, plus à même de répondre à des besoins sp��cifiques de l’IoT.
L’Internet des Objets peut dans certains cas réclamer que les informations soient analysées au niveau où les données sont collectées. Par exemple dans le cas des voitures autonomes, la latence induite par un transfert aller-retour des données pourrait avoir un impact sur des systèmes critiques liés à la sécurité des passagers.
Si la scalability, qui consiste à augmenter la puissance des traitements centralisés, reste un challenge majeur dans le nouveau monde de l’IoT, le traitement pourra plus volontiers se faire « at the edge ».
Dans le coeur des datacenters et en périphérie des réseaux, le traitement temps réel est amené à se généraliser de manière à traiter davantage de données à un rythme plus rapide.
Par ailleurs, les performances d’analyse de données seront bientôt largement améliorées par l’utilisation d'algorithmes de Deep Learning et de Machine Learning, notamment dans des environnements Cloud. La pertinence des insights ainsi obtenus rendra possible des prises de décision de qualité dans des processus qu’il sera ensuite possible d’automatiser.