Contactez-nous !

data'distribution
Capturer, transformer et propager les changements au sein des bases de données.
Accédez à l'article

Architecture de data’distribution : data hub Temps Réel

data'distribution est une solution de type à la fois EAI et ESB/SOA qui s'appuie sur les données et où les messages constituent des événements du journal des transactions.

Elle permet de capturer tout type d'événement dans la base de données source pour y appliquer en Temps Réel le ou les traitements souhaités dans l'ordre requis, avant d'appliquer le résultat des traitements sur une ou plusieurs cibles. data'distribution existe dans deux architectures : Network Centric ou Hub and Spoke (architecture centralisée, data hub).

Architecture centralisée Hub and Spoke

L'architecture Hub and Spoke correspond à un modèle centralisé avec une ou plusieurs machines centrales dédiées à data'distribution et servant d'intermédiaire entre tous les échanges (data hub). Le hub a pour rôle de centraliser toutes les informations.

 

Ce modèle utilise aussi un référentiel central regroupant toutes les données nécessaires. Le hub est un point de passage obligé pour tout échange d'informations ; sans ce data hub, aucun flux n'est réalisable. Un spoke est une branche (connecteur) attachée au hub. Ce modèle correspond au mode d'échange « Publish and subscribe» centralisé, c'est-à-dire que l'information passe d'abord par le data hub, puis est transférée au destinataire.

 

Les avantages du modèle centralisé, avec un data hub et un référentiel de données central, se retrouvent :

  • Au niveau de l'administration de data'distribution, car tout est concentré sur un point ;
  • Au niveau des performances des systèmes sources, car cette concentration permet de consommer de la puissance CPU sur le hub et non sur la source ;
  • Dans la continuité de service, le data hub pouvant être installé sur un cluster. 

 

 

Architecture Network Centric

 

L'architecture Network Centric s'appuie à l'inverse sur un modèle décentralisé avec communications directes entre les sources et les cibles. Elle s'articule autour des sources, qui contiennent chacune leur propre référentiel, relayées vers les cibles (nœuds) correspondant aux points de connexion à une application.

 

Cette architecture a pour avantage de répartir l'ensemble des données sur l'ensemble des sources.

 

data'distribution permet de synchroniser l'ensemble des référentiels et les consolider sur un référentiel unique, et donc de compenser la différence par rapport au modèle de type Hub and Spoke.

 

 

Une architecture libre et ouverte

 

data'distribution permet de choisir le type d'architecture qui convient au mieux en fonction de différents critères.

Toute base source étant potentiellement la cible d'une autre source et toute base cible étant potentiellement source pour d'autres cibles, une grande souplesse est offerte pour permettre de répliquer dans tous les sens y compris en bidirectionnel sans aucune restriction.

 

Synchronisation de référentiels

 

L'ensemble des communications s'effectue au travers du protocole TCP-IP en n'utilisant qu'un seul port IP entièrement configurable et aucun port standard. Ainsi, il est possible de répliquer en toute sécurité d'un réseau de production vers une zone démilitarisée (DMZ), l'ensemble des flux pouvant être entièrement contrôlés par des pare-feux (firewall) et sans aucune ouverture.

 

 

L'architecture physique de data'distribution s'articule en 3 parties

 

  • La source, sur laquelle résident les moteurs sources et le référentiel contenant le paramétrage (stocké dans la base de données source).
  • La cible, sur laquelle résident les moteurs cible.
  • La ou les consoles de paramétrage et de supervision  qui ne contiennent que les programmes de paramétrage et de supervision, tout le paramétrage étant entièrement centralisé sur la ou les sources. Cette console de paramétrage peut être installée sur tous les postes souhaités et ne nécessite qu’un simple accès IP au réseau de l’entreprise pour permettre au personnel d’astreinte d’exercer une surveillance distante.

Des profils de sécurité permettent de limiter les actions des développeurs et des paramétreurs.