Vous êtes ici : Accueil > Départements et services > Genoscope > Laboratoire d'informatique sci ... > Équipe système et réseau

Équipe système et réseau

Activités


Publié le 25 juin 2018

Réseau
Le réseau de l'institut de Génomique est articulé autour de matériels réseaux compatibles 10 Gigabit/s afin de répondre aux exigences de gros transferts de données et d'échanges entre le stockage et les unités de calcul. Les postes de travail sont pour leur part connectés en Gigabit. Ce réseau est totalement redondant. Deux routeurs sont positionnés en périphérie du réseau.

Stockage de données et sauvegarde
Le stockage de données est un point sur lequel la plus grande attention est apportée. Il doit pouvoir fournir :

  • Volumétrie : Actuellement plus d'un 2 Po de données en ligne ;
  • Performance : Certaines applications requièrent  des niveaux de performances de plusieurs Gigaoctets par seconde. C'est aussi une des raisons qui justifie le passage à un réseau 10 Gigabit/s.

Ce service est assuré par un ensemble de contrôleur NetApp, en cours de migration de 7-mode vers le mode cluster du constructeur. Cette technologie permet d'améliorer la disponibilité du service et d'optimiser son fonctionnement.

Différentes stratégies de protection des données sont mises en œuvre, en fonction de l'analyse de risque et du cycle de vie :

  • Protection du matériel, redondance (HA pair, RAID DP) ;
  • Versionnement court terme par snapshots ; copie sur une baie secondaire pour le moyen terme (snapvault) ;
  • Archivage long terme et sauvegarde moyen terme sur bandes, via une robotique StorageTek SL3000 (LTO 6).

Cluster de calcul
Il existe sur le site plusieurs clusters de calculs, pilotés par les logiciels LSF (IBM) et Slurm. Une migration vers Slurm exclusivement est en cours.

Ces clusters sont composés d'une soixantaine de machines représentant environ 1.300 cœurs. Quatre machines sont dites «à large mémoire» car elles possèdent plus de 2 To de mémoire pour des applications spécifiques.

Un des enjeux de la configuration de ces clusters de calcul est de trouver une combinaison optimale du système pour garantir le compromis le plus adapté entre rapidité de calcul et latence minimale pour les processus interactifs.

Base de données
Pour les besoins propres de l'inst​​itut de génomique, l'équipe système gère plusieurs logiciels de base de données : MySQL, Sybase, MongoDB et PostgreSQL.

Virtualisation
La virtualisation, qui consiste à mettre en œuvre plusieurs serveurs (virtuels) sur une seule machine physique permet d'optimiser l'emploi de serveurs dont le​s ressources matérielles seraient sous-exploitées. Ces technologies permettent en outre de consolider l'infrastructure, en facilitant le déploiement et l'exploitation.

L'infrastructure de virtualisation est constitué de 6 serveurs Dell Poweredge R620 (16 cœurs, 256 Go de mémoire) et 4 baies Dell Equalogic PS6100 pour 100 To de disque utiles.

Pilotage des instruments
Si l'équipe système n'intervient pas directement sur les instruments proprement dit, elle gère par contre l'accès au réseau de ces machines et suivant les cas la configuration des ordinateurs qui y sont directement rattachés. Cela nécessite bien souvent une compréhension du fonctionnement de ces matériels.