Jacques van Helden
2018-10-09
Un grand nombre d’outils bioinformatiques ne sont pas munis d’interfaces interactives
Automatisation des tâches
High performance computing (HPC)
Traçabilité et reproducibilité des analyses
La plupart des outils bioinformatiques peuvent être compilés pour les systèmes opérateurs de type Unix (Linux, Mac OS X), et ne tournent pas sous Windows.
Différents environnements de travail peuvent être utilisés pour utiliser ces outils.
Composantes
Applications typiques
Exemples de superviseurs
Exécution d’applications sur un système opérateur partagé sans recours à une machine virtuelle
Intérêt
Logiciels de gestion de conteneurs
Comparaison de solutions de virtualisation. Droite: machine virtuelle; centre: container Docker; droite: container Singularity . Source: Greg Kurtzer keynote at HPC Advisory Council 2017 @ Stanford
Avantages
Désavantages
Doc : https://conda.io/docs/
Avantages
Désavantages
Une grappe de calcul est un ensemble d’ordinateurs (appelés *noeuds) qui peuvent être utilisés ensemble pour paralléliser des tâches.
Grappe de serveurs. En avant-plan: Homo sapiens tentant d’établir une interaction physique avec les machines. Source: https://en.wikipedia.org/wiki/Parallel_computing
La parallélisation des tâches (parallel computing) consiste à lancer simultanément uen série de processus informatiques sur un système informatique.
Les tâches peuvent être distribuées sur plusieurs processeurs (Computer Processing Unit, CPU) d’un même ordinateur et/ou sur plusieurs ordinateurs (grappes de serveurs).
La distribution des tâches sur les processeurs et ordinateurs repose sur un logiciel appelé gestionnaire de tâches (job scheduler). Les utilisateurs soumettent les tâches (sous forme de commandes de terminal) au gestionnaire, qui pilote leur exécution sur les différents processeurs et/ou noeuds d’une grappe.