Wie Forschungssoftware nachhaltiger werden kann
Die Digitalisierung macht auch vor der Wissenschaft keinen Halt. Ob Simulationen für Mobilfunknetze, Akustikprobleme, Schadstoffausbreitung oder umfangreiche Berechnungen in der Chemie: Wissenschaftlerinnen und Wissenschaftler benötigen für ihre Arbeit immer häufiger spezifische Forschungssoftware. Wie solche Software nachhaltiger entwickelt und dokumentiert werden kann, untersucht jetzt das interdisziplinäre Projekt SURESOFT der Technischen Universität Braunschweig.
Nachhaltigkeit spielt auch bei der Entwicklung von Software eine immer größere Rolle. Forschungssoftware wird häufig für bestimmte Problemstellungen oder Experimente entwickelt. „Diese kurzfristige Perspektive führt dazu, dass viele Software-Lösungen schwer zu warten und zu erweitern sind. Wir wollen im Projekt SURESOFT eine Methodik entwickeln, um sicherzustellen, dass Forschungssoftware langfristig nutz- und verfügbar ist“, sagt Projekt-Koordinator Professor Rüdiger Kapitza vom Institut für Betriebssysteme und Rechnerverbund.
Das Problem mit dem Älterwerden
Software kann, wie viele Dinge auch, altern. Sie kann zum Beispiel so entwickelt werden, dass sie nicht an neue Anforderungen angepasst werden kann, die über die ursprüngliche Verwendung der Software hinausgehen. Außerdem kann Software immer komplexer und unübersichtlicher werden, wenn neue Funktionalitäten für eine weitere oder umfangreichere Nutzung hinzugefügt werden. Der Grund für solche Alterungsprozesse ist die Qualität bzw. Nachhaltigkeit der Software. Wissenschaftlerinnen und Wissenschaftler sind oft nicht explizit in der Entwicklung von Software geschult. Andererseits besteht ihr primäres Interesse darin, ihre spezifischen Forschungsprobleme zu lösen. Die Nachhaltigkeit der entwickelten Softwarelösungen spielt deshalb häufig eine eher untergeordnete Rolle.
Ein solcher Entwicklungsprozess kann aber zur Folge haben, dass die Software unbrauchbar wird und Forschungsergebnisse somit im schlimmsten Fall nicht mehr reproduzierbar sind. „Durch die wachsende Bedeutung von Forschungssoftware kann ihre nachhaltige Entwicklung zunehmend zu einem limitierenden Faktor für den wissenschaftlichen Fortschritt werden“, fasst Dr. Jan Linxweiler vom Institut für rechnergestützte Modellierung im Bauingenieurwesen, einem der am Projekt beteiligten Institute, die Problematik zusammen.
Kontinuierliches Testen
Hier setzt das Projekt SURESOFT an und nutzt als Basis die Methodik der kontinuierlichen Integration. Diese vereint etablierte Werkzeuge der Softwareentwicklung mit methodischem Vorgehen, um die Softwarequalität zu steigern. Ein zentraler Aspekt ist dabei das automatisierte Testen von Software, wodurch Fehler während der Entwicklung frühzeitig erkannt werden können.
„Dieser Ansatz ist schon länger bekannt. Wir wollen ihn jetzt für bereits bestehende TU-Forschungssoftware anpassen. Unsere Idee ist, dass wir die Weiterentwicklungen der Software mithilfe von früheren Forschungsergebnissen, die mit dieser Software entstanden sind, automatisiert überprüfen. So wird sichergestellt, dass die überarbeitete Version funktioniert und die alten Ergebnisse auch mit der neuen Software reproduzierbar bleiben“, erklärt Professor Rüdiger Kapitza.
Interdisziplinäres Teamwork
Zusammen mit dem Institut für Physikalische und Theoretische Chemie, dem Institut für rechnergestützte Modellierung im Bauingenieurwesen, dem Institut für Nachrichtentechnik und dem Institut für Akustik soll dieser Ansatz an vier Forschungssoftwareprojekten angewandt werden. Die vom Projektteam gemeinsam entwickelte Methode ist aber keine Universallösung, sondern vielmehr ein Vorgehensmodell: Angepasst an die jeweiligen Softwareprojekte werden den Forschenden Prozesse und Werkzeuge beispielsweise als gebrauchsfertige Softwarelösungen bereitgestellt.
Die Wissenschaftlerinnen und Wissenschaftler wollen aber nicht nur die Qualität und Erweiterbarkeit der Forschungssoftware verbessern, sondern ebenso die Bereitstellung der Software erleichtern und eine langfristige Verfügbarkeit gewährleisten. Zu den Projektpartnern gehören deshalb auch das Gauß-IT-Zentrum (GITZ) und die Universitätsbibliothek (UB) der TU Braunschweig. Das GITZ bereitet die benötigte Infrastruktur vor und stellt sie zunächst für die am Projekt beteiligten Institute und später auch für andere Projekte zur Verfügung. Die Universitätsbibliothek archiviert die Software und den Entstehungskontext, um eine spätere Wiederherstellung aus den Archivdaten zu ermöglichen. Darüber hinaus können archivierte Forschungsdaten mit definierten Versionsständen der genutzten Forschungssoftware verknüpft werden, um die Reproduzierbarkeit der Forschung zu verbessern.
Virtuelles Kick-off
Das Projekt wird von der Deutschen Forschungsgemeinschaft (DFG) ab Juni 2020 für drei Jahre mit 1 Million Euro gefördert und startete jetzt mit einem virtuellen Kick-off. Hendrik Eggers, Chief Information Officer der TU Braunschweig, hat die Initiative ins Rollen gebracht und fasst zusammen: „Ich freue mich, dass wir jetzt mit dem Projekt starten können und dass sich interdisziplinäre Zusammenarbeit und auch Beharrlichkeit am Ende auszahlen.“