Kotlin Dataframe : une abstraction pour travailler avec des données structurées

Par:
fredericmazue

mar, 06/09/2022 - 11:27

Kotlin Dataframe est une abstraction permettant de travailler avec des données structurées, la structure étant un tableau à 2 dimensions avec des colonnes étiquetées.

Ainsi la bibliothèque Kotlin Dataframe peut traiter des sources de données aussi diverses que fichiers CVS, JSON, Excel ou Apache Arrow. L'abstraction n'est bien sûr pas dans la table elle-même, mais dans un ensemble d'opérations définies sur celle-ci. La bibliothèque Kotlin Dataframe est un langage DSL (langage spécifique au domaine) basé sur Kotlin définissant de telles opérations. 

Kotlin Dataframe a été conçus de manière hiérarchique et permet l'imbrication de colonnes et de cellules, c'est pourquoi la bibliothèque permet de traiter des fichiers JSON.

Kotlin Dataframe est générique car les colonnes peuvent stocker des objets de n'importe quel type, pas seulement des nombres ou des chaînes. Kotlin Dataframe est également poluymorphique. Ainsi, si toutes les colonnes de la trame de données sont présentées dans une autre trame de données, la première pourrait être une superclasse pour la seconde. Ainsi, on peut définir une fonction sur une interface avec un ensemble de colonnes puis l'exécuter de manière sûre sur n'importe quel dataframe qui contient cet ensemble de colonnes.

Kotlin Dataframe vient de sortir en préversion.

Kotlin Dataframe est un logiciel libre sous licence Apache 2.0, disponible sur GitHub