La data

Des technologies robustes de data science et de data engineering.

La data science

Le métier de Data Scientist a pour objectif de créer de la valeur à partir de la donnée. La position du métier est à l’intersection des problématiques business, de la tech, et de l’approche statistique requise pour exploiter une donnée toujours plus volumineuse. La compréhension des enjeux métiers de nos clients est l’étape n°1 d’un projet data réussi ! Pour accélérer la création de valeur et la production de livrables, c’est autour d’un langage interprété et rapide d’utilisation que la plupart des projets data se structurent : le python ! C’est le langage qui propose le plus de librairies spécialisées.

Stack technique Data science

Talk à visionner

Meetup Data : Prédiction de classements de courses sportives

L’équipe Datawok a eu l’opportunité de travailler sur un projet d’aide à la prise de paris sportifs dont l’objectif était d’identifier les favoris et les outsiders d’une course. Comment ? En prédisant avant chaque course et pour chaque coureur sa probabilité d’arriver à un rang donné. Vous pouvez également retrouver l’article qui a donné lieu à ce talk sur notre blog !

Voir le replay du talk

La data ingénierie

Le rôle du Data Engineer est d’organiser et de mettre rapidement à disposition d’importants volumes de données en s’appuyant notamment sur des framework et outils dédiés. Aujourd’hui, Hadoop est l’un des principaux framework open source autour du Big Data. Il a donné naissance à tout un écosystème de technos très populaires pouvant être liées à un ou plusieurs de ses propres modules. On peut notamment citer Spark, Cassandra, Hive, Hbase, Zookeeper et bien d’autres. Pouvant être couplé avec Scala, Java, Python ou encore R. Spark, quant à lui, a été spécialement conçu pour accélérer le traitement des données sur des systèmes Hadoop. Il est particulièrement efficace avec des données distribuées.

Stack Spark - E-commerce

Intervention de linkvalue

Réalisation E-commerce et Data

Découvrez un use case de structuration et d’exploitation de données en temps réel d’une solution e-commerce omnicanale.

Découvrir la réalisation