Should you use AWS Glue Crawlers?

If you ever had the project of building a Datalake in AWS, you certainly have considered using AWS Glue crawlers at some point, would it be because you read the AWS documentation, a related article or simply the StackOverflow most upvoted solution. At Devoteam Revolve, we did too. This article aims to describe the reasons why we in...

Lire la suite

La revue de presse IA/ML – novembre 2023 : Data Manipulation, LLM, éthique

Nous sommes heureux de vous partager la deuxième édition de notre revue de presse sur les sujets d’IA et de ML. Dans une volonté d'accroître la circulation d'informations, nous avons mis en place au sein de notre communauté IA / ML, un nouveau processus de partage d’articles qualitatifs afin de, petit à petit, construire une base de c...

Lire la suite

Retour sur le salon Data et IA Nantes: soutenabilité, projets atypiques et nouvelles technos

Le mardi 19 Septembre dernier a eu lieu le 8ème Salon de la Data et l’IA à Nantes. Je n’étais pas sur place, mais grâce à la magie de la technologie, j’ai pu assister à plusieurs conférences que j’avais identifiées en amont. Dans cet article, je vous propose un résumé de certaines d’entre elles.Si les questions environnementales, la D...

Lire la suite

Deeptimize : une infrastructure full serverless sur le Cloud AWS pour booster l’analyse vidéo du sport par l’IA

Deeptimize propose une solution d’analyse du sport en vidéo par l’IA. Les algorithmes de Deeptimize extraient de la donnée de tout type de vidéo : des données liées au mouvement, à la posture, ou des données sémantiques (ce qui se passe dans la vidéo, à quel moment, quelle position). Afin de rendre la donnée largement accessible au monde...

Lire la suite

La revue de presse IA/ML – septembre 2023

Nous sommes heureux de vous partager notre toute première revue de presse sur les sujets d’IA et de ML. Dans une volonté d'accroître la circulation d'informations, nous avons mis en place au sein de notre communauté IA / ML, un nouveau processus de partage d’articles qualitatifs afin de, petit à petit, construire une base de connaissa...

Lire la suite

How to calculate the carbon footprint of training/running a large AI model in the cloud

GPT-3, GPT-4, ChatGPT, Bard, Stable Diffusion, Midjourney, DALL-E, etc., are Generative AI systems, made by large AI models. Systems that can generate text, images, or other media in response to prompts. A large amount of data and computing resources are necessary to train a large model like that. However, the question is: how big are...

Lire la suite

Dans ta science : la note de synthèse Hub France IA sur ChatGPT et l’IA générative

Il ne vous aura pas échappé que ChatGPT et les IA génératives font la une des actualités depuis plusieurs mois, et que ce phénomène a largement dépassé les milieux spécialisés de l'IT et de l'IA. Pour répondre aux interrogations soulevées par l'essor de l'IA générative, Hub France IA a constitué un groupe de travail consacré à ChatGTP...

Lire la suite

IA responsable : quelles solutions pour réduire l’empreinte carbone des modèles ?

L’IA apporte des solutions à de nombreux problèmes, mais cela se fait aussi au prix d’une consommation énergétique accrue. Nous verrons dans cet article un panorama des techniques existantes, concrètes, et faciles à mettre en place, pour rendre nos modèles d’IA moins gourmands en énergie, de manière à limiter leur impact environnement...

Lire la suite

Working with data files from S3 in your local pySpark environment

Even though AWS provides more and more resources and possibilities to work with your data in the Cloud, some people still feeling the need to work with their data into their local pySpark environment. The idea of this article / tutorial is to show how to do that and help you to understand what happens under the hood. This article was ...

Lire la suite

Le ML Ops – partie 5 : la livraison continue, sauce ML

Cinquième article de notre série consacrée au Machine Learning en production et ses solutions ML Ops dans le Cloud : Partie 1 : Le Machine Learning en production et ses solutions ML Ops dans le Cloud Partie 2 : Pourquoi se lancer dans une démarche de Machine Learning Partie 3 : La définition d'un algorithme ML Partie 4 : Pou...

Lire la suite