Rejoindre Se connecter

Mangesh Yadav

Date d'abonnement : 2021

Ligue d'Argent

8170 points
Créer des pipelines de données en batch sur Google Cloud Earned avr. 23, 2025 EDT
Créer une infrastructure avec Terraform sur Google Cloud Earned déc. 5, 2024 EST
Premiers pas avec Terraform pour Google Cloud Earned déc. 5, 2024 EST
Serverless Data Processing with Dataflow: Operations Earned oct. 7, 2022 EDT
Smart Analytics, Machine Learning, and AI on Google Cloud - Français Earned oct. 6, 2022 EDT
Traitement des données sans serveur avec Dataflow : principes de base Earned août 16, 2022 EDT
Moderniser des lacs de données et des entrepôts de données avec Google Cloud Earned avr. 5, 2022 EDT
Google Cloud Big Data and Machine Learning Fundamentals - Français Earned avr. 1, 2022 EDT

Les pipelines de données s'inscrivent généralement dans l'un des paradigmes EL (extraction et chargement), ELT (extraction, chargement et transformation) ou ETL (extraction, transformation et chargement). Ce cours indique quel paradigme utiliser pour le traitement de données par lot en fonction du contexte. Il présente également plusieurs technologies Google Cloud de transformation des données, y compris BigQuery, l'exécution de Spark sur Dataproc, les graphiques de pipelines dans Cloud Data Fusion et le traitement des données sans serveur avec Dataflow. Les participants mettront en pratique les connaissances qu'ils auront acquises en créant des composants de pipelines de données sur Google Cloud à l'aide de Qwiklabs.

En savoir plus

Terminez le cours intermédiaire Créer une infrastructure avec Terraform sur Google Cloud pour recevoir un badge démontrant vos compétences dans les domaines suivants : les principes d'Infrastructure as Code (IaC) avec Terraform, le provisionnement et la gestion des ressources Google Cloud avec des configurations Terraform, la gestion efficace des états (local et distant) et la modularisation du code Terraform à des fins de réutilisabilité et d'organisation. Les badges de compétence valident vos connaissances sur des produits spécifiques lors d'ateliers pratiques et d'évaluations. Décrochez un badge en suivant un cours ou accédez directement à l'atelier challenge correspondant pour l'obtenir dès aujourd'hui. Les badges attestent de votre niveau de maîtrise, améliorent votre profil professionnel et, par conséquent, vous permettent d'accroître vos opportunités de carrière. Accédez à votre profil pour retrouver les badges que vous avez obtenus.

En savoir plus

Ce cours est une introduction à Terraform pour Google Cloud. Il permet aux participants de découvrir comment Terraform peut être utilisé pour implémenter une Infrastructure as Code, et comment appliquer certaines de ses fonctionnalités essentielles pour créer et gérer une infrastructure Google Cloud. Les participants mettront en pratique les connaissances qu'ils auront acquises en créant et en gérant des ressources Google Cloud à l'aide de Terraform.

En savoir plus

In the last installment of the Dataflow course series, we will introduce the components of the Dataflow operational model. We will examine tools and techniques for troubleshooting and optimizing pipeline performance. We will then review testing, deployment, and reliability best practices for Dataflow pipelines. We will conclude with a review of Templates, which makes it easy to scale Dataflow pipelines to organizations with hundreds of users. These lessons will help ensure that your data platform is stable and resilient to unanticipated circumstances.

En savoir plus

Intégrer le machine learning à des pipelines de données renforce la capacité à dégager des insights des données. Ce cours passera en revue plusieurs façons d'intégrer le machine learning à des pipelines de données sur Google Cloud. Vous découvrirez AutoML pour les cas ne nécessitant que peu de personnalisation (voire aucune), ainsi que Notebooks et BigQuery ML pour les situations qui requièrent des capacités de machine learning plus adaptées. Enfin, vous apprendrez à utiliser des solutions de machine learning en production avec Vertex AI.

En savoir plus

Ce cours est le premier d'une série en trois volets sur le traitement des données sans serveur avec Dataflow. Dans ce premier cours, nous allons commencer par rappeler ce qu'est Apache Beam et sa relation avec Dataflow. Ensuite, nous aborderons la vision d'Apache Beam et les avantages de son framework de portabilité, qui permet aux développeurs d'utiliser le langage de programmation et le backend d'exécution de leur choix. Nous vous montrerons aussi comment séparer le calcul du stockage et économiser de l'argent grâce à Dataflow, puis nous examinerons les interactions entre les outils de gestion de l'identification et des accès avec vos pipelines Dataflow. Enfin, nous verrons comment implémenter le modèle de sécurité adapté à votre cas d'utilisation sur Dataflow.

En savoir plus

Les lacs de données et les entrepôts de données sont les deux principaux composants des pipelines de données. Ce cours présente des cas d'utilisation de chaque type de stockage, ainsi que les détails techniques des solutions de lacs et d'entrepôts de données disponibles sur Google Cloud. Il décrit également le rôle des ingénieurs de données et les avantages d'un pipeline de données réussi sur les opérations commerciales, avant d'expliquer pourquoi il est important de procéder à l'ingénierie des données dans un environnement cloud. Il s'agit du premier cours de la série "Ingénierie des données sur Google Cloud". Après l'avoir terminé, inscrivez-vous au cours "Créer des pipelines de données en batch sur Google Cloud".

En savoir plus

Ce cours présente les produits et services Google Cloud pour le big data et le machine learning compatibles avec le cycle de vie "des données à l'IA". Il explore les processus, défis et avantages liés à la création d'un pipeline de big data et de modèles de machine learning avec Vertex AI sur Google Cloud.

En savoir plus