arrow_back

使用 Ops Agent 监控 Compute Engine (AWS)

登录 加入
访问 700 多个实验和课程

使用 Ops Agent 监控 Compute Engine (AWS)

实验 1 小时 universal_currency_alt 5 个积分 show_chart 入门级
info 此实验可能会提供 AI 工具来支持您学习。
访问 700 多个实验和课程

作为云管理员,您负责监控组织的基础设施。随着您开始在 Google Cloud 上开展运维,您应该能够从您的资源收集数据(比如日志和指标),针对这些数据设置提醒,并在信息中心直观呈现这些数据。

您关心的方面包括:

  • 如何为您部署的资源设置监控?
  • 如何配置指标以了解网络流量?
  • 如何针对指标创建提醒政策?
  • 如何让指标在信息中心直观呈现?

CloudWatch 工作流如下图所示。

AWS 图示

在 Amazon Web Services (AWS) 中,您需要在 Amazon Elastic Compute Cloud (EC2) 实例上安装 Amazon CloudWatch Agent,以便从应用及基础设施收集指标和日志。您可以使用 Amazon CloudWatch 配置日志和日志组,以便从资源收集日志数据您甚至可以配置一个或多个自定义指标,以监控基础设施的特定方面。

最后,您需要创建一个或多个警报来持续监控并在发生事件时通知管理员。

现在,您将探索如何在 Google Cloud 中监控您的基础设施。

概述

在本实验中,您将创建一个 Compute Engine 实例,以安装和配置 Ops Agent。您将生成流量,在预定义的 Apache 信息中心内查看指标,另外还要创建一条提醒政策。

目标

在本实验中,您将学习如何执行以下任务:

  • 创建一个 Compute Engine 虚拟机实例。
  • 安装 Apache Web 服务器。
  • 为 Apache Web 服务器安装和配置 Ops Agent。
  • 生成流量并在预定义的 Apache 信息中心内查看指标。
  • 创建提醒政策。

任务 1. 创建一个 Compute Engine 虚拟机实例

在此任务中,您将创建一个 Compute Engine 虚拟机实例,然后配置其机器类型、启动磁盘和防火墙规则,以允许 HTTP 和 HTTPS 流量。

  1. 在 Google Cloud 控制台的导航菜单 (“导航菜单”图标) 中,依次点击 Compute Engine > 虚拟机实例

  2. 如需创建虚拟机实例,请点击创建实例

按如下所示填写实例的各个字段:

  1. 点击机器配置,然后指定以下值:

    字段
    名称 quickstart-vm
    区域
    可用区
    系列 E2
    机器类型 e2-small
  2. 点击操作系统和存储空间

    • 启动磁盘映像:Debian GNU/Linux 12 (bookworm)
  3. 点击网络

    • 防火墙字段中,选择允许 HTTP 流量允许 HTTPS 流量

其他字段保留默认值。

  1. 点击创建。虚拟机准备就绪后,就会出现在“实例”标签页上的实例列表中。

点击检查我的进度以验证是否完成了以下目标:

创建一个 Compute Engine 虚拟机实例

任务 2. 安装 Apache Web 服务器

在此任务中,您将在 Compute Engine 虚拟机实例上部署 Apache Web 服务器。

  1. 如需打开连接到该实例的终端,请在连接列中点击 SSH。如果出现提示,请点击授权

  2. 如需更新实例上的软件包列表,请运行以下命令:

sudo apt-get update
  1. 如需安装 Apache2 HTTP 服务器,请运行以下命令:
sudo apt-get install apache2 php7.0 注意:如果上面的命令运行失败,请使用 sudo apt-get install apache2 php。如果系统询问您是否继续安装,请输入 Y。
  1. 打开浏览器,输入网址 http://EXTERNAL_IP,以便连接至您的 Apache2 HTTP 服务器,其中 EXTERNAL_IP 是您虚拟机的外部 IP 地址。您可以在虚拟机实例的外部 IP 列中找到此地址。
注意:如果出现提示,请点击继续访问网站

Apache2 正常运行

点击检查我的进度以验证是否完成了以下目标:

安装 Apache Web 服务器

任务 3. 安装并配置 Ops Agent

在此任务中,您将在虚拟机实例上安装 Ops Agent,并将其配置为从 Apache Web 服务器收集日志和指标。

如需从 Apache Web 服务器收集日志和指标,请使用终端安装 Ops Agent

  1. 如需打开连接到虚拟机实例的终端,请在连接列中点击 SSH。如果出现提示,请点击授权

  2. 如需安装 Ops Agent,请运行以下命令:

curl -sSO https://dl.google.com/cloudagents/add-google-cloud-ops-agent-repo.sh sudo bash add-google-cloud-ops-agent-repo.sh --also-install

您会看到 google-cloud-ops-agent 安装成功。

  1. 复制以下命令并将其粘贴到终端中:
# Configures Ops Agent to collect telemetry from the app and restart Ops Agent. set -e # Create a back up of the existing file so existing configurations are not lost. sudo cp /etc/google-cloud-ops-agent/config.yaml /etc/google-cloud-ops-agent/config.yaml.bak # Configure the Ops Agent. sudo tee /etc/google-cloud-ops-agent/config.yaml > /dev/null << EOF metrics: receivers: apache: type: apache service: pipelines: apache: receivers: - apache logging: receivers: apache_access: type: apache_access apache_error: type: apache_error service: pipelines: apache: receivers: - apache_access - apache_error EOF sudo service google-cloud-ops-agent restart sleep 60

上面的命令会创建用于从 Apache Web 服务器收集并提取日志和指标的配置。有关从 Apache Web 服务器提取日志的更多信息,请参阅为 Apache Web 服务器配置 Ops Agent

点击检查我的进度以验证是否完成了以下目标:

安装 Ops Agent

任务 4. 生成流量并查看指标

在此任务中,您将在 Apache Web 服务器上生成指标,并在自动创建的 Apache 概览信息中心查看指标数据。

如需在 Apache Web 服务器上生成指标,请执行以下操作:

  1. 在 Google Cloud 控制台的导航菜单 (“导航菜单”图标) 中,依次点击 Compute Engine > 虚拟机实例

  2. 连接列中,点击 SSH,打开连接到虚拟机实例的终端。如果出现提示,请点击授权

  3. 如需在您的 Apache Web 服务器上生成流量,请运行以下命令:

timeout 120 bash -c -- 'while true; do curl localhost; sleep $((RANDOM % 4)) ; done'

上面的命令每四秒钟会向 Apache Web 服务器发出一次请求,从而生成流量。

如需查看 Apache 概览信息中心,请执行以下操作:

  1. 在 Google Cloud 控制台的导航菜单 (“导航菜单”图标) 中,依次点击查看所有产品 > 可观测性 > 监控

  2. 在导航窗格中,选择信息中心

  3. 全部信息中心中,选择 Apache 概览信息中心。该信息中心即会打开。

在信息中心内,有几个图表包含 Apache 和 Compute Engine 集成的相关信息:

Apache 信息中心

任务 5. 创建提醒政策

在此任务中,您将设置电子邮件通知渠道,然后配置一条提醒政策来监控 Apache Web 服务器上的流量速率,并在速率超过 4 KiB/s 时发送电子邮件通知。

设置电子邮件通知渠道

  1. 在 Google Cloud 控制台的导航菜单 (“导航菜单”图标) 中,依次点击查看所有产品 > 可观测性 > 监控

  2. 点击提醒,然后点击修改通知渠道

  3. 邮件部分,点击新增,然后输入所需的邮箱。

  4. 显示名称中,再次复制并粘贴您的邮箱。

  5. 点击保存

配置提醒政策

  1. 在 Google Cloud 控制台中,点击可观测性中的提醒,然后点击创建政策

  2. 选择要监控的时序:

    • 点击选择一个指标,然后在过滤条件栏中输入虚拟机实例
    • 活跃指标类别列表中,选择 Apache
    • 活跃指标列表中,选择 workload/apache.traffic
    • 点击应用

系统会显示 Apache 流量图表。

  1. 转换数据部分,选择以下值并点击下一步

    • 滚动窗口1 min
    • 滚动窗口函数rate
  2. 配置提醒触发器部分,选择以下值并点击下一步

    • 提醒触发器Any time series violates
    • 阈值位置Above threshold
    • 阈值4000
  3. Configure notifications and finalize alert(配置通知并最终确定提醒)部分,选择以下值:

    • 通知渠道An email address you have access to
    • 突发事件自动关闭时长30 min
    • 为提醒政策命名Apache traffic above threshold
  4. 点击创建政策。您的提醒政策现已激活。

点击检查我的进度,验证已完成以下目标:

创建提醒政策

任务 6. 测试提醒政策

在此任务中,您将通过在 Apache Web 服务器上生成流量来测试提醒政策。您需要验证当流量速率超过配置的阈值时是否会发送电子邮件通知。

  1. 在 Google Cloud 控制台的导航菜单 (“导航菜单”图标) 中,依次点击 Compute Engine > 虚拟机实例

  2. 连接列中,点击 SSH,打开连接到虚拟机实例的终端。如果出现提示,请点击授权

  3. 在终端中输入以下命令:

timeout 120 bash -c -- 'while true; do curl localhost; sleep $((RANDOM % 4)) ; done'

上面的命令会在您的 Apache Web 服务器中生成流量。

当您 Apache Web 服务器中的流量速率超过 4 KiB/s 的阈值时,系统就会发送邮件通知。此过程可能需要几分钟时间才能完成。

您收到的电子邮件通知类似于下图所示:

通知提醒

恭喜!

在本实验中,您学习了如何在虚拟机上安装 Ops Agent 并用它来设置提醒政策,以通知接收方该实例的潜在问题。

Google Ops Agent 和 Amazon CloudWatch Agent 都是监控代理,让您能够从应用和基础设施收集指标和日志数据。这些信息反过来能够帮助用户监控云端应用和基础设施的健康状况和性能。这两种服务的异同之处如下:

相似之处:

  • Ops Agent 和 CloudWatch Agent 都允许用户从虚拟机实例收集日志和指标。
  • Ops Agent 和 CloudWatch Agent 都可以通过远程连接到虚拟机 (VM) 或通过相应的命令行界面 (CLI) 进行安装。
  • 在虚拟机上安装这些代理后,主机指标、进程指标和日志将自动路由到监控服务(Google Cloud 中为 Cloud Logging 和 Cloud Monitoring,AWS 中为 Amazon CloudWatch),无需用户干预。
  • 一旦数据被收集到 Cloud Logging 和 Cloud Monitoring 或 CloudWatch 中,用户可以通过相应的控制台(Google Cloud 中为 Cloud 控制台,AWS 中为 Amazon 管理控制台)在集中式信息中心直观呈现这些数据。

差异

  • 正如在 AWS 中一样,您也需要为 Ops Agent 创建一个配置文件以记录指标。在 AWS 中,该配置文件采用 JSON 格式,而在 Google Cloud 中,则使用基于 YAML 的默认统一配置。
  • 在 Google Cloud 中,您需要创建一条提醒政策,以便在事件发生时收到通知,而在 AWS 中,则需要使用警报。在 AWS 中,使用警报功能需要将一项通知服务(如 Simple Notification Service、Simple Queue Service 或 Simple Email Service)集成到 CloudWatch,才能在事件发生时收到通知。而在 Google Cloud 中,通知服务已集成到提醒政策中。
  • 安装 Ops Agent 或 CloudWatch Agent 后,日志和指标会自动路由到监控服务。Google Cloud 拥有两项专用的监控服务:用于处理日志的 Cloud Logging,以及用于处理指标的 Cloud Monitoring。在 AWS 中,这两项服务的功能合并在 Amazon CloudWatch 中。

结束实验

完成实验后,请点击结束实验。Google Cloud Skills Boost 会移除您使用过的资源并为您清理帐号。

系统会提示您为实验体验评分。请选择相应的星级数,输入评论,然后点击提交

星级数的含义如下:

  • 1 颗星 = 非常不满意
  • 2 颗星 = 不满意
  • 3 颗星 = 一般
  • 4 颗星 = 满意
  • 5 颗星 = 非常满意

如果您不想提供反馈,可以关闭该对话框。

如果要留言反馈、提出建议或做出更正,请使用支持标签页。

版权所有 2025 Google LLC 保留所有权利。Google 和 Google 徽标是 Google LLC 的商标。其他所有公司名称和产品名称可能是其各自相关公司的商标。

准备工作

  1. 实验会创建一个 Google Cloud 项目和一些资源,供您使用限定的一段时间
  2. 实验有时间限制,并且没有暂停功能。如果您中途结束实验,则必须重新开始。
  3. 在屏幕左上角,点击开始实验即可开始

使用无痕浏览模式

  1. 复制系统为实验提供的用户名密码
  2. 在无痕浏览模式下,点击打开控制台

登录控制台

  1. 使用您的实验凭证登录。使用其他凭证可能会导致错误或产生费用。
  2. 接受条款,并跳过恢复资源页面
  3. 除非您已完成此实验或想要重新开始,否则请勿点击结束实验,因为点击后系统会清除您的工作并移除该项目

此内容目前不可用

一旦可用,我们会通过电子邮件告知您

太好了!

一旦可用,我们会通过电子邮件告知您

一次一个实验

确认结束所有现有实验并开始此实验

使用无痕浏览模式运行实验

请使用无痕模式或无痕式浏览器窗口运行此实验。这可以避免您的个人账号与学生账号之间发生冲突,这种冲突可能导致您的个人账号产生额外费用。