跳到主要内容

开始之前 - 面向云和 AI 的并行可观测性

本页面介绍了在阅读管道和可观测性文档之前所需的先决条件、工具及概念模型。无论您是正在 Datadog 中配置日志采集,还是在 Galileo 中追踪大型语言模型 (LLM) 调用,抑或两者兼而有之,都请从这里开始。

本节涵盖内容

本文档涵盖两个互补的可观测性工作流:

  1. 使用 Datadog 进行运维日志采集与路由

    • 通过 Datadog 日志采集应用程序接口 (API) 从云应用采集 JSON 日志,应用管道处理器,并将数据路由到下游目标。
  2. 使用 Galileo 进行 LLM 追踪与评估

    • 通过 Galileo 软件开发工具包 (SDK) 对 AI 驱动的服务进行插桩,以捕获每次 LLM 调用的追踪、跨度及评估指标。

请按推荐顺序阅读文档:

先了解概念

事件流与可观测性管道

接着学习摄入 API

使用 Datadog 日志摄入 API 摄入事件

然后按照动手指南操作

使用 Datadog 和 Galileo 路由云应用日志

所需工具

用于 Datadog 日志摄入

  • cURL 或 Postman—使用这些工具向 Datadog 日志摄入 API 发送 API 请求。
  • 终端或 shell—macOS、Linux 或 Windows PowerShell 均可。
  • jq(可选但推荐)—使用此工具在发送前验证 JSON 有效负载。

用于 Galileo LLM 追踪

  • Python 3.8+Node.js 18+ — Galileo SDK 同时支持这两种环境。

  • pipnpm — 使用这些工具安装 SDK。

    pip install galileo
  • 代码编辑器,建议使用 VS Code (CursorAntigravityCodex 均为可接受的替代方案)。

所需凭据

Datadog

凭据获取位置
API 密钥Datadog → 组织设置API 密钥
Datadog 网站地址取决于您的地区,例如 datadoghq.com(美国)或 datadoghq.eu(欧盟)。 参见 Datadog 站点

Galileo

凭据获取位置
API 密钥app.galileo.ai设置API 密钥
项目名称在 Galileo 中创建新项目时生成
日志流名称按环境创建,例如 devstagingproduction

请参阅 Galileo 文档中的 如何查找我的项目密钥?

本文档的适用对象

角色主要用途
平台工程师构建和维护可扩展的 Datadog 日志管道
站点可靠性工程师 (SRE) 和 DevOps 人员规范化日志、减少噪声,并配置路由和告警
AI 和机器学习 (ML) 工程师使用 Galileo 对 LLM 服务进行监控,并评估模型质量
安全工程师将审计和身份验证日志路由至安全信息和事件管理(SIEM)目标
开发人员无需深入了解基础设施即可发送应用日志并追踪 LLM 调用

您应具备的知识

本文档假设您:

  • 基本了解 JSON
  • 熟悉运行命令行命令
  • 对日志、事件或指标有基本了解
  • 了解云或微服务环境

如果您之前从未发送过 POST 请求,动手指南将逐步引导您完成该过程。

概念模型

本节中的所有工作流均遵循双轨可观测性模型:

可观测性管道架构

Datadog 负责处理您的 运维遥测数据,包括基础设施日志、错误率、路由规则和告警。

Galileo 负责处理您的 AI 遥测数据,包括 LLM 输入和输出、每个跨度(span)的延迟以及评估分数。

二者结合,可为现代云应用的两个层级提供全栈可视性。