将您的 Amazon Forecast 使用迁移到 Amazon SageMaker Canvas
将 Amazon Forecast 迁移至 Amazon SageMaker Canvas
by Nirmal Kumar Biswanath Hore Dan Sinnreich 和 Davide Gallitelli 于 2024年7月29日发布在 Amazon Forecast,Amazon SageMaker Canvas,技术指南 永久链接评论
关键要点
从2024年7月29日起,Amazon 将停止新客户访问 Amazon Forecast,现有客户可继续使用。使用 Amazon SageMaker Canvas 作为替代方案,提供更快的模型构建、更低的成本及更好的透明度。SageMaker Canvas 支持一系列机器学习模型及时间序列预测,适用于不具备机器学习专业知识的用户。本文提供如何将现有的 Forecast 用例迁移至 SageMaker Canvas 的详细步骤。经过深思熟虑,我们决定自2024年7月29日起停止新客户访问 Amazon Forecast。而现有的 Amazon Forecast 用户仍可正常使用该服务。AWS 将继续为 Amazon Forecast 投资于安全性、可用性和性能的改进,但我们不打算推出新功能。
Amazon Forecast 是一个完全托管的服务,利用统计和机器学习ML算法提供高精度的时间序列预测。自2019年8月推出以来,Forecast 早于流行的Amazon SageMaker Canvas,该工具提供了构建、定制和部署 ML 模型包括时间序列预测模型的低代码和无代码解决方案。
通过 SageMaker Canvas,您可以获得更快的模型构建、具有成本效益的预测、模型排行榜和算法选择等高级功能,以及更高的透明度。您可以选择使用 SageMaker Canvas 用户界面,无需编写任何代码或具备任何 ML 专业知识即可构建和部署模型,或使用其自动机器学习AutoMLAPI进行编程交互。
在本文中,我们将概述 SageMaker Canvas 的优势以及 Forecast 用户如何将用例迁移至 SageMaker Canvas。
SageMaker Canvas 的优势
Forecast 客户希望获得更高的透明度、更低的成本、更快的训练速度和增强的控制能力来构建时间序列 ML 模型。针对这些反馈,我们在 SageMaker Canvas 中提供了下一代时间序列预测功能,而 SageMaker Canvas 已经为准备数据和构建及部署 ML 模型提供了强大的平台。通过增加预测功能,您现在可以在 SageMaker Canvas 的统一用户友好平台中访问广泛的 ML 能力,包括回归、多类分类、计算机视觉CV、自然语言处理NLP和生成性人工智能AI等诸多模型类型。
SageMaker Canvas 提供的模型构建性能较 Forecast 提高了 50,时间序列模型的平均预测速度也提高了 45 相比于Forecast。生成预测的成本比 Forecast 低得多,因为成本仅基于使用的Amazon SageMaker 计算资源。此外,SageMaker Canvas 通过提供对训练模型的直接访问实现卓越的模型透明度,您可以在选择的位置部署模型,并获得多种模型洞察报告,包括验证数据、模型和项目级性能指标,以及训练期间使用的超参数。
SageMaker Canvas 包含 Forecast 中发现的关键功能,包括使用统计和神经网络算法训练预测模型的能力。它通过为每种算法生成基础模型,评估其性能,然后将表现最佳的模型组合成一个集成模型,从而为您的数据集创建最佳模型。这种方法利用不同模型的优势,产生更准确和稳健的预测。您可以灵活地选择一个或多个算法进行模型创建,并能够评估模型特征对预测准确性的影响。SageMaker Canvas 通过自动解决方案简化数据准备,以填充缺失值,使您的预测工作尽可能无缝。它简化了通过简单的用户界面选项或 API 配置集成外部信息的过程,例如特定国家的节假日。您还可以利用其数据流功能,连接外部数据提供商的 API 导入数据,例如天气信息。此外,您还可以直接在 SageMaker Canvas 用户界面中进行“假设分析”,探索各种场景如何影响您的结果。
我们将继续创新,通过 SageMaker Canvas 提供领先的预测能力,降低延迟,减少训练和预测成本,提高准确性。这包括扩展支持的预测算法范围并结合新的高级算法,以进一步增强模型构建和预测体验。
蓝鲸加速器官网下载从 Forecast 过渡到 SageMaker Canvas
今天,我们发布了一个过渡包,其中包含两个资源,以帮助您将使用从 Forecast 过渡到 SageMaker Canvas。第一个组件包括一个研讨会,让您亲身体验 SageMaker Canvas 用户界面和 API,并学习如何将使用从 Forecast 过渡到 SageMaker Canvas。我们还提供了一个 Jupyter 笔记本,展示如何将现有的 Forecast 训练数据集转为 SageMaker Canvas 格式。
在了解如何使用您的 Forecast 输入数据集在 SageMaker Canvas 中构建预测模型之前,让我们了解 Forecast 和 SageMaker Canvas 之间的一些关键差异:
关键差异ForecastSageMaker Canvas数据集类型使用多个数据集仅需要一个数据集模型调用需要先创建预测,再查询可通过 UI 或 API 直接调用模型使用 SageMaker Canvas UI 构建和部署模型
我们建议您重新组织数据源,以便直接创建一个可用于 SageMaker Canvas 的单一数据集。参考 Time Series Forecasts in Amazon SageMaker Canvas 以指导您构建预测模型所需的输入数据集的结构。然而,如果您希望继续使用多个数据集,如同在 Forecast 中那样,您可以选择以下选项将它们合并为一个 SageMaker Canvas 支持的单一数据集:
SageMaker Canvas UI 使用 SageMaker Canvas 用户界面将目标时间序列、相关时间序列和项目元数据数据集合并为一个数据集。以下截图展示了在 SageMaker Canvas 中创建的数据流示例,将这三个数据集合并成一个 SageMaker Canvas 数据集。
Python 脚本 使用 Python 脚本合并数据集。有关将多个 Forecast 数据集转换为 SageMaker Canvas 数据集的示例代码和实际经验,请参考该 研讨会。
准备好数据集后,使用 SageMaker 控制台中的 SageMaker Canvas UI 将数据集导入 SageMaker Canvas 应用程序,应用 AutoML 进行训练、构建和部署模型以进行推断。该研讨会展示了如何合并您的数据集并构建预测模型。
构建模型后,有多种方式可以生成和使用预测:
在应用内预测 您可以使用 SageMaker Canvas 用户界面生成预测,并通过内置集成将其导出到 Amazon QuickSight,也可以将预测文件下载到本地桌面。您还可以从 SageMaker Canvas 配置存储模型工件、数据集和其他应用数据的 Amazon Simple Storage Service (Amazon S3) 存储位置访问生成的预测。请参考 配置您的 Amazon S3 存储 了解更多关于 SageMaker Canvas 使用的 Amazon S3 存储位置的信息。

将模型部署到 SageMaker 端点 您可以直接从 SageMaker Canvas 用户界面将模型部署到 SageMaker 实时端点。这些端点可以通过几行代码由开发人员在其应用程序中查询。您可以更新现有应用程序中的代码以调用已部署的模型,更多详细信息请参考该研讨会。
使用 SageMaker Canvas (Autopilot) API 构建和部署模型
您可以使用提供的示例代码在 GitHub 仓库中的笔记本 中处理您的数据集,包括目标时间序列数据、相关时间序列数据和项目元数据,将它们处理成 SageMaker Canvas API 所需的单一数据集。
接下来,使用 SageMaker AutoML API 进行时间序列预测的处理、模型训练和程序化部署。有关如何训练时间序列模型并使用模型生成预测的详细实现,请参考 GitHub 仓库中的示例笔记本。
该 研讨会 提供更多的实际经验。
结论
在本文中,我们概述了从 Forecast 过渡并在 SageMaker Canvas 中构建时间序列 ML 模型的步骤,并提供了数据转换的笔记本和通过研讨会的指导。过渡后,您可以享受更易访问的用户界面、更具成本效益和更高的模型透明性,便于在组织内实现时间序列预测,节省模型训练和部署的时间和资源。
您可以通过 SageMaker 控制台访问 SageMaker Canvas。对于所有 SageMaker Canvas 可用区域的时间序列预测,均可在各个对应地区使用。如需了解有关 AWS 区域可用性的更多信息,请参见 AWS 按区域提供的服务。
资源
有关更多信息,请参见以下资源:
参考 研讨会,以获取 SageMaker Canvas 的实际经验参考 Time Series Forecasts in Amazon SageMaker Canvas 获取有关使用 SageMaker Canvas UI 进行时间序列预测的信息参考 使用 API 创建时间系列预测的 AutoML 作业 获取有关使用 SageMaker Canvas API 进行时间序列预测的信息参考 使用 Amazon SageMaker Autopilot 进行时间序列预测 GitHub 上的示例笔记本,用于演示训练时间序列模型和使用 AutoML API 生成预测的样例实现若想了解如何在预测模型中纳入天气数据,请见 使用天气数据提高使用 Amazon SageMaker Canvas 预测的准确性若想了解如何设置预测模型的监控以防准确性漂移并自动根据漂移阈值重新训练模型,请参见 使用 Amazon SageMaker Autopilot 自动化时间序列性能监控和再训练 GitHub 上的资源作者介绍
Nirmal Kumar是 Amazon SageMaker 服务的高级产品经理。他致力于拓宽 AI/ML 的可达性,推动无代码和低代码 ML 解决方案的发展。在工作之外,他喜欢旅行和阅读非虚构类书籍。
Dan Sinnreich 是 Amazon SageMaker 的高级产品经理,专注于扩展无代码/低代码服务。他致力于使 ML 和生成性 AI 更加可达并将其应用于解决复杂问题。在业余时间,他喜欢打曲棍球、潜水和阅读科幻小说。
Davide Gallitelli 是 EMEA 区域 AI/ML 的专业解决方案架构师。他驻扎在布鲁塞尔,密切与 Benelux 的客户合作。他自幼便是开发者,七岁开始编写代码。在大学的后期学习中,他开始接触 AI/ML,此后便深深迷恋于此。
Biswanath Hore 是亚马逊网络服务AWS的解决方案架构师。他与客户早期的 AWS 旅程密切合作,帮助他们采用云解决方案以满足其业务需求。他对机器学习充满热情,并且在工作之外喜欢与家人共度时光。