第3章 模型的基本介绍

本书的大部分内容是关于管理机器学习系统和生产级机器学习管道。这涉及的内容与许多数据科学家和机器学习研究人员经常进行的工作完全不同,他们试图花时间开发新的预测模型和方法,以多提升一个百分点的准确性。相反,在本书中,我们专注于确保包括机器学习模型在内的系统表现出一致、健壮[1]和可靠的系统级行为。在某些方面,这种系统级行为与实际的模型类型、模型的好坏或其他仅与模型有关的考虑因素无关。然而,在某些关键情况下,它并不独立于这些因素。本章的目标是给你提供足够的背景知识,让你了解当你的生产系统的警报开始响起或传呼机开始响起时,你处于哪种情况。

我们一开始就说,我们的目标不是教你如何构建机器学习模型、哪些模型可能适合什么问题,或者如何成为一个数据科学家。这本身就是一本(或更多)书的内容,许多优秀的文章和在线课程都涵盖了这些方面。

在这一章中,我们的目标是快速提醒大家什么是机器学习模型,以及它们是如何工作的,而不是深入这些细枝末节。我们还将提供一些机器学习运维(MLOps)人员应该会问到的关于系统中的模型的关键问题,以便他们能够了解这些问题并进行适当的计划。