好书!卡内基梅隆大学的一本新书:生产线上的机器学习:从模型到产品(Machine Learning in Production: From Models to Products)
构建和部署使用机器学习的产品极具挑战性。咨询师报告称,87%的机器学习项目失败,53%的机器学习项目未能从原型进入生产。使用机器学习技术构建精确的模型已非常困难,但构建产品和业务还需要收集正确的数据,围绕模型构建整个软件产品,保护用户免受模型错误造成的伤害,以及成功部署、扩展和操作使用机器学习模型的产品。成功实现这一目标需要多种技能,包括数据科学和统计学,还需要领域专业知识和数据管理技能、软件工程能力、业务技能,并且通常还需要有关用户体验设计、安全性、保障和道德方面的知识。
在本书中,我们重点介绍构建和部署带有机器学习组件的软件产品的工程方面,从使用基于笔记本中某些示例训练的简单决策树,到使用复杂的自动化管道训练的深度神经网络,再到提示大型语言模型。我们讨论了机器学习为软件项目带来的新挑战以及如何应对这些挑战。我们探讨了数据科学家和软件工程师如何更好地合作、更好地相互理解,以构建原型模型和可用于生产的系统。我们采用工程思维:构建可用、可靠、可扩展、负责任、安全、有保障的系统——但同时也要考虑权衡、不确定性、时间压力、预算限制和不完整信息。我们广泛讨论了如何负责任地设计产品以保护用户免受伤害,包括安全、保障、公平和问责问题。
访问:mlip-cmu.github.io/book/01-introduction.html
#普通人怎么用DeepSeek# #deepseek# #ai创造营#
构建和部署使用机器学习的产品极具挑战性。咨询师报告称,87%的机器学习项目失败,53%的机器学习项目未能从原型进入生产。使用机器学习技术构建精确的模型已非常困难,但构建产品和业务还需要收集正确的数据,围绕模型构建整个软件产品,保护用户免受模型错误造成的伤害,以及成功部署、扩展和操作使用机器学习模型的产品。成功实现这一目标需要多种技能,包括数据科学和统计学,还需要领域专业知识和数据管理技能、软件工程能力、业务技能,并且通常还需要有关用户体验设计、安全性、保障和道德方面的知识。
在本书中,我们重点介绍构建和部署带有机器学习组件的软件产品的工程方面,从使用基于笔记本中某些示例训练的简单决策树,到使用复杂的自动化管道训练的深度神经网络,再到提示大型语言模型。我们讨论了机器学习为软件项目带来的新挑战以及如何应对这些挑战。我们探讨了数据科学家和软件工程师如何更好地合作、更好地相互理解,以构建原型模型和可用于生产的系统。我们采用工程思维:构建可用、可靠、可扩展、负责任、安全、有保障的系统——但同时也要考虑权衡、不确定性、时间压力、预算限制和不完整信息。我们广泛讨论了如何负责任地设计产品以保护用户免受伤害,包括安全、保障、公平和问责问题。
访问:mlip-cmu.github.io/book/01-introduction.html
#普通人怎么用DeepSeek# #deepseek# #ai创造营#