Generative AI 模型,如 Large Language Model,往往超出消费级硬件的能力,而且运行成本高昂。通过量化等方法对模型进行压缩,可以使它们更高效、更快速、更易于访问。这样,它们就可以在包括智能手机、个人电脑和边缘设备在内的各种设备上运行,并将性能下降降到最低。 加入本课程: 1.使用 Quanto 库利用线性量化技术量化任何开源模型。了解线性量化的实现方式。这种量化形式可用于压缩任何模型,包括 LLM、视觉模型等。使用 Transformer 库应用 "downcasting",这是量化的另一种形式,它使您能够以 BFloat16 数据类型加载约为正常大小一半的模型。 在本课程结束时,您将掌握量化技术的基础,并能够应用这些技术压缩和优化自己的 Generative AI 模型,使它们更加 Accessibility 和高效。
了解顶级公司的员工如何掌握热门技能

在不到 2 个小时的时间内学习、练习和应用为就业做好准备的技能
- 接受行业专家的培训
- 获得解决实训工作任务的实践经验

关于此项目
学习方式
基于实践项目的学习
按照分步说明完成与工作相关的任务来练习新技能。
无需下载或安装
在云环境中访问您所需的工具和资源。
仅在台式计算机上可用
此项目专为具有可靠互联网连接的笔记本电脑或台式计算机而设计,而不是移动设备。
人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'

Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'

Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'

Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'
您可能还喜欢
- 状态:免费
DeepLearning.AI
- 状态:免费
DeepLearning.AI
- 状态:免费试用
Coursera Instructor Network
- 状态:免费
DeepLearning.AI
常见问题
在课程中,您将在交互式实践环境中按照一系列说明完成活动或场景。课程在真实云环境和各种产品的真实实例中完成,而不是在模拟或演示环境中完成。
购买课程后,您将获得完成该课程所需的一切信息,包括完成该课程所需的任意产品的临时访问权限。
虽然从技术上讲,您可以通过移动设备访问此课程,但我们强烈建议您仅在笔记本电脑或台式机上完成课程。