参加我们的新短期课程《高效服务 Large Language Model》,从 Predibase 首席技术官 Travis Addair 那里了解如何为 LLM 应用程序提供服务。无论您是准备推出自己的应用程序,还是刚刚开始构建应用程序,本课程中您将探索的主题都将加深您对 LLM 如何工作的基础知识,并帮助您更好地理解在构建将为大量用户提供服务的 LLM 应用程序时必须考虑的性能权衡。 您将学习使 LLM 供应商能够高效地为众多客户提供模型服务的最重要的优化,包括同时处理多个微调模型的策略。在本课程中,您将: 1.了解自动 Regression 大语言模型如何一次一个 token 地生成文本。2. 在代码中实现现代 LLM 推理 Stack 的基本要素,包括 KV 缓存、连续 Batch 和模型量化,并对它们对推理 Throughput 和 Latency 的影响进行基准测试。3. 探索 LoRA 适配器的工作细节,了解批处理技术如何允许同时向多个客户提供不同的 LoRA 适配器。亲身体验 Predibase 的 LoRAX 框架推理服务器,了解这些优化技术在实际 LLM 推理服务器中的应用。 更多地了解 LLM 服务器如何在引擎盖下运行,将极大地增强您对提高 LLM 驱动的应用程序性能和效率的各种选项的理解。


了解顶级公司的员工如何掌握热门技能

在不到 2 个小时的时间内学习、练习和应用为就业做好准备的技能
- 接受行业专家的培训
- 获得解决实训工作任务的实践经验

关于此项目
位教师

学习方式
基于实践项目的学习
按照分步说明完成与工作相关的任务来练习新技能。
无需下载或安装
在云环境中访问您所需的工具和资源。
仅在台式计算机上可用
此项目专为具有可靠互联网连接的笔记本电脑或台式计算机而设计,而不是移动设备。
人们为什么选择 Coursera 来帮助自己实现职业发展

Felipe M.
自 2018开始学习的学生
''能够按照自己的速度和节奏学习课程是一次很棒的经历。只要符合自己的时间表和心情,我就可以学习。'

Jennifer J.
自 2020开始学习的学生
''我直接将从课程中学到的概念和技能应用到一个令人兴奋的新工作项目中。'

Larry W.
自 2021开始学习的学生
''如果我的大学不提供我需要的主题课程,Coursera 便是最好的去处之一。'

Chaitanya A.
''学习不仅仅是在工作中做的更好:它远不止于此。Coursera 让我无限制地学习。'
您可能还喜欢
- 状态:免费
DeepLearning.AI
- 状态:免费
DeepLearning.AI
- 状态:免费试用
Duke University
- 状态:免费试用
Duke University
常见问题
在课程中,您将在交互式实践环境中按照一系列说明完成活动或场景。课程在真实云环境和各种产品的真实实例中完成,而不是在模拟或演示环境中完成。
购买课程后,您将获得完成该课程所需的一切信息,包括完成该课程所需的任意产品的临时访问权限。
虽然从技术上讲,您可以通过移动设备访问此课程,但我们强烈建议您仅在笔记本电脑或台式机上完成课程。