Back to Insights人工智能与机器学习

在2024年学习人工智能(第2部分,共5部分):掌握大型语言模型

Mercury Technology Solutions2023年12月29日3 min read

简而言之:深入探索大型语言模型(LLM)的世界,遵循结构化的学习路径。从基础数学到实际应用开发,本指南涵盖了掌握LLM所需的基本资源、课程和工具,包括从零开始实现模型、提示工程和微调。

探索大型语言模型的世界

随着我们深入探索大型语言模型(LLM)的非凡世界,理解这些基础框架对于任何希望在人工智能领域中脱颖而出的人来说都是至关重要的,特别是对于OpenAI的GPT及类似模型。在这里,我呈现了一条精心策划的掌握LLM的路线图,结合了视频教程、动手编码和全面指南。

从基础开始:入门资源

通过富有洞察力的演示开始你的旅程:

神经网络:从零到英雄

Andrej Karpathy的系列神经网络:从零到英雄是必看的。它涵盖了从编码反向传播到从零开始构建GPT模型的所有内容。对于那些渴望探索更多的人,请查看他最新的视频,了解如何构建GPT分词器。免费LLM训练营

全栈深度学习提供一个

免费的LLM训练营涵盖提示工程、LLMOps和快速启动LLM应用程序。使用LLM构建:应用开发

如果你准备使用LLM构建应用程序,这些资源是无价的:

观看

参加每周在

lablab.ai举行的人工智能黑客马拉松。如果你想合作,请告诉我!加深你的理解:阅读重要论文

Sebastian Raschka的

Sebastian Raschka’s 理解大型语言模型是一篇全面的文章,列出了重要的阅读论文。关注他的Substack,人工智能前沿

从零开始编写变换器

学习运行开源模型

利用ollama开始使用像Llama 2这样的模型。

掌握提示工程

探索提示工程 | Lil’Log并注册像ChatGPT提示工程开发者课程这样的课程。

微调LLMs

理解RAG

探索关于检索增强生成(RAG)的文章,例如构建基于RAG的LLM应用程序的综合指南

通过利用这些资源,您不仅会增强对LLMs的理解,还会获得创新和引领人工智能领域的实用技能。深入了解,让发现之旅开始!

Originally published on MTS Blog & Research