模型

概述

OpenAI API 依托于多种具备不同能力点和定位的模型提供支持。此外，您还可以利用微调（fine-tuning）技术，针对特定的应用场景，对我们基础的原生模型进行有限度的定制化开发。

模型	描述
GPT-4 Beta	一套在 GPT-3.5 基础上改良的模型，擅长理解并生成自然语言或代码
GPT-3.5	一组改进 GPT-3 的模型，能够理解并生成自然语言或代码
DALL·E Beta	能够依据自然语言提示生成并编辑图像的模型
Whisper Beta	可将音频转换为文本的模型
Embeddings	一组可以将文本转换为数值形式的模型
Codex Limited Beta	一组能够理解和生成代码的模型，包含将自然语言转为代码的能力
Moderation	用于检测文本是否敏感或存在安全风险的微调模型
GPT-3	一组可以理解和生成自然语言的模型

我们还发布了开源模型，涵盖 Point-E、Whisper、Jukebox 以及 CLIP。

访问研究人员模型索引深入了解我们研究论文中提及的模型，以及 InstructGPT 和 GPT-3.5 等系列模型之间的细微差别。

持续更新的模型

随着 gpt-3.5-turbo 的发布，我们部分模型目前正在进行持续迭代更新。同时，我们提供静态版本模型，开发者在新版模型推出后，仍可继续使用旧版至少三个月。配合模型更新的新节奏，我们也欢迎用户贡献评估，协助我们优化不同场景下的模型表现。若您感兴趣，不妨查看 OpenAI Evals 代码仓库。

以下模型属于临时快照，一旦新版本上线，我们将公布具体的弃用日期。若想使用最新的模型版本，请直接使用标准名称，如 gpt-4 或 gpt-3.5-turbo。

Model name（GPT 模型）	Discontinuation date（停用时间）	Replacement model（替换的 GPT 模型）
gpt-3.5-turbo-0301	09/13/2023	gpt-3.5-turbo-0613
gpt-4-0314	09/13/2023	gpt-4-0613
gpt-4-32k-0314	09/13/2023	gpt-4-32k-0613

前往我们的弃用页面获取更多关于模型生命周期终止的资讯。

GPT-4 Limited beta

GPT-4 是一款大型多模态模型（现阶段接收文本输入并输出文本，未来将支持图像输入），凭借更广泛的通用知识和高级推理能力，它能比我们以往的任何模型更精准地破解难题。与 gpt-3.5-turbo 类似，GPT-4 针对对话场景进行了优化，同时也适用于传统的补全任务。请参阅我们的会话补全指南学习如何使用 GPT-4。

注意

GPT-4 目前处于 Limited beta 阶段，仅限获得授权的用户访问。请加入候补名单，以便在容量开放时获取访问权限。

MODEL	描述	最大 tokens 数	训练数据
gpt-4	性能超越任何 GPT-3.5 模型，胜任更复杂的任务，并针对对话进行了优化。将随我们最新的模型迭代自动更新。	8,192 个 tokens	截至 2021 年 9 月
gpt-4-0613	2023 年 6 月 13 日的 `gpt-4` 快照，包含函数调用数据。不同于 `gpt-4`，此版本不会接收更新，并将在新版发布后 3 个月弃用。	8,192 个 tokens	截至 2021 年 9 月
gpt-4-32k	功能与基础版 `gpt-4` 一致，但上下文长度扩大了 4 倍。将随我们最新的模型迭代自动更新。	32,768 个 tokens	截至 2021 年 9 月
gpt-4-32k-0613	2023 年 6 月 13 日的 `gpt-4-32k` 快照。不同于 `gpt-4-32k`，此版本不会接收更新，并将在新版发布后 3 个月弃用。	32,768 个 tokens	截至 2021 年 9 月

对于许多基础任务，GPT-4 与 GPT-3.5 模型之间的差别并不明显。然而，在处理更复杂的推理场景时，GPT-4 比我们之前的任何型号都更具优势。

GPT-3.5

GPT-3.5 系列模型能够理解和生成自然语言或代码。在 GPT-3.5 家族中，功能最强大且最具成本效益的型号当属 gpt-3.5-turbo，它主要针对聊天进行了优化，但也胜任传统的补全任务。

LATEST MODEL（最新模型）	描述	最大 tokens 数	训练数据
gpt-3.5-turbo	性能最强的 GPT-3.5 型号，专为对话优化，成本仅为 `text-davinci-003` 的 1/10。将随我们最新的模型迭代自动更新。	4096 tokens	截至 2021 年 9 月
gpt-3.5-turbo-16k	功能与标准版 `gpt-3.5-turbo` 一致，但上下文长度是后者的 4 倍。	16,384 tokens	截至 2021 年 9 月
gpt-3.5-turbo-0613	2023 年 6 月 13 日的 `gpt-3.5-turbo` 快照，包含函数调用数据。不同于 `gpt-3.5-turbo`，此版本不会接收更新，并将在新版发布后 3 个月弃用。	4096 tokens	截至 2021 年 9 月
gpt-3.5-turbo-16k-0613	2023 年 6 月 13 日的 `gpt-3.5-turbo-16k` 快照。不同于 `gpt-3.5-turbo-16k`，此版本不会接收更新，并将在新版发布后 3 个月弃用。	16,384 tokens	截至 2021 年 9 月
text-davinci-003	能以比 curie、babbage、ada 模型更优的质量、更长的输出和一致的指令遵循来完成任何语言任务。还支持在文本中插入补全。	4097 tokens	截至 2021 年 6 月
text-davinci-002	功能与 `text-davinci-003` 相似，但通过监督微调而非强化学习进行训练。	4097 tokens	截至 2021 年 6 月
code-davinci-002	针对代码完成任务进行了优化。	8001 tokens	截至 2021 年 6 月

我们建议优先使用 gpt-3.5-turbo 而非其他 GPT-3.5 模型，因为它的性价比更高。

注意

OpenAI 模型具有不确定性，这意味着相同的输入可能产生不同的输出。将温度（Temperature）设置为 0 会使输出大部分具有确定性，但可能仍会保留少量变数。

特定功能模型

尽管新的 gpt-3.5-turbo 模型主要针对对话进行了优化，但它在处理传统的补全任务时同样表现出色。原始的 GPT-3.5 模型则是针对文本补全进行了优化。

我们用于创建嵌入（Embedding）和编辑文本的端点拥有各自专属的一组模型。

找到合适的模型

使用 gpt-3.5-turbo 进行初步试验是了解 API 功能的良好途径。在明确了您的实现目标后，您可以继续沿用 gpt-3.5-turbo 或尝试其他模型，并围绕其功能进行优化。

您可以使用 GPT 比较工具，并排运行不同的模型以对比输出、设置和响应时间，随后将数据导出至 Excel 表格中进行分析。

DALL·E Beta

DALL·E 是一款人工智能系统，能够根据自然语言的描述生成逼真的图像和艺术作品。目前我们支持在提示词的情况下创建特定尺寸的新图像、编辑现有图像，或生成用户所提供图像的变体。

通过 API 提供的当前 DALL·E 模型是第 2 代，相比初代模型，其生成的图像更加逼真、精准，且分辨率提高了 4 倍。您可以通过我们的实验室界面或 API 进行试用。

Whisper Beta

Whisper 是一款通用的语音识别模型。它在大量不同音频的数据集上进行训练，也是一个多任务模型，可执行多语言语音识别以及语音翻译和语言识别。目前，通过我们的 API（模型名为 whisper-1）使用的是 Whisper v2-large 模型。

现阶段，Whisper 的开源版本与通过 API 提供的版本并无二致。不过，通过我们的 API，我们提供了优化的推理过程，这使得利用 API 运行 Whisper 比其他方式快得多。关于 Whisper 的更多技术细节，您可以阅读论文。

嵌入

嵌入是文本的数字化表示，可用于衡量两段文本之间的关联性。我们的第二代嵌入模型 text-embedding-ada-002 旨在以极低的成本替代之前的 16 种第一代模型。嵌入技术可应用于搜索、聚类、推荐、异常检测和分类任务。您可以在公告博客文章中阅读有关我们最新嵌入模型的更多信息。

Codex

Codex 模型是我们 GPT-3 模型的继任者，能够理解和生成代码。其训练数据包含自然语言以及来自 GitHub 的数十亿行公共代码。了解更多。

它精通 JavaScript、Go、Perl、PHP、Ruby、Swift、TypeScript、SQL，甚至 Shell 等十几种语言。

我们目前提供两种 Codex 型号：

MODEL	描述	最大 tokens 数	训练数据
code-davinci-002	功能最强大的 Codex 型号。特别擅长将自然语言翻译成代码。除了补全代码，还支持在代码中插入补全。	8001 tokens	截至 2021 年 6 月
code-cushman-001	几乎与 Davinci Codex 一样强大，但速度稍快。这种速度优势使其可能成为实时应用的首选。	最多 2048 个 tokens

更多信息，请访问我们的 Codex 使用指南。

在有限测试期间，Codex 模型可免费使用，但受较低的速率限制约束。当我们了解使用情况后，将寻求制定定价策略以支持广泛的应用程序。

在此期间，只要符合我们的使用政策，欢迎您部署您的应用程序。我们欢迎在早期使用这些模型时提供任何反馈，并期待与社区互动。

特定功能模型

主要的 Codex 模型旨在与文本补全端点配合使用。我们还提供专门的模型用于我们的端点以创建嵌入和编辑代码。

审核

审核模型旨在检查内容是否符合 OpenAI 的使用政策。这些模型提供了查找以下类别内容的分类功能：仇恨、仇恨/威胁、自残、性、性/未成年人、暴力和暴力/图片。您可以在我们的审核指南中找到更多信息。

OpenAI 官方帮助文档中文版（模型篇）

OpenAI 官方帮助文档中文版（模型篇）

模型

概述

持续更新的模型

GPT-4 Limited beta

GPT-3.5

特定功能模型

找到合适的模型

DALL·E Beta

Whisper Beta

嵌入

Codex

特定功能模型

审核

OpenAI 官方帮助文档中文版（模型篇）

模型

概述​

持续更新的模型​

GPT-4 Limited beta​

GPT-3.5​

特定功能模型​

找到合适的模型​

DALL·E Beta​

Whisper Beta

嵌入​

Codex​

特定功能模型​

审核​

概述

持续更新的模型

GPT-4 Limited beta

GPT-3.5

特定功能模型

找到合适的模型

DALL·E Beta

嵌入

Codex

特定功能模型

审核