gpt-oss 是 OpenAI 推出的一系列開(kāi)源模型,旨在支持強(qiáng)大的推理、代理任務(wù)和通用開(kāi)發(fā)者使用場(chǎng)景。該系列模型提供了兩種不同規(guī)模的模型:gpt-oss-120b 和 gpt-oss-20b,分別適用于生產(chǎn)環(huán)境和低延遲、本地或特定用途的場(chǎng)景。這些模型在訓(xùn)練過(guò)程中使用了 OpenAI 的 harmony 響應(yīng)格式,并且僅支持該格式的輸入,否則無(wú)法正常工作。
- gpt-oss開(kāi)源項(xiàng)目地址:https://github.com/openai/gpt-oss
- gpt-oss官網(wǎng)入口網(wǎng)址:https://openai.com/zh-Hans-CN/open-models/

gpt-oss 模型具有多項(xiàng)優(yōu)勢(shì),包括可配置的推理能力、完整的鏈?zhǔn)酵评磉^(guò)程、可微調(diào)的模型、代理能力、MXFP4 量化支持等。這些特性使得模型在推理效率和性能上具有顯著優(yōu)勢(shì)。此外,模型采用 Apache 2.0 許可,允許自由使用、定制和商業(yè)部署。
用戶(hù)可以通過(guò)多種方式使用 gpt-oss,包括使用 Transformers 庫(kù)、vLLM、Ollama、LM Studio 等工具進(jìn)行推理。此外,gpt-oss 提供了多種參考實(shí)現(xiàn),包括 PyTorch、Triton、Metal 等,以滿(mǎn)足不同硬件和場(chǎng)景的需求。
gpt-oss 是一個(gè)開(kāi)源、高性能的模型系列,適合開(kāi)發(fā)者和研究人員在多種場(chǎng)景下進(jìn)行推理和開(kāi)發(fā)。
相關(guān)導(dǎo)航
暫無(wú)評(píng)論...



