模型微调

重磅上新

潞晨云：微调SDK

完美兼容 Tinker 范式，将大模型训练还原为极简的 Python 函数调用。

本地定义模型逻辑，云端毫秒级调度异构算力集群, 打通从 SFT 到 RL 的全链路。

重磅上新

潞晨云：微调SDK

完美兼容 Tinker 范式，将大模型训练还原为极简的 Python 函数调用。

本地定义模型逻辑，云端毫秒级调度异构算力集群, 打通从 SFT 到 RL 的全链路。

重磅上新

潞晨云：微调SDK

完美兼容 Tinker 范式，将大模型训练还原为极简的 Python 函数调用。

本地定义模型逻辑，云端毫秒级调度异构算力集群, 打通从 SFT 到 RL 的全链路。

核心功能

SFT 与 RL 全链路支持

自定义 Loss 与 Reward 函数，完全掌控训练循环
支持构建 PPO、GRPO、DPO 等强化学习（RLHF/RLAIF）训练流
提供 DeepSeek R1 等前沿模型 Cookbook

灵活微调，拒绝黑盒

兼容 Tinker 范式，本地定义算法逻辑，云端执行
简单 import hpcai + API Key 即可使用
学习成本低，现有代码改动 < 10 行

底层加速，工业级稳定

Colossal-AI 驱动, 异构集群自动调度与并行加速
支持工业级长序列训练，显著减少显存占用
智能持久化队列，支持断点续训与自动恢复

按 Token 计费，拒绝空转

Serverless 架构，按Tokens消耗付费
零运维负担，只为有效计算买单
相比传统租卡模式，实测RL实验成本降低至 1/10

应用场景

无需再为 NCCL 握手或节点掉线值守凌晨。单机代码零改动，即可透明扩展至数十张 GPU，实现“本地开发、集群冲刺”的实验闭环。

微调 SDK 流程

您掌控（逻辑）：

1. 数据集和分词器定义

2. 超参数（学习率、批量大小、训练轮数）

3. 训练循环构建（逐步控制）

4. 自定义算法

5. 评估指标

安装

(pip install hpcai)

[The Bridge: API_KEY]

我们负责（基础设施）：

1. 大规模 GPU 分配与编排

2. 环境搭建（CUDA、PyTorch、依赖项）

3. 分布式并行（Colossal-AI 加速）

4. 检查点与状态管理

模型支持

模型训练与推理费率概览，以下为模型LoRA微调任务(1M Tokens)的价格。

基础模型	输入(Prefill)	输出(Sample)	训练(Train)

暂无信息

Frequently Asked Questions

有的！新注册账户将自动获得免费赠金（如 ¥20.00），涵盖了初步跑通 Demo 和小规模实验的费用，您无需付费即可体验。

模型微调

重磅上新

潞晨云：微调SDK

完美兼容 Tinker 范式，将大模型训练还原为极简的 Python 函数调用。

本地定义模型逻辑，云端毫秒级调度异构算力集群, 打通从 SFT 到 RL 的全链路。

重磅上新

潞晨云：微调SDK

完美兼容 Tinker 范式，将大模型训练还原为极简的 Python 函数调用。

本地定义模型逻辑，云端毫秒级调度异构算力集群, 打通从 SFT 到 RL 的全链路。

重磅上新

潞晨云：微调SDK

完美兼容 Tinker 范式，将大模型训练还原为极简的 Python 函数调用。

本地定义模型逻辑，云端毫秒级调度异构算力集群, 打通从 SFT 到 RL 的全链路。

核心功能

SFT 与 RL 全链路支持

自定义 Loss 与 Reward 函数，完全掌控训练循环
支持构建 PPO、GRPO、DPO 等强化学习（RLHF/RLAIF）训练流
提供 DeepSeek R1 等前沿模型 Cookbook

灵活微调，拒绝黑盒

兼容 Tinker 范式，本地定义算法逻辑，云端执行
简单 import hpcai + API Key 即可使用
学习成本低，现有代码改动 < 10 行

底层加速，工业级稳定

Colossal-AI 驱动, 异构集群自动调度与并行加速
支持工业级长序列训练，显著减少显存占用
智能持久化队列，支持断点续训与自动恢复

按 Token 计费，拒绝空转

Serverless 架构，按Tokens消耗付费
零运维负担，只为有效计算买单
相比传统租卡模式，实测RL实验成本降低至 1/10

应用场景

无需再为 NCCL 握手或节点掉线值守凌晨。单机代码零改动，即可透明扩展至数十张 GPU，实现“本地开发、集群冲刺”的实验闭环。

微调 SDK 流程

您掌控（逻辑）：

1. 数据集和分词器定义

2. 超参数（学习率、批量大小、训练轮数）

3. 训练循环构建（逐步控制）

4. 自定义算法

5. 评估指标

安装

(pip install hpcai)

[The Bridge: API_KEY]

我们负责（基础设施）：

1. 大规模 GPU 分配与编排

2. 环境搭建（CUDA、PyTorch、依赖项）

3. 分布式并行（Colossal-AI 加速）

4. 检查点与状态管理

模型支持

模型训练与推理费率概览，以下为模型LoRA微调任务(1M Tokens)的价格。

基础模型	输入(Prefill)	输出(Sample)	训练(Train)

暂无信息

Frequently Asked Questions

有的！新注册账户将自动获得免费赠金（如 ¥20.00），涵盖了初步跑通 Demo 和小规模实验的费用，您无需付费即可体验。