Token工厂

AI大模型 Token 服务

提供Gemini、Claude、DeepSeek等主流AI大模型的API Token工厂。 稳定可靠的API接口,按量计费的灵活方案,让您的AI应用开发更加便捷高效。

高速稳定

自建节点加速,平均响应延迟<100ms

安全合规

数据加密传输,不保留用户对话内容

按量计费

按Token实际使用量计费,无最低消费

独立API Key

每位用户独立API Key,支持权限精细控制

example.ts
1import { createClient } from '@cloudmatrix/ai'
2
3const client = createClient({
4 apiKey: process.env.CLOUDMATRIX_API_KEY
5})
6
7const response = await client.chat.completions.create({
8 model: 'gemini-2.0-flash',
9 messages: [
10 { role: 'user', content: '介绍一下CloudMatrix的Token工厂' }
11 ],
12 stream: true
13})
14
15for await (const chunk of response) {
16 process.stdout.write(chunk.choices[0]?.delta?.content || '')
17}

模型与定价

支持主流AI大模型,透明的按量计费,价格为每千Token

Gemini

推荐

Gemini 3.0 Pro

最新旗舰多模态模型,支持文本、图片、视频理解与生成

输入价格¥0.00075/1K
输出价格¥0.003/1K
上下文长度2M tokens
多模态长上下文高速推理

Gemini 3.0 Flash

高性能轻量级模型,适合实时交互与快速响应

输入价格¥0.00038/1K
输出价格¥0.00152/1K
上下文长度1M tokens
超快响应低成本高效推理

Gemini 2.0 Flash

稳定可靠的多模态模型,已证实的生产能力

输入价格¥0.00075/1K
输出价格¥0.003/1K
上下文长度1M tokens
生产就绪成本优化多模态

Claude

推荐

Claude 3.7 Opus

Anthropic最新旗舰模型,卓越的推理与代码能力

输入价格¥0.015/1K
输出价格¥0.075/1K
上下文长度200K tokens
强推理能力优秀代码复杂任务

Claude 3.5 Sonnet

高性能通用模型,平衡推理速度与能力

输入价格¥0.003/1K
输出价格¥0.015/1K
上下文长度200K tokens
性能均衡快速响应通用能力

Claude 3.5 Haiku

快速且经济的模型,适合高并发场景

输入价格¥0.0008/1K
输出价格¥0.004/1K
上下文长度200K tokens
超快响应高并发性价比

DeepSeek

推荐

DeepSeek-V3

DeepSeek最新一代模型,支持长上下文与复杂推理

输入价格¥0.0014/1K
输出价格¥0.0028/1K
上下文长度128K tokens
深度推理成本优化长上下文

DeepSeek-R1

专为推理优化的模型,提供详细的推理过程

输入价格¥0.0012/1K
输出价格¥0.0024/1K
上下文长度64K tokens
可视化推理逻辑清晰教育友好

DeepSeek Chat

轻量级对话模型,适合实时交互应用

输入价格¥0.0001/1K
输出价格¥0.0002/1K
上下文长度32K tokens
极低成本快速响应对话优化

应用场景

强大的AI能力支持各类应用场景

智能客服

构建7×24小时智能客服系统,支持多轮对话、上下文理解与情感分析

代码助手

集成AI编程助手,实现代码补全、重构、Bug修复与文档生成

内容生成

自动化生成营销文案、产品描述、新闻摘要等各类文本内容

多模态理解

图片识别、文档解析、视频理解等多模态内容处理能力

AI Agent

构建自主决策的AI智能体,实现复杂任务的自动化执行

知识问答

基于企业知识库的智能问答系统,提升信息检索效率

立即开始使用

注册即送100元免费额度,无需信用卡。体验最新AI大模型的强大能力, 为您的应用注入智能。