Token工厂

AI大模型 Token 服务

提供Gemini、Claude、DeepSeek等主流AI大模型的API Token工厂。稳定可靠的API接口，按量计费的灵活方案，让您的AI应用开发更加便捷高效。

高速稳定

自建节点加速，平均响应延迟<100ms

安全合规

数据加密传输，不保留用户对话内容

按量计费

按Token实际使用量计费，无最低消费

独立API Key

每位用户独立API Key，支持权限精细控制

example.ts

 1import { createClient } from '@cloudmatrix/ai'
 2
 3const client = createClient({
 4  apiKey: process.env.CLOUDMATRIX_API_KEY
 5})
 6
 7const response = await client.chat.completions.create({
 8  model: 'gemini-2.0-flash',
 9  messages: [
10    { role: 'user', content: '介绍一下CloudMatrix的Token工厂' }
11  ],
12  stream: true
13})
14
15for await (const chunk of response) {
16  process.stdout.write(chunk.choices[0]?.delta?.content || '')
17}

模型与定价

支持主流AI大模型，透明的按量计费，价格为每千Token

Gemini

Gemini 3.0 Pro

最新旗舰多模态模型，支持文本、图片、视频理解与生成

输入价格¥0.00075/1K

输出价格¥0.003/1K

上下文长度2M tokens

多模态长上下文高速推理

Gemini 3.0 Flash

高性能轻量级模型，适合实时交互与快速响应

输入价格¥0.00038/1K

输出价格¥0.00152/1K

上下文长度1M tokens

超快响应低成本高效推理

Gemini 2.0 Flash

稳定可靠的多模态模型，已证实的生产能力

输入价格¥0.00075/1K

输出价格¥0.003/1K

上下文长度1M tokens

生产就绪成本优化多模态

Claude

Claude 3.7 Opus

Anthropic最新旗舰模型，卓越的推理与代码能力

输入价格¥0.015/1K

输出价格¥0.075/1K

上下文长度200K tokens

强推理能力优秀代码复杂任务

Claude 3.5 Sonnet

高性能通用模型，平衡推理速度与能力

输入价格¥0.003/1K

输出价格¥0.015/1K

上下文长度200K tokens

性能均衡快速响应通用能力

Claude 3.5 Haiku

快速且经济的模型，适合高并发场景

输入价格¥0.0008/1K

输出价格¥0.004/1K

上下文长度200K tokens

超快响应高并发性价比

DeepSeek

DeepSeek-V3

DeepSeek最新一代模型，支持长上下文与复杂推理

输入价格¥0.0014/1K

输出价格¥0.0028/1K

上下文长度128K tokens

深度推理成本优化长上下文

DeepSeek-R1

专为推理优化的模型，提供详细的推理过程

输入价格¥0.0012/1K

输出价格¥0.0024/1K

上下文长度64K tokens

可视化推理逻辑清晰教育友好

DeepSeek Chat

轻量级对话模型，适合实时交互应用

输入价格¥0.0001/1K

输出价格¥0.0002/1K

上下文长度32K tokens

极低成本快速响应对话优化

应用场景

强大的AI能力支持各类应用场景

智能客服

构建7×24小时智能客服系统，支持多轮对话、上下文理解与情感分析

代码助手

集成AI编程助手，实现代码补全、重构、Bug修复与文档生成

内容生成

自动化生成营销文案、产品描述、新闻摘要等各类文本内容

多模态理解

图片识别、文档解析、视频理解等多模态内容处理能力

AI Agent

构建自主决策的AI智能体，实现复杂任务的自动化执行

知识问答

基于企业知识库的智能问答系统，提升信息检索效率

立即开始使用

注册即送100元免费额度，无需信用卡。体验最新AI大模型的强大能力，为您的应用注入智能。