正在接单 — Agent 构建与昇腾部署

上线 Agent,持续迭代。

我们为不愿等上半年才验证想法的团队,打造生产级应用和 AI Agent。专注于在昇腾 AI 软硬件栈上部署与微调大语言模型。

agent · trace · 14:32:08.221
1 · User input
Find unpaid invoices > 30d
2 · Tool: SQL
SELECT * FROM invoices ...
3 · Tool: Email
Draft 14 reminders
4 · Output
Awaiting approval ✓
latency · 1.4s tokens · 3,142 cost · $0.018 eval · passing 47/48
最近交付的产品
B 轮金融科技公司 · 国企能源单位 · 物流平台 · 教育科技(35 万 MAU) · 制造业 OEM · 连锁零售
01 · 为什么是我们

一支精干资深的团队,为速度而生。

四个我们押注的优势。每个项目都享有全部四项 — 不分等级。

2 周
首版
01

快速交付

两周内交出首个可用版本,6–10 周上线生产。我们带着资深团队和成熟脚手架来,你只需带来问题。

每周
交付节奏
02

持续迭代

每周发布、真实用户参与、遥测从第一天就位。产品在每个 Sprint 中变得更锋利,而不是每次大版本才打磨一次。

70%
平均基础设施节省
03

精益部署

按需匹配的基础设施。需要时用国产芯片,不需要时用通用 GPU。我们按真实流量做容量规划,而不是按 PPT 上的数字。

24/7
响应时间
04

长期支持

上线后我们继续待命:监控、模型更新、本地化升级、微调任务。一个团队,一个对接窗口。

02 · 我们做什么

三条产品线,
一个团队全程承担。

AI · 核心方向

Agent 应用

能调用工具的 LLM Agent,读取你的数据、对接你的系统、完成真实工作。从第一天就配齐评测、护栏与人机协作界面。

RAG、工具调用、多 Agent 编排 内建评测套件与遥测 开源模型或托管 API 任选
应用工程

定制应用

Web、移动端、内部工具、客户门户。TypeScript、React Native、Go、Python — 按需选型,不为炫技。

调研 → 设计 → 交付 原生与 Web 一个团队覆盖 代码归你,服务你部署
基础设施 · 昇腾栈

昇腾大模型部署

在昇腾生态上部署与微调开源大模型。那些坑我们都踩过,你的团队不必重蹈。

MindSpore + CANN + MindIE 全链路 LoRA / QLoRA / 全参微调 附私有化推理基准测试
长期合作

技术支持与顾问

上线后的保留团队。架构评审、模型升级、性能调优、随时待命。

每季度模型更新 容量与成本审视 Slack / 微信 直连
03 · 流程

六周,跑得起来的软件。

01
第 0 周

盘点

半天工作坊。结束时带走一页 spec、一个预算区间,以及对技术风险的判断。

02
第 1 周

原型

可点击的真实原型,决策方能上手感受。真实登录、假数据。用来在投入开发前敲定范围。

03
第 2–6 周

构建

两周一个 Sprint。每周五演示。你看到的是正在跑的软件,不是甘特图。

04
第 6 周+

上线与迭代

生产环境上线,然后由长期保留团队接手,按结果而非工单数考核。

04 · 常见问题

客户最先问的几个问题。

还有其他问题? 直接问我们。

你们是固定报价还是按时计费? +
两种都做。调研阶段固定报价;构建阶段通常以 Sprint 为单位的固定范围 + 不超过上限。长期支持按月度服务费。
为什么专注昇腾? +
国产芯片可用性对很多客户至关重要 — 金融、准政务、受监管 SaaS。我们已有 Ascend 910B / 310P 的生产部署经验,清楚算子覆盖、MindIE 转换、分布式训练等环节的真实坑点。
能用我们的私有数据微调吗? +
可以。默认在开源底座(Qwen、DeepSeek、Llama、GLM)上做 LoRA / QLoRA;数据规模允许时做全参 SFT 和继续预训练。所有过程都在你的 VPC 或你的硬件内完成。
多小的项目算太小? +
我们最小的合作是两周的原型冲刺。比这更小的,你可能不需要我们 — 你需要一个周末。
你们做离岸 / 近岸交付吗? +
我们是一个时区里的单一团队。在重叠时段与你们同步,其余时间清晰交接。
一起开干

告诉我们
你想交付什么。

30 分钟探索通话。48 小时内反馈一页 spec 和预算区间。

一个工作日内回复。
也可以通过这些渠道
© crabagent 2026 北京 · 远程优先