正在接单 — Agent 构建与昇腾部署
上线 Agent,持续迭代。
我们为不愿等上半年才验证想法的团队,打造生产级应用和 AI Agent。专注于在昇腾 AI 软硬件栈上部署与微调大语言模型。
agent · trace · 14:32:08.221
1 · User input
Find unpaid invoices > 30d
2 · Tool: SQL
SELECT * FROM invoices ...
3 · Tool: Email
Draft 14 reminders
4 · Output
Awaiting approval ✓
latency · 1.4s tokens · 3,142 cost · $0.018 eval · passing 47/48
最近交付的产品
B 轮金融科技公司 · 国企能源单位 · 物流平台 · 教育科技(35 万 MAU) · 制造业 OEM · 连锁零售
01 · 为什么是我们
一支精干资深的团队,为速度而生。
四个我们押注的优势。每个项目都享有全部四项 — 不分等级。
2 周
首版
01
快速交付
两周内交出首个可用版本,6–10 周上线生产。我们带着资深团队和成熟脚手架来,你只需带来问题。
每周
交付节奏
02
持续迭代
每周发布、真实用户参与、遥测从第一天就位。产品在每个 Sprint 中变得更锋利,而不是每次大版本才打磨一次。
70%
平均基础设施节省
03
精益部署
按需匹配的基础设施。需要时用国产芯片,不需要时用通用 GPU。我们按真实流量做容量规划,而不是按 PPT 上的数字。
24/7
响应时间
04
长期支持
上线后我们继续待命:监控、模型更新、本地化升级、微调任务。一个团队,一个对接窗口。
02 · 我们做什么
三条产品线,
一个团队全程承担。
AI · 核心方向
Agent 应用
能调用工具的 LLM Agent,读取你的数据、对接你的系统、完成真实工作。从第一天就配齐评测、护栏与人机协作界面。
RAG、工具调用、多 Agent 编排 内建评测套件与遥测 开源模型或托管 API 任选
应用工程
定制应用
Web、移动端、内部工具、客户门户。TypeScript、React Native、Go、Python — 按需选型,不为炫技。
调研 → 设计 → 交付 原生与 Web 一个团队覆盖 代码归你,服务你部署
基础设施 · 昇腾栈
昇腾大模型部署
在昇腾生态上部署与微调开源大模型。那些坑我们都踩过,你的团队不必重蹈。
MindSpore + CANN + MindIE 全链路 LoRA / QLoRA / 全参微调 附私有化推理基准测试
长期合作
技术支持与顾问
上线后的保留团队。架构评审、模型升级、性能调优、随时待命。
每季度模型更新 容量与成本审视 Slack / 微信 直连
03 · 流程
六周,跑得起来的软件。
01
第 0 周
盘点
半天工作坊。结束时带走一页 spec、一个预算区间,以及对技术风险的判断。
02
第 1 周
原型
可点击的真实原型,决策方能上手感受。真实登录、假数据。用来在投入开发前敲定范围。
03
第 2–6 周
构建
两周一个 Sprint。每周五演示。你看到的是正在跑的软件,不是甘特图。
04
第 6 周+
上线与迭代
生产环境上线,然后由长期保留团队接手,按结果而非工单数考核。
你们是固定报价还是按时计费?
两种都做。调研阶段固定报价;构建阶段通常以 Sprint 为单位的固定范围 + 不超过上限。长期支持按月度服务费。
为什么专注昇腾?
国产芯片可用性对很多客户至关重要 — 金融、准政务、受监管 SaaS。我们已有 Ascend 910B / 310P 的生产部署经验,清楚算子覆盖、MindIE 转换、分布式训练等环节的真实坑点。
能用我们的私有数据微调吗?
可以。默认在开源底座(Qwen、DeepSeek、Llama、GLM)上做 LoRA / QLoRA;数据规模允许时做全参 SFT 和继续预训练。所有过程都在你的 VPC 或你的硬件内完成。
多小的项目算太小?
我们最小的合作是两周的原型冲刺。比这更小的,你可能不需要我们 — 你需要一个周末。
你们做离岸 / 近岸交付吗?
我们是一个时区里的单一团队。在重叠时段与你们同步,其余时间清晰交接。