加入我们

社会招聘

集合通信研发架构师(J14173)

  • 招聘类别:社会招聘
  • 工作性质:全职
  • 薪资范围:面议
  • 招聘人数:若干
  • 工作地点:四川省-成都市,北京市,北京市-大兴区
  • 发布时间:2026-05-26

工作职责

1. 主导面向千卡/万卡GPU/NPU集群的集合通信库整体架构设计与演进,定义核心组件技术方案与接口规范;
2. 负责集合通信算法、高性能传输协议、拥塞控制的设计与优化,基于RDMA/RoCE技术,突破集群互联性能瓶颈;
3. 与芯片硬件、大模型框架团队协同,支撑多种分布式并行策略,构建通信性能分析体系,定位集群性能瓶颈;
4. 主导通信库性能测试、稳定性保障体系建设,制定开发规范,主导技术攻关与技术沉淀。

任职资格

1. 本科及以上学历,计算机、电子工程、通信等相关专业,5年以上高性能通信/分布式系统架构经验;
2. 扎实的C/C++编程功底,熟练掌握数据结构与算法、计算机体系结构,熟悉Linux系统编程与高性能网络协议栈;
3. 主导过NCCL/HCCL等集合通信库架构设计与优化,具备千卡以上集群通信性能调优经验者优先;
4. 具备Linux kernel/DRM/PCIe等驱动开发经验,熟悉驱动与通信库的交互逻辑,能支撑通信库与硬件的底层适配;
5. 深入理解RDMA/RoCE/Infiniband原理,熟悉verbs/rdma-core/DPDK技术,有用户态协议栈、拥塞控制开发经验优先;
6. 熟悉大模型分布式并行技术,了解训练优化技巧,具备复杂分布式系统架构设计与跨团队协同能力。
优先条件:
- 熟悉片上互联/PCIe协议,有GPU/NPU芯片互联、大模型训练/推理落地经验者优先;
- 熟悉 NCCL / MPI / HCCL 等通信库;
- 熟悉 PyTorch / Megatron-LM / DeepSpeed;
- 有 GPU/NPU 集群性能优化经验;
- 有 KV Cache / 大模型推理优化经验;
- 有多卡集群经验;
- 有自研通信库经验。

集合通信研发架构师(J14173)

  • 招聘类别:社会招聘
  • 工作性质:全职
  • 工作地点:四川省-成都市,北京市,北京市-大兴区
  • 招聘人数:若干
  • 薪资范围:面议
  • 发布时间:2026-05-26

工作职责

1. 主导面向千卡/万卡GPU/NPU集群的集合通信库整体架构设计与演进,定义核心组件技术方案与接口规范;
2. 负责集合通信算法、高性能传输协议、拥塞控制的设计与优化,基于RDMA/RoCE技术,突破集群互联性能瓶颈;
3. 与芯片硬件、大模型框架团队协同,支撑多种分布式并行策略,构建通信性能分析体系,定位集群性能瓶颈;
4. 主导通信库性能测试、稳定性保障体系建设,制定开发规范,主导技术攻关与技术沉淀。

任职资格

1. 本科及以上学历,计算机、电子工程、通信等相关专业,5年以上高性能通信/分布式系统架构经验;
2. 扎实的C/C++编程功底,熟练掌握数据结构与算法、计算机体系结构,熟悉Linux系统编程与高性能网络协议栈;
3. 主导过NCCL/HCCL等集合通信库架构设计与优化,具备千卡以上集群通信性能调优经验者优先;
4. 具备Linux kernel/DRM/PCIe等驱动开发经验,熟悉驱动与通信库的交互逻辑,能支撑通信库与硬件的底层适配;
5. 深入理解RDMA/RoCE/Infiniband原理,熟悉verbs/rdma-core/DPDK技术,有用户态协议栈、拥塞控制开发经验优先;
6. 熟悉大模型分布式并行技术,了解训练优化技巧,具备复杂分布式系统架构设计与跨团队协同能力。
优先条件:
- 熟悉片上互联/PCIe协议,有GPU/NPU芯片互联、大模型训练/推理落地经验者优先;
- 熟悉 NCCL / MPI / HCCL 等通信库;
- 熟悉 PyTorch / Megatron-LM / DeepSpeed;
- 有 GPU/NPU 集群性能优化经验;
- 有 KV Cache / 大模型推理优化经验;
- 有多卡集群经验;
- 有自研通信库经验。