BitJob
我们是 web3 职位平台 BitJob,架设 web2 与 web3 之间的桥梁。
01
ai infra- 远程
【知名 AI 项目,公司已获得国内外知名投资机构融资】
职位描述
我们正在寻找一位具备深厚技术背景的 AI 工程师(系统 Infra 方向),专注于 AI 模型部署与推理优化。候选人需对各种 AI 推理框架的优劣势有深入理解,能够高效完成模型推理的加速与优化,特别是在端侧或云端的部署方面表现突出。同时,对模型量化、蒸馏等优化技术有实际经验和深刻认知。
岗位职责
● 评估主流推理框架(如 TensorRT、ONNX Runtime、TVM 等),分析其适用场景及性能优劣。
● 根据业务需求选择最优框架并进行深度优化,确保性能与资源消耗的最佳平衡。
● 在端侧(如嵌入式设备或移动设备)或云端实现高效的模型推理部署。
● 应用先进的推理加速技术(如算子优化、内存管理优化),提升推理速度并降低资源消耗。
● 掌握量化技术(如 INT8、FP16)以及蒸馏方法,减少模型体积并提升推理效率。
● 通过优化和压缩手段,让模型适配算力受限的环境。
● 设计并实施性能监控工具,实时分析模型在生产环境中的运行表现。
● 持续优化系统性能,及时解决瓶颈问题。
● 与团队成员及其他部门协作,提供技术指导,推动 AI 技术的广泛应用。
职位要求
● 熟练掌握主流推理框架(TensorRT、ONNX Runtime、TVM 等),并具备框架深度优化的经验。
● 对模型量化(如 INT8、FP16)和蒸馏技术有实际项目经验,能够优化模型性能和资源利用率。
● 熟悉算子优化、内存分配等底层技术细节,有能力优化推理速度。
● 具备在端侧设备(如移动端或嵌入式)或云端部署 AI 模型的经验。
● 有完整的项目经历,从模型优化到生产部署,并能快速响应和解决实际问题。
● 精通 Python 和 C++,能够编写高效的推理代码并解决复杂技术问题。
● 对 GPU、TPU 或其他硬件加速平台有实际操作经验。
● 逻辑思维清晰,能快速分析问题并提出高效解决方案。
● 具备优秀的团队合作和沟通能力,能与不同部门无缝对接。
加分项
● 曾参与过大规模推理系统的优化和落地项目。
● 有异构计算平台(如 GPU、TPU 或 FPGA)的深度优化经验。
更多在招职位(北 / 上 / 深 / 成 / 杭 / 远程|产品 / 运营 / 技术 /BD/ 设计 / 测试……),可联系 jessie 微信投递简历。
投递简历 / 加熊市招聘交流群,联系下方微信~~
web3 工作能提供的
有竞争力的薪资,远离内卷
扁平化管理,拒绝低效冗余的团队沟通
亲身参与 web3 建设的机会,用想象力重构产品
时间、地点灵活的工作模式
与世界前列 web3 项目合作的机会,与最酷的同事共事
BitJob,
架设 web2 与 web3 之间的桥梁。
【免责声明】市场有风险,投资需谨慎。本文不构成投资建议,用户应考虑本文中的任何意见、观点或结论是否符合其特定状况。据此投资,责任自负。