无问芯穹简介
无问芯穹致力于提供卓越的AGI算力解决方案,以大模型能效优化工具包为核心,向下联动多家国产芯片公司,向上通过智算云服务、智算一体机多种方式服务大模型算法企业,协同算力、算法、生态推动行业大模型的高效落地,构建AGI时代的大模型基础设施。
无问芯穹官网网址:https://www.infini-ai.com
无问芯穹核心产品:
以无穹大模型能效优化工具包为基础,整合国产芯片算力, 构建统一算力底座,提供包括NVIDIA、AMD、海光、天数等多种加速算力云服务,屏蔽硬件差异,开箱即用。
面向大模型私有化部署场景,整合计算加速卡、自研IP、优化工具包、行业大模型,构建大模型一体机,最大化优化大模型落地ROI。
无问芯穹解决方案:
无问芯穹提供从安装到使用端到端的培训服务及模型定制化服务,降低大模型使用门槛,根据您的需求个性化定制解决方案。
1、智算云服务
-
GPU加速实例
-
开箱即用,统一加速、性能深度优化、开源兼容
-
多源国产芯片支持
-
大模型训练加速服务
-
大模型推理加速服务
2、智算一体机
-
软硬件深度协同
-
自研加速卡IP
-
行业大模型赋能
3、大模型能效优化工具包
-
自研多后端通用高性能算子库
-
模型量化压缩库
-
分布式训练加速库
-
多后端模型推理引擎
4、自研行业大模型
-
政务大模型
-
法律大模型
-
证券大模型
5、大模型应用开发工具链
-
多agent引擎
-
模型微调服务
-
RAG工具包
-
效果评测工具
6、基于大模型的行业智能体应用
-
投资助手
-
算法助手
无问芯穹团队成员:
创始团队成员来自清华大学电子系及头部互联网/AI企业,拥有丰富的产业经验和成功的创业经历,技术积累与学术沉淀丰富,已经在人工智能系统优化领域发表高水平学术论文200余篇。
相关成果包括:(1)GPU高效算子库超越英伟达商用库,在中端工艺GPU上实现比商用软件在高端工艺GPU更优的性能;(2)支撑大模型的高效稀疏推理加速架构,提升稀疏神经网络、图神经网络等计算速度1-3个量级。团队已经实现大语言模型在英伟达GPU上延时降低50%,未来将进一步结合底层算子优化、稀疏加速、硬件特性感知、高效互联等能力,将整机加速比提升到10倍。