快科技6月7日讯,Intel官方正式宣布,旗下数据中心、客户端及边缘AI解决方案均已全力支持阿里云通义千问2(Qwen2)的全球发布,并取得了ModelScope、阿里云PAI、OpenVINO等一系列创新成果。
为了充分发挥通义千问2等大模型的效能,Intel进行了深入的软件优化,包括高性能融合算子、平衡精度与速度的先进量化技术等,旨在实现模型的高效运行。
此外,Intel还采用了KV Caching、PagedAttention机制以及张量并行等技术,以进一步提升推理效率。
同时,Intel的硬件也通过软件框架和工具包得到了有效加速,实现了卓越的大模型推理性能。这些工具包括PyTorch及其Intel扩展包、OpenVINO工具包、DeepSpeed、Hugging Face库以及vLLM等。
具体来看,Intel的Gaudi AI加速器是专为生成式AI和大模型设计的高性能加速器。最新版的Gaudi Optimum能够轻松部署新的大模型。通过Gaudi 2,Intel对通义千问2的70亿参数和720亿参数模型进行了基准测试,展示了其在不同场景下的优异性能。
此外,Intel的至强处理器也凭借其广泛的适用性和内置的Intel AMX高级矩阵扩展,成为企业快速部署AI解决方案的理想选择。在五代可扩展至强处理器上运行的阿里云ecs.ebmg8i.48xlarge实例,进一步证明了通义千问2的高效推理能力。
最后,对于消费级AI PC用户,他们也可以在本地部署大模型,通过处理器内置的GPU核显、NPU AI引擎或独立的锐炫显卡来实现。这为用户提供了更多的选择和灵活性。
暂无评论...