DeepSeek V3 和 DeepSeek R1 发布以后,国外的媒体、公司、各种组织都在不断的质疑和打压,比如微软就和 OpenAI 调查 DeepSeek 是否使用 OpenAI 模型数据通过蒸馏进行训练。
可同时微软就在微软云、Github、硬件方面全面引入 DeepSeek R1,典型的“嘴巴说不要,但身体却很诚实”,另外前几天 AWS 也宣布在其云服务中引入 DeepSeek R1。
这说明什么?在绝对的技术实力和高效率背景下,你不尽快跟进,也会有其他人赶上,全球三大云产商有两家已经引入了 DeepSeek R1,Google Cloud 你还在等什么?
1:微软
Azure AI Foundry 中存储了成千上万个开源模型,通过简单的配置,选择一个模型比如 DeepSeek R1,配置一个 API 端点,就可以访问了,无需了解背后的基础设施。
微软解释不管什么模型,均通过严格的红队和安全评估,对模型的行为进行自动评估和安全审查,从而能降低潜在的风险。
另外 GitHub Models 中也部署了 DeepSeek R1,方便我们使用模型开发。
另外 DeepSeek R1 有各种蒸馏 distill 版本,非常适合各种终端运行,所以特别强调将来会将 DeepSeek R1 部署到 Copilot+ PCs 中。
2:AWS
AWS 上目前也可以使用各种 DeepSeek 模型,强悍的是,AWS 上有各种部署模型的方式,总有一款适合你。
(1)Amazon Bedrock Marketplace
可以在 Amazon Bedrock Marketplace 上配置 DeepSeek R1 或其它各种基础模型,选择合适的机器实例,最终通过 API 端点访问 DeepSeek R1 。
(2)Amazon SageMaker JumpStart
如果你需要定制、训练、调优、利用现有算法的需求,可以选择Amazon SageMaker JumpStart,最终也需要选择一个现成的 ECS 机器实例,最终通过 API 端点访问。
(3)Amazon Bedrock Custom Model Import
这个服务是一个 serverless 服务,可以运行各种基础模型或定制过的模型,比如 DeepSeek R1,但它不需要自己选择机器实例,也就是说不用关心基础设施。
可以运行各类模型,以 DeepSeek R1 来说,可以运行各类蒸馏版本,比如 DeepSeek-R1-Distill Llama。
(4)AWS Trainium 和 AWS Inferentia
AWS 有专门的训练芯片 Trainium 和推理芯片 Inferentia,如果考虑成本或其它想使用专门的 GPU 运行 DeepSeek-R1-Distill ,就可以选择它们,通过 AWS Deep Learning AMIs (DLAMI) 选择 trn1.32xlarge 实例即可,连接实例后可以选择 vLLM 等工具从 Hugging Face 下载 DeepSeek-R1-Distill 模型并部署,非常的定制化。
总体来说,从技术角度看,AWS 云提供多种方式使用 DeepSeek-R1,满足各种需求。
参考:
https://aws.amazon.com/cn/blogs/aws/deepseek-r1-models-now-available-on-aws/
https://azure.microsoft.com/en-us/blog/deepseek-r1-is-now-available-on-azure-ai-foundry-and-github/