Arctic 是由云计算巨头 Snowflake 的 AI 研究团队开发的企业级大型语言模型(LLM),专为执行企业任务如 SQL 生成、编程和指令遵循而设计。该模型以其高效的训练和推理效率、成本效益以及开源特性而备受瞩目。这是一个拥有 480 亿参数的混合专家模型(MoE),在保持高性能的同时,显著降低了训练和推理的成本。
主要功能和产品特色
- 参数规模:Arctic 拥有 480 亿参数,但在推理时仅激活 170 亿参数,以提高效率。
- 技术架构:采用 Dense-MoE Hybrid Transformer 架构,结合了密集变换器和 128 个专家的 MoE 模型。
- 训练成本:Arctic 的训练计算预算不到 200 万美元,远低于其他顶级大模型。
- 模型许可:在开放的 Apache 2.0 许可下发布,允许自由使用和修改。
- 主要用途:擅长 SQL 生成、编程和指令遵循等企业任务,适合创建定制企业模型。
需求人群
- 企业开发者:需要构建高效的 SQL 数据协同助手。
- AI 研究者:对大型语言模型的研究和优化。
- 数据科学家:在数据分析和机器学习任务中利用 Arctic 的能力。
使用场景示例
- 对话式 AI:构建能够理解和生成自然语言的对话式 AI 系统。
- 编程辅助:作为代码编写和审查的辅助工具。
- 自动化工作流:自动化企业中的重复性任务,如数据查询和报告生成。
费用定价
Arctic 作为一个开源项目,对所有用户免费开放,无需支付额外费用。
官方资源:
- 官方模型主页:https://www.snowflake.com/en/data-cloud/arctic/
- Hugging Face模型空间:https://huggingface.co/Snowflake/snowflake-arctic-instruct
- Replicate模型地址:https://replicate.com/snowflake/snowflake-arctic-instruct
- GitHub仓库:https://github.com/Snowflake-Labs/snowflake-arctic