1. 免费模型上线通知
最新提供的免费模型有:
1、GLM-4-Flash 是一款免费且好用的语言模型,最大支持 128K 上下文,最大输出 4K Tokens,适用于智能问答、摘要生成和文本数据处理等多种应用场景。
2、Hunyuan-Lite免费使用,满足绝大部分对效果、推理性能、成本控制相对平衡的需求场景。在中文 NLP、英文 NLP、代码、数学等方向显著优于同等规模开源模型。
3、ERNIE-Lite Pro 128K 百度自研的轻量级大语言模型,上下文支持128K,兼顾优异的模型效果与推理性能,适合低算力AI加速卡推理使用。
4、Qwq-32b Preview 阿里通义千问QwQ模型是由 Qwen 团队开发的实验性研究模型,专注于增强 AI 推理能力。
5、Lite 轻量级大语言模型,具有更高的响应速度,适用于低算力推理与模型精调等定制化场景,可满足企业产品快速验证的需求。
6、GLM-4-Air 是智谱最新迭代的基座模型中性价比最高的版本,适用于信息总结、摘要提取、广告文案、小说写作、代码生成等文生文场景。
7、deepseek-V3 模型已全面升级为 DeepSeek-V3,模型各方面能力表现,包括数学、代码、写作、角色扮演等;同时,新版模型优化了文件上传功能,并且全新支持了联网搜索,展现出更加强大的全方位服务于各类工作生活场景的能力。
8、Marco-o1 是一个开放推理模型,由阿里巴巴国际数字商务 MarcoPolo 团队开发。该模型不仅专注于数学、物理和编程等标准答案领域,更重视开放性解决方案。它采用了思维链(CoT)微调、蒙特卡洛树搜索(MCTS)以及反思机制等创新推理策略,以提升复杂现实问题的解决能力。在 MGSM 数据集上,该模型在英文和中文测试中分别实现了 +6.17% 和 +5.60% 的准确率提升
9、GLM-4-Plus 是智谱AI最新发布的大型语言模型,其在处理复杂指令方面展现出了显著的能力和优势,GLM-4-Plus在多个方面展现了其强大的能力,包括语言理解、指令遵循,长文本和复杂任务能力显著增强。
10、Gemma-2 9b It Gemma 是 Google 开发的轻量级、最先进的开放模型系列之一。它是一个仅解码器的大型语言模型,支持英语,提供开放权重、预训练变体和指令微调变体。Gemma 模型适用于各种文本生成任务,包括问答、摘要和推理。该 9B 模型是通过 8 万亿个 tokens 训练而成。其相对较小的规模使其可以在资源有限的环境中部署,如笔记本电脑、台式机或您自己的云基础设施,从而使更多人能够访问最先进的 AI 模型并促进创新
11、ChatGLM3-6B 是 ChatGLM 系列的开源模型,由智谱 AI 开发。该模型保留了前代模型的优秀特性,如对话流畅和部署门槛低,同时引入了新的特性。它采用了更多样的训练数据、更充分的训练步数和更合理的训练策略,在 10B 以下的预训练模型中表现出色。ChatGLM3-6B 支持多轮对话、工具调用、代码执行和 Agent 任务等复杂场景。
12、GLM-4-9B-Chat 是智谱 AI 推出的 GLM-4 系列预训练模型中的开源版本。该模型在语义、数学、推理、代码和知识等多个方面表现出色。除了支持多轮对话外,GLM-4-9B-Chat 还具备网页浏览、代码执行、自定义工具调用(Function Call)和长文本推理等高级功能。模型支持 26 种语言,包括中文、英文、日语、韩语和德语等。在多项基准测试中,GLM-4-9B-Chat 展现了优秀的性能,如 AlignBench-v2、MT-Bench、MMLU 和 C-Eval 等。该模型支持最大 128K 的上下文长度,适用于学术研究和商业应用
13、Qwen2-1.5B-Instruct 是 Qwen2 系列中的指令微调大语言模型,参数规模为 1.5B。该模型基于 Transformer 架构,采用了 SwiGLU 激活函数、注意力 QKV 偏置和组查询注意力等技术。它在语言理解、生成、多语言能力、编码、数学和推理等多个基准测试中表现出色,超越了大多数开源模型。与 Qwen1.5-1.8B-Chat 相比,Qwen2-1.5B-Instruct 在 MMLU、HumanEval、GSM8K、C-Eval 和 IFEval 等测试中均显示出显著的性能提升,尽管参数量略少
14、Meta Llama 3.1 是由 Meta 开发的多语言大型语言模型家族,包括 8B、70B 和 405B 三种参数规模的预训练和指令微调变体。该 8B 指令微调模型针对多语言对话场景进行了优化,在多项行业基准测试中表现优异。模型训练使用了超过 15 万亿个 tokens 的公开数据,并采用了监督微调和人类反馈强化学习等技术来提升模型的有用性和安全性。Llama 3.1 支持文本生成和代码生成,知识截止日期为 2023 年 12 月
15、Qwen2.5-Coder-7B-Instruct 是阿里云发布的代码特定大语言模型系列的最新版本。该模型在 Qwen2.5 的基础上,通过 5.5 万亿个 tokens 的训练,显著提升了代码生成、推理和修复能力。它不仅增强了编码能力,还保持了数学和通用能力的优势。模型为代码智能体等实际应用提供了更全面的基础
16、Qwen2.5-7B-Instruct 是阿里云发布的最新大语言模型系列之一。该 7B 模型在编码和数学等领域具有显著改进的能力。该模型还提供了多语言支持,覆盖超过 29 种语言,包括中文、英文等。模型在指令跟随、理解结构化数据以及生成结构化输出(尤其是 JSON)方面都有显著提升
17、InternLM2.5-7B-Chat 是一个开源的对话模型,基于 InternLM2 架构开发。该 7B 参数规模的模型专注于对话生成任务,支持中英双语交互。模型采用了最新的训练技术,旨在提供流畅、智能的对话体验。InternLM2.5-7B-Chat 适用于各种对话应用场景,包括但不限于智能客服、个人助手等领域
2. 免费模型下线通知
为了提供更稳定、高质量、可持续的服务,以下模型将于 2025 年 1 月 2日下线:
- Lite
- Qwq-32b Preview
- ERNIE-Lite Pro 128K
为了提供更稳定、高质量、可持续的服务,以下模型将于 2025 年 1 月 16 日下线:
- GLM-4-Air
- GLM-4-Plus
为了提供更稳定、高质量、可持续的服务,以下模型将于 2025 年 1月 18 日下线:
- DeepSeek-V3
如果您有使用上述模型,建议尽快迁移至平台上的其他模型。