
作者:王扁 来源:原创 发布日期:05-20

更长上下文:流畅处理长文本内容。端侧模型上下文窗口达 128K,大模型最高支持 256K,可在单次提示中传入代码库或长文档。140 + 种语言:基于超 140 种语言原生训练,助力开发者为全球用户打造包容、高性能的应用。26B 与 31B 模型为让研究者与开发者在通用硬件上实现顶尖推理能力而优化,非量化 bfloat16 权重可高效适配单张 80GB 英伟达 H100 GPU;本地部署场景下,量化
Nevada NewspapersFILE - This Dec. 17, 2015 file photo shows a sign outside the building housing the Las Vegas Review-Journal in Las Vegas. AP Photo/John Locher, File) DEC. 17, 2015,
语言:基于超 140 种语言原生训练,助力开发者为全球用户打造包容、高性能的应用。26B 与 31B 模型为让研究者与开发者在通用硬件上实现顶尖推理能力而优化,非量化 bfloat16 权重可高效适配单张 80GB 英伟达 H100 GPU;本地部署场景下,量化版本可直接在消费级 GPU 上运行,支撑集成开发环境、编程助手与智能体工作流。26B 混合专家模型(MoE)侧重低延迟,推理时仅激活总参数
当前文章:http://e90nw.loqimu.cn/ng30/aa1.html
发布时间:01:55:34