全球 TMT2025 年 3 月 11 日讯)鸿海研究院(Hon Hai Research Institute)宣布推出首个繁体中文大语言模型(LLM),在短短四周内完成更高效、更低成本的模型训练方法。
该研究所由鸿海科技集团(富士康)支持,它表示,LLM-- 代号为 FoxBrain-- 未来将开放源代码并公开共享。它最初是为集团内部系统的应用而设计的,涵盖数据分析、决策支持、文档协作、数学、推理和问题解决以及代码生成等功能。FoxBrain 不仅具有强大的理解和推理能力,还针对中国台湾用户的语言风格进行了优化,在数学和逻辑推理测试中表现出色。
FoxBrain 的训练过程由 120 颗英伟达 H100 GPU 驱动,采用英伟达 Quantum-2 InfiniBand 网络进行扩展,仅用约四周时间就完成了。FoxBrain 基于 Meta Llama 3.1 架构,拥有 70B 参数。FoxBrain 在数学方面比基本的 Meta Llama 3.1 模型有了全面的改进。
精彩评论文明上网理性发言,请遵守评论服务协议
共0条评论