鸿海研究院推出具有推理能力的繁体中文大语言模型

200-01-01

阅读：0

[摘要] 全球 TMT2025 年 3 月 11 日讯）鸿海研究院（Hon Hai Research Institute）宣布推出首个繁体中文大语言模型（LLM），在短短四周内完成更高效、更低成本的模型训练方法。该研究所由鸿海科技集团（富士康）支持，它表示，LLM-- 代号为 FoxBrain-- 未来将开放源代码并公开共享。它最初是为集团内部系统的应用而

全球 TMT2025 年 3 月 11 日讯）鸿海研究院（Hon Hai Research Institute）宣布推出首个繁体中文大语言模型（LLM），在短短四周内完成更高效、更低成本的模型训练方法。

该研究所由鸿海科技集团（富士康）支持，它表示，LLM-- 代号为 FoxBrain-- 未来将开放源代码并公开共享。它最初是为集团内部系统的应用而设计的，涵盖数据分析、决策支持、文档协作、数学、推理和问题解决以及代码生成等功能。FoxBrain 不仅具有强大的理解和推理能力，还针对中国台湾用户的语言风格进行了优化，在数学和逻辑推理测试中表现出色。

FoxBrain 的训练过程由 120 颗英伟达 H100 GPU 驱动，采用英伟达 Quantum-2 InfiniBand 网络进行扩展，仅用约四周时间就完成了。FoxBrain 基于 Meta Llama 3.1 架构，拥有 70B 参数。FoxBrain 在数学方面比基本的 Meta Llama 3.1 模型有了全面的改进。

关键词： 鸿海研究院推出具有推理能力的繁体中文大语言模型

打赏

0人已打赏