
研究
在 APMIC,我們致力於推動 AI 技術研究與應用創新,深耕私有化 LLM、模型微調(Fine-tuning)、蒸餾等前瞻技術。我們不僅專注於開發最適合企業的 AI 解決方案,更希望透過淺顯易懂的方式,將我們的研究成果分享給更多人,讓 AI 技術不再是艱深的專業知識,而是每個人都能理解並應用的強大工具。
深耕 AI 語言模型十年
自 2017 年創立以來,我們始終專注於一件事——打造更適合產業的垂直主權AI模型。
關鍵里程碑摘要:
-
2017 - 2022: APMIC 成立,率先佈局自然語言處理領域,研究 BERT、GPT-2、PaLM 等世界級技術
-
2023 - 2024: CaiGunn 模型問世,導入 MoE 架構,效能大幅躍進。
-
2025 以後: 發布 ACE 繁中系列模型,以更輕量、更精準、更符合企業應用的邏輯推論能力,重新定義企業 AI 應用

CaiGunn 34B
APMIC 繁中通用語言模型
於 2024 年 1 月登上由 Hugging Face 設立的全球開放大語言模型排行榜,以平均分數 71.19 暫居全球第 64 名,並榮獲臺灣第 1 名,成為臺灣在國際語言模型領域的重要里程碑。
CaiGunn 34B 採用 APMIC 自研的 Brainformers 架構,結合 LLaMA 模型基底,融合 Mamba 動態計算流程、Transformer 架構與 Mixture of Decoding Experts(MoDE)技術,打造具備高精度與靈活性的生成能力。全模型運行於 NVIDIA NeMo Framework 上,具備高效的分散式訓練與推理部署能力,支援企業在地端導入與私有化應用需求。

APMIC 繁中推理模型、多模態模型
ACE 模型是 APMIC 菁英 AI 模型團隊基於「 PrivModel 微調與蒸餾解決方案」打造的繁體中文模型,也全台第一批通過政府 AI 評測機構(人工智慧評測中心 AIEC)語言模型可信任測試的產品。訓練資料涵蓋核心繁體中文語料領域,包含專業知識、科學技術、台灣人文社會,能有效處理複雜邏輯與長文本任務。
企業得以輕鬆打造專屬的地端模型,無論是在中低階 GPU 或嵌入式平台上部署,皆可順暢運行並即時回應,大幅降低導入 AI 解決方案的技術與成本門檻。
搭配 PrivStation 一站式 AI 解決方案執行超多方便應用,例如公文與報告生成、文件審查、公文檢索等應用,適合金融、政府、製造產業等領域使用。

【模型訓練技術論文】使用 NVIDIA NeMo 進行多節點指令微調:擴展 Qwen2.5-32B 並重塑 s1 模型
APMIC 研發部門研究員 / LLM 工程師 Ethan Kuo
APMIC 內部以 NVIDIA NeMo 進行跨節點分散式訓練,沿用 s1K 的 1,000 筆數理推理資料,對 Qwen2.5-32B-Instruct 進行微調以重現論文觀察。由於當時(2025/03)NeMo 正由 1.0 遷移至 2.0,且 NeMo 2.0 尚未完整提供 Qwen2.5-32B 的現成 recipe,我們手動修補了訓練配置與流程,並在 16 張 H100 的跨節點環境完成訓練。本篇文章將整理環境與設定修補重點、訓練流程,以及微調前後在 benchmark 上的結果與觀察。

.png)





.jpg)

