Início » 「中小企業友好」 IBM 發表 Granite 4.0小語言模型 輕量 高效 低成本

「中小企業友好」 IBM 發表 Granite 4.0小語言模型 輕量 高效 低成本

全球第一個獲得 ISO/IEC 42001:2023 AI 管理系統認證的開源模型

專為處理代理型關鍵任務而生 可單獨部署或作為大型複雜推理系統的關鍵模組

台北2025年10月7日 /美通社/ — IBM 日前發表其最新一代企業級「小語言模型」 Granite 4.0,以創新的混合式架構,結合 Mamba-2Transformer 技術,實現前所未有的效能與效率。Granite 4.0 不僅大幅降低記憶體與硬體成本,更提供企業部署 AI 的安全性、可控性與彈性,為台灣各類型企業的 AI 應用落地提供強力支援。

IBM 發表「中小企業友好」的小語言模型 Granite 4.0,處理AI 複雜任務時大幅降低記憶體的使用量達 70%,推理速度加快 2 倍,同時支援更平價的 GPU包括家用硬體;大幅降低企業部署AI成本,更提高應用AI 的安全性、可控性與彈性。
IBM 發表「中小企業友好」的小語言模型 Granite 4.0,處理AI 複雜任務時大幅降低記憶體的使用量達 70%,推理速度加快 2 倍,同時支援更平價的 GPU包括家用硬體;大幅降低企業部署AI成本,更提高應用AI 的安全性、可控性與彈性。

Granite 4.0已在 IBM watsonx.ai 平台正式上線,並同步支援 Dell Technologies (Dell Pro AI Studio 與 Enterprise Hub)、Docker Hub、Hugging Face、Kaggle、LM Studio、NVIDIA NIM、Ollama、OPAQUE 及Replicate 等平台;未來也將支援 Amazon SageMaker JumpStart 與 Microsoft Azure AI Foundry。

混合式架構,創造效能與成本的完美平衡

Granite 4.0 採用創新的 Mamba/Transformer 混合架構,突破傳統 Transformer 模型處理長文本的效能瓶頸。Mamba 架構可線性擴展上下文長度,讓 Granite 4.0 在處理複雜任務時,大幅降低記憶體的使用量達 70%,推理速度卻加快 2 倍,同時支援更平價的 GPU包括家用硬體。這項突破對台灣中小企業與開發者意味著高效能 AI 不再是高成本的同義詞,而是人人可及的技術資源。

多元模型版本,滿足各種企業需求

Granite 4.0 提供多種模型規格,靈活應對不同場景:

  • Granite-4.0-H-Small:總參數量32B的混合式專家模型,活躍參數9B,適合客服自動化、多工具代理任務;
  • Granite-4.0-H-Tiny:總參數量7B的混合式專家模型,活躍參數1B,適合邊緣運算與地端部署;
  • Granite-4.0-H-Micro:總參數量3B 的混合式模型,快速執行關鍵任務;
  • Granite-4.0-Micro:傳統 Transformer 架構,適用於尚未支援混合架構的平台。

Granite 4.0 所有模型皆提供 Base 與 Instruct 版本;並預計於2025年底推出強化邏輯推理的Thinking 模型。

小模型,大效能

Granite 4.0模型雖然尺寸精簡,但在多項基準測試中的表現,超越同級與其他大型開源模型:

  • 在 Stanford IFEval 指令遵循測試中,Granite-4.0-H-Small 表現優於所有開源模型(除 Llama 4 Maverick 外);
  • 在 Berkeley Function Calling Leaderboard v3 中,Granite-4.0-H-Small 以更低成本達到與大型模型相同的工具調用準確率;
  • MTRAG 多輪檢索增強生成測試中亦有亮眼表現。

上述成果歸功於 IBM 全面升級了模型架構、訓練方法與資料品質,包含使用一個精心編製、聚焦於企業應用的 22 兆字元規模的語料庫。Granite 4.0 的預訓練資料涵蓋多元來源,包括 DataComp-LM (DCLM)、GneissWeb、TxT360 子集、Wikipedia 以及其他與企業場景高度相關的資料來源。為了增強模型處理企業任務的表現,這些模型經過後訓練(post-training),涵蓋語言理解、程式碼生成、數學推理、多語言處理、安全性、工具調用 (tool calling)、檢索增強生成(RAG)與資安等多個領域,並結合合成資料與開放資料集進行優化。

安全、可信、可控,是企業部署的首選

Granite 4.0 是全球第一個獲得 ISO/IEC 42001:2023 AI 管理系統認證的開源模型家族,展現 IBM 對 AI 安全與負責任治理的高度承諾:

  • 所有模型皆經過加密簽章,確保來源與完整性;
  • 訓練資料皆經過倫理審查與企業授權;
  • 若在 watsonx.ai 平台使用 Granite 模型,IBM 提供無上限第三方 IP 賠償保障。

此外,IBM 與 HackerOne 共同宣布「找尋Granite漏洞」獎勵計畫,最高獎金達美金十萬元,鼓勵開發社群共同提升 AI 安全。

企業部署AI更簡單、更靈活

Granite 4.0 支援多種硬體與推理框架,讓台灣企業與開發者可快速整合至現有系統:

  • 支援 AMD Instinct™ MI-300X GPU 與 Qualcomm Hexagon™ NPU,適用於行動與邊緣設備;
  • 相容於 vLLM、llama.cpp、MLX、NexaML 等主流推理框架;
  • 可透過 Unsloth 進行微調,並整合至 Continue 等開發者工具。

開發者可在 Granite Playground試用 Granite 4.0,並參考 Granite Docs 中的 RAG、摘要、自動化教學資源。

IBM 將繼續擴展 Granite 4.0 模型家族,將推出:

  • 更小型的 Medium 與 Nano 模型,強化邊緣AI部署能力;
  • 強化邏輯推理的 Thinking 模型,支援複雜決策與分析任務;
  • 持續優化架構與平台支援,推動 AI 普及化與在地化。

IBM推出Granite 4.0,持續倡議與實現開放、安全、高效的企業級AI,協助全球企業在數位轉型旅程中穩健前行。Granite 4.0 模型已在 IBM watsonx.ai 平台開放使用,並採用 Apache 2.0 開源授權。更多資訊請參閱IBM Granite 4.0網頁。

關於 IBM

IBM 是全球領先的混合雲、人工智慧及企業服務提供者,服務遍及全球 175 多個國家。IBM 協助企業從資料中獲得商業洞察、簡化流程、降低成本並增強競爭力。來自金融服務、電信和醫療等關鍵領域的機構,採用 IBM 混合雲平台及 Red Hat OpenShift 進行數位轉型。IBM 在人工智慧、量子運算和產業導向的雲端解決方案及企業服務領域持續創新,為客戶提供開放且靈活的選擇。公司秉持誠信、透明治理、社會責任、多元包容的企業文化,奠定了 IBM 的業務基石。

台灣 IBM 公司新聞室:https://taiwan.newsroom.ibm.com/

新聞聯絡

IBM 公司公關部 Kate Liu kateliu@cn.ibm.com

聯絡我們

平台媒體,聚焦中葡關係。

平台編輯部

關於我們

電子報

訂閱平台電子報,縱觀全球新聞

© 2025 – Copyright Plataforma Media.

Uh-oh! It looks like you're using an ad blocker.

Our website relies on ads to provide free content and sustain our operations. By turning off your ad blocker, you help support us and ensure we can continue offering valuable content without any cost to you.

We truly appreciate your understanding and support. Thank you for considering disabling your ad blocker for this website