OpenRouter 上的 5 個「免費」模型推薦
from Pixabay
在這個 AI 應用百花齊放的時代,我們可以透過各種方式來接觸 AI。
可以使用線上服務——比如 ChatGPT,也可以直接使用 LLM API 來更加客製化自己的需求。
最近我開始使用 OpenRouter 這個平台上的 API 服務,對於 AI 開發人員或 LLM 重度用戶,想必不陌生。
本文介紹 OpenRouter 上的 5 個免費模型,幫助你快速上手並選擇合適的模型。
OpenRouter 是什麼?
OpenRouter 是一個語言模型的 API 聚合平台服務,讓使用者可以透過單一介面,就能夠付費存取多家公司的大語言模型,包括 OpenAI、Anthropic、Google 等大公司的 LLM API 產品。
而且像 LLaMa、DeepSeek 這類開源模型,你想要使用的話,除了在本地跑之外,也可以透過 OpenRouter 提供的 API 來使用。
好處就是你不用擁有機器、顯卡,就能體驗這些開源模型的能力,而且價格相對於閉源模型,通常有一定的競爭力。
總之,OpenRouter 不僅為開發者提供了統一的介面,更讓非技術出身的用戶也能輕鬆使用 AI。
白吃的午餐
更吸引我的是,它上面提供不少「免費」模型,只要在搜尋欄輸入「free」,即可找到供免費使用的模型。
這不禁引發了我的興趣!因為我最近在試用 VS Code Cline 這個 AI 開發外掛,發現它真的非常消耗 Token。
叫我付錢用 API——我不願意XD,太貴了。
剛好可以試試 OpenRouter 上的免費模型!順便寫下這篇心得。
在推薦模型之前,我們先來介紹一下在 OpenRouter 使用免費模型的規則與限制。
免費模型與使用限制
就在上個月,OpenRouter 調整了免費額度與規則,如下。
具體限制
- 未儲值或餘額不足 10 美元用戶:每日 50 次請求。(以前是 200 次)
- 帳戶餘額在 10 美元以上用戶:每日請求從以前的 200 次提高至 1000 次。
- 每分鐘 20 次請求:不論哪種用戶,免費模型維持每分鐘最多 20 次請求的限制,確保不會因短時間內大量請求導致伺服器超載。
- 影響範圍:此限制適用於所有免費模型。
這個變動顯然是逼你要儲值啊!
不過說真的,對於有儲值 10 美元以上的人,一天高達 1000 次的免費模型請求額度,我個人覺得還是蠻大方的——所以我儲值了XD
有了 1000 次的免費請求後,如何運用這些資源是一個值得思考的問題,否則空有額度卻無處使用也是白搭。
三個常見的應用場景
以下 3 個應用場景可供讀者參考,我自己其實也還沒有找到真正的殺手級應用。
沉浸式翻譯外掛
在 Chrome 使用「沉浸式翻譯」外掛,搭配 OpenRouter 提供的翻譯引擎,在瀏覽英文網頁時獲得更流暢、自然的翻譯體驗。
不過我預計六月才會啟用,因為目前還在消耗 Grok 送的免費 150 美元額度。
GUI 工具整合
指的就是那些讓你自己接 API 的軟體或服務,例如 AnythingLLM,可以將本地的文件轉成向量資料,並搭配語言模型進行 RAG 問答。
或者像 LoboChat、OpenUI 這些 Web 聊天工具,可以自訂模型來源為 OpenRouter,輕鬆切換不同模型、快速測試。
這裡提到的工具基本上都是開源的,即不用花錢。
VS Code Cline 外掛
如前所述,VS Code 擴充套件 Cline 有支援 OpenRouter,能直接在編輯器中呼叫 LLM 協助寫程式,是個實用的開發助手。
我也是因為它才開始使用 OpenRouter 的,不過對我而言這只是實驗性質,我日常開發還是使用 GitHub Copilot 為主。
雖然支援 OpenRouter 的 VS Code 外掛或 IDE 不少,但不一定都支援免費模型。如果你是為了寫程式而儲值,記得先研究一下工具是否支援免費模型。
模型評比網站推薦:LiveBench
新模型發表時,常常會強調自己跑分多高、表現多亮眼,而且我們在評估模型性能時,的確也需要一定的客觀指標——是否「真的」客觀則是另一個議題。
常見的跑分網站很多,有時候模型會針對這類網站進行最佳化,這相當於作弊。
因此,我個人主要參考 LiveBench 這個網站,透過它來了解新模型的戰鬥力!
這個網站好在哪,為什麼值得相信,請看 AI 的解說:
LiveBench 是一個高度可信的 LLM 基準測試平台,因為它通過動態更新的問題、客觀的自動化評分、學術與業界的支持、透明的數據公開以及與其他基準的公正比較,有效改善數據污染和評審偏見的問題。它不僅適用於研究人員評估模型性能,也為企業選擇合適 LLM 提供可靠參考。
不用說,我個人在看跑分的時候,會特別重視 LLM 在軟體開發的能力。
5 款值得一試的免費模型
接下來就簡單介紹一下,這些免費模型之中,我覺得值得使用的 5 個。你也可以參考上述網站自行評估。
必須強調,「中文能力」是我挑選模型的一大指標,所以像 Llama 這種中文不友善的,我連試都不想試。
考慮到這點,中國公司所開發的模型在這方面肯定有它的優勢。
1. DeepSeek R1
2025/05/29
: 更新模型連結為 0528 版本。
這個應該不用多說,某種程度上可以說是改變世界的開源模型。
開源模型在它誕生之前,很大程度上被視為一種玩具,但在它之後,大家發現開源模型是一個重要的發展方向,而且性能可以與閉源模型一較高下。
R1 絕對是跨時代的作品,而且到了現在,表現依舊名列前茅。
2. DeepSeek V3
▶️ DeepSeek: DeepSeek V3 0324 (free)
0324 又稱為 DeepSeek V3.1,是 DeepSeek 在 2025 年 3 月 24 日發表的更新版本。
DeepSeek V3 屬於「非推理」模型,而且寫程式的能力特別強,是 OpenRouter 網站上被大量工具用來寫程式的頂尖模型之一。
在所有開源模型中,用量基本上穩居第一名。
不過要特別注意:OpenRouter 上的這個免費版本,在 Input Token 超過 25K 之後,可能會出現回答時「不斷自我重複」的問題——我就遇到過。
3. Qwen3-32B
阿里巴巴的通義千問系列,英文是 Qwen。
Qwen3 這系列的模型非常新,發表還未滿一個月,而且全都是推理與非推理的混合型模型。可參考官方 blog 介紹,值得一讀。
它們本質上仍是推理模型,但可以透過提示詞「/no_think
」來關閉它的推理能力,這樣你就不用等待它在回答過程中的「自言自語」了。
而 Qwen3-32B 是「緊湊」模型中,規模最大的那個,能力相當不錯。
基本上擁有 32 GB 統一記憶體的 Mac 就能跑起來,接 API 的好處則是——輸出更快!
4. Qwen3-235B-A22B
▶️ Qwen: Qwen3 235B A22B (free)
除了「混合推理」這個特色之外,Qwen3 系列還包含了兩個 MoE 模型(混合專家模型):
- Qwen3-30B-A3B
- Qwen3-235B-A22B
這類模型的特色就是輸出結果(回答)時,只需要動用到一部分的參數,所以計算速度特別快——因為計算量少很多。
以 Qwen3-30B-A3B 為例,作為一個 30B 模型,它的「聰明程度」是 30B 等級的,但輸出速度卻像 3B 的小模型這麼快。
附帶一提,DeepSeek V3 也是 MoE 模型,只是通常不會特別強調。
Qwen3-235B-A22B 這樣超過 200B 的規模,很難在消費級硬體中跑起它,所以 API 更顯得有價值。
5. Google Gemma 3 27B
Google 推出的開源模型,個人評價很高,我曾經在〈訂戶限定 17:強大的 Gemma 3、上班前夕的花蓮之旅、Vibe Coding〉中大力推薦過。
雖然跑分比不上前述四個模型——畢竟它的規模相對較小,但繁體中文能力出色,適合對話、文章創作類的應用。
更難能可貴的是——它還有「視覺」能力。
備註:Google 在 OpenRouter 上還有另一款免費模型 Google: Gemini 2.0 Flash Experimental (free),屬於閉源模型,能力自然不在話下。但流量高峰時段常會出現 HTTP 429(限流),故不列入推薦名單。
表格比較
以下是這五個模型的簡易比較表,提供給讀者快速參考:
模型名稱 | 開發者 | 模型規模 | 特點摘要 |
---|---|---|---|
DeepSeek R1 | DeepSeek | 超大型 | 改變時代的開源推理型模型,號稱比美 OpenAI o1 |
DeepSeek V3 | DeepSeek | 超大型(MoE) | 非推理型,程式能力強,社群使用率第一 |
Qwen3-32B | 阿里巴巴 | 中型 | 混合推理模型,可以使用「非推理」模式 |
Qwen3-235B-A22B | 阿里巴巴 | 超大型(MoE) | 混合專家模型,平衡了性能與產出速度 |
Gemma 3 27B | 中型 | 多語言能力強,尤其是台灣繁體中文,適合對話與創作 |
結語:百花齊放的時代
綜上所述,這五款模型在生成品質、穩定性與實用性之間取得了較好的平衡。
無論寫程式、翻譯,還是想打造自己的 AI 工具,這些模型都能成為你起步的好夥伴。
希望這篇文章能幫助你快速上手 OpenRouter,並找到適合自己的免費模型。
讓我們繼續在 AI 的浪潮上,乘風破浪吧!