談論 AI 就繞不開大模型,它是 AI 技術(shù)應用的核心。
簡單解釋 AI 大模型,就是一個通過特定方法和大量數(shù)據(jù)訓練出來的 “自主化程序”,這個程序可以根據(jù)用戶輸入的指令自己做出 “判斷和思考” 后再進行回復。
傳統(tǒng)程序雖然也可以執(zhí)行用戶的指令,但回復的內(nèi)容和方式不會超出一開始預設(shè)的范圍,非常有限。
而 AI 大模型則大大拓展了這個邊界,我們不用提前預設(shè)各種條件和邏輯,它就會自己去理解問題再決定給出什么結(jié)果。
當然,這個邊界只是不能生成圖片(截止到2026年初)。而 Google 開發(fā)的 Gemini 大模型則是多模態(tài)模型,可以生成圖片和視頻等內(nèi)容。
不同模型會有不同的表現(xiàn)和優(yōu)劣,但因為大模型的開發(fā)需要尖端的技術(shù)和龐大的規(guī)模(訓練),門檻極高,所以市面上主流的大模型數(shù)量并不多,可以簡單分為國內(nèi)和國外兩個陣營。
國外的主流大模型包括 OpenAi 開發(fā)的 ChatGPT,Google 開發(fā)的 Gemini,Anthropic 開發(fā)的 Claude,xAI 的 Grok 等。
國內(nèi)的主流大模型則包括字節(jié)開發(fā)的豆包,阿里開發(fā)的千問 Qwen,深度求索開發(fā)的 Deepseek,月之暗面開發(fā)的 Kimi 等。
因為前面說過大模型的局限性,所以為了應對不同的應用場景,團隊就會將它們裂變出不同的版本。比如千問既有 Max 語言大模型,還有 Omni 全模態(tài)(文字、圖片、音頻、視頻)大模型,針對處理問題的難易度又分成了 Max、Plus、Flash、Lite 等版本。
完整的大模型體積和參數(shù)都非常龐大,需要部署到專屬的算力中心,并通過云服務來實現(xiàn)用戶的訪問和使用。也就是需要聯(lián)網(wǎng)使用,但因為國內(nèi)網(wǎng)絡服務的限制(不可抗力),我們無法通過國內(nèi)電信訪問國外的主流大模型。
雖然說國內(nèi)大模型的水平在這幾年突飛猛進,但離國外的大模型還有一定的差距,在實際工作場景中多數(shù)應用的也是國外大模型,所以訪問它們就需要大家自己發(fā)揮主觀能動性解決了。
順便再解釋一個基礎(chǔ)的問題,大模型除了遠程訪問以外,也可以在本地進行安裝。部分團隊(如千問)會在網(wǎng)上開源自己的大模型供其它人下載和使用,當我們下載到本地后就可以用 GPU 來運行它。但因為大模型對性能的要求極高(旗艦顯卡起步),所以本地運行的效果要大打折扣。
而一些企業(yè)內(nèi)部或行業(yè)專屬的大模型,往往都是使用這些開源大模型進行二次訓練和調(diào)試后的結(jié)果。還有一些針對特定硬件(如手機、眼鏡)和特殊應用場景開發(fā)的小模型,就暫時不在我們的討論范圍之內(nèi)。
前面講過大模型可以類比成一種 “程序”,且它還是后端服務器上運行的程序。想要對這個程序?qū)崿F(xiàn)命令的輸入并返回它處理的結(jié)果,就需要應用前端的工具來實現(xiàn)。
比如我們打開豆包的官網(wǎng),就可以使用這個網(wǎng)頁對豆包大模型提出問題和要求,然后網(wǎng)頁上就會返回它處理后的結(jié)果。這個網(wǎng)頁就是使用大模型的工具,而這只是 AI 工具的其中一種形式,還可以是本地應用程序、手機 APP、小程序、硬件定制系統(tǒng)等等。
我們大多數(shù)人開始接觸 AI 大模型,都是從這些官方的工具開始,它們最基本的功能就是根據(jù)指令返回文字或圖片信息,我們會把它們當成是一種可以對話的人工智能客服。
但實際上它們可以發(fā)揮的作用遠不止于此,比如幫你整理本地的文件夾清理重復的文件,幫你自動修圖并完成動態(tài)相片的剪輯,幫你編寫程序并自己運行和檢測等等。想要實現(xiàn)對話以外的其它功能,就需要借助特定的工具才能實現(xiàn)。
所以除了最基礎(chǔ)的對話工具外,行業(yè)還衍生出了很多激發(fā)大模型潛力的 AI 工具。它們可以借助大模型完成程序開發(fā)、視頻剪輯、操作托管、熱點整理、消息推送等等。
到這里我們就要清楚,AI 大模型是大模型,工具是工具,大模型是基座,而工具是大模型的具體表現(xiàn)和應用形式。
我們更進一步認識 AI 工具,就可以把AI工具分成官方工具和第三方工具兩個種類。
官方工具就是 OpenAI、Google 等大模型企業(yè)自己開發(fā)并綁定自家大模型的產(chǎn)品,而第三方工具則是其它團隊開發(fā),再接入到大模型進行使用的工具。
比如本地聊天機器人 Cherry Studio,它本身只是個簡單的聊天對話工具,可以自己創(chuàng)建對話角色/助手,但需要接入大模型以后才能進行對話。還有著名的AI編程工具 Cusror,只有接入大模型以后,它才可以實現(xiàn) AI 編程和代碼管理。還有前陣子火遍全球的龍蝦 Openclaw,也只是個本地工具,需要接入大模型后才能識別本地的文件和執(zhí)行命令。
官方能提供的 AI 工具與服務往往很有限,所以在真實項目流程中,我們就會混合使用多種工具來完成工作。就像以前做一套項目除了用 Figma以外,還要結(jié)合使用 Adobe PS、AI、C4D、AE 等軟件。
而第三方工具和官方不同的是,官方工具默認連接自家的大模型,用戶直接登錄就能使用。而第三方工具要接入大模型,就需要進行額外的配置,也就是添加大模型的 —— API。
API 就是接口,是前端工具連接后端服務器的通道,而這個通道默認是上鎖的,還需要提供對應的密鑰(API Key)才能正常訪問。
部分工具會自己接入各大模型的 API,用戶只能選擇它提供的模型,并只需要對這個工具進行付費即可。
另一部分工具則需要用戶自己選擇模型和配置 API,需要我們訪問大模型的 API 開放平臺進行申請,然后再將它們生成的 API Key 填入到工具中完成連接。
API Key 就像是一個電話號碼,當我們申請完并進行使用,就會產(chǎn)生一定的 “流量”,而 AI 產(chǎn)生的流量用專業(yè)術(shù)語形容叫詞元 Token。
使用 API 完成的任意 AI 服務,都會消耗 Token,且因為 AI 的計算成本極高,所以主流大模型都會針對 Token 消耗量進行收費。就像電信運營商一樣,既有包月服務附帶一部分流量,超出部分還要按量計費。
在實際的 AI 工具使用過程中,Token 的消耗是極其巨大的,往往會造成沉重的成本,而這個市場也遵循一分錢一分貨的真理,越好的大模型價格就越貴。以最適合編程的大模型 Claude Opus 為例, 一個程序員高頻使用消耗的 Token 賬單可以從數(shù)千到數(shù)萬元不等。所以我們也會從性價比的角度出發(fā),來搭配不同的模型進行使用。
總結(jié)我們應用 AI 的本質(zhì),就是通過工具來操作大模型。而工具的作用不同,大模型本身的特性和價格也不同,就導致我們在面對一個復雜的任務時,需要選擇多種 AI 工具和不同大模型來實現(xiàn)。
學習使用 AI,和傳統(tǒng)的單一軟件教學不同,不是只學會某個工具的功能和操作方法,而是了解不同的 AI 工具以及大模型的特性,通過組合它們來實現(xiàn)自己目標的方式。這不是設(shè)計或產(chǎn)品思維,而是工程思維的具體應用。
轉(zhuǎn)載自 優(yōu)設(shè)網(wǎng)
蘭亭妙微(藍藍設(shè)計)www.axaxx.cn 是一家專注而深入的界面設(shè)計公司,為期望卓越的國內(nèi)外企業(yè)提供卓越的大數(shù)據(jù)可視化界面設(shè)計、B端界面設(shè)計、桌面端界面設(shè)計、APP界面設(shè)計、圖標定制、用戶體驗設(shè)計、交互設(shè)計、UI咨詢、高端網(wǎng)站設(shè)計、平面設(shè)計,以及相關(guān)的軟件開發(fā)服務,咨詢電話:01063334945。

藍藍設(shè)計的小編 http://www.axaxx.cn