編者按:本文來自微信公眾號 藍字計劃(ID:NPO2020),作者:Hayward,創(chuàng)業(yè)邦經(jīng)授權轉載。
AI的聊天功能一向被網(wǎng)友們調戲為“人工智障”,網(wǎng)友和他們聊天以找樂子的居多。真的有人會和 AI “交心”嗎?
你好,有的。上周一位網(wǎng)友曬出一張截圖,是自己身患重病的父親在去世前夕和與豆包的對話,第一句是“我要去世了,豆包”。
現(xiàn)在的 AI 工具越來越“聰明”,和它聊天時往往還能得到窩心的回復,不少小學生、老年人已經(jīng)開始把 AI 聊天助手當作朋友。
我們對 AI 的依賴、AI 和我們生活的結合度,正走到歷史新高。
發(fā)現(xiàn)了嗎:過去搜索問題我們會先問百度,現(xiàn)在則會“問問DeepSeek”、“問問夸克”;如果需要做旅游攻略,還可以交給豆包、夸克生成答案。
經(jīng)過大浪淘沙后,中國海量的 AI 工具還漸漸形成了三條不同的前進路線,上面提到的DeepSeek、夸克和豆包,正是三類工具的代表產品。
AI 工具的“三國時代”,已經(jīng)悄悄開始了。
天下三分
說 2025 年是 AI 元年一點都不夸張。
QuestMobile的數(shù)據(jù),截至2025年2月,AI原生App月活躍用戶(MAU)突破2.4億,較去年同期凈增超1.15億,也就是說已經(jīng)有接近 2.5 億的人接觸過 AI 工具。
在商業(yè)領域,行業(yè)數(shù)據(jù)顯示,2024年中國AI核心產業(yè)規(guī)模達5784億元,同比增長13.9%;到了 2029 年,這兩個數(shù)字還會分別攀升至 1 萬億元和32.1%。
說 DeepSeek、夸克和豆包三分天下,三款軟件都擁有 Top 級別的月活是一大原因。
DeepSeek是國內AI 原生App 排名第一的軟件,今年 3 月的數(shù)據(jù)顯示月活能達到 1.94 億;夸克也不遑多讓,同期月活達1.48 億,去年暑期時夸克的峰值月活更是接近 2 億;豆包則經(jīng)歷了月活的暴增,從 2024 年的 173 萬增長至今年 3 月的1.1億,增速達到了 35 倍。
另一方面,在技術路線、應用場景上三個軟件剛好又“涇渭分明”。DeepSeek、豆包和夸克,分別代表了底層技術突破、用戶體驗重構和產業(yè)場景深耕三個維度,勾勒出中國AI工具的立體化發(fā)展脈絡。
三條路線,三個方向
相信天天都在用這三款軟件的人不少,但大家有沒有想過,為什么夸克豆包沒有像 DeepSeek 一樣擅長邏輯推理?
夸克的 AI 搜索功能結果,為什么會和DeepSeek 搜出來的有明顯的區(qū)別?
這正是 DeepSeek、夸克和豆包代表著中國 AI 工具三條不同發(fā)展路線的具體表現(xiàn)。
先說大家很熟悉的 DeepSeek。
DeepSeek作為中國AGI領域的代表,其核心競爭力體現(xiàn)在通用大模型的研發(fā)與開源生態(tài)構建,他們和其他 AI 廠商最大的不同在于專注于底層技術突破,而非商業(yè)化。
雖然也有傳統(tǒng)模型產品 V3,但在今天提起 DeepSeek 大家最先想起的肯定是推理模型 R1。
既然是「推理模型」,推理能力自然是R1 的優(yōu)勢,它在數(shù)學推理、代碼生成和復雜任務處理上實現(xiàn)了突破性進展,數(shù)學任務上的性能可與OpenAI的O1相媲美。
傳統(tǒng)大模型在回答同類型問題時,更容易遇到知識精細度不足與領域適配困難、復雜推理能力缺失、算力消耗與部署成本過高等問題,這都被 DeepSeek R1 一一解決了。
其中的關鍵是,DeepSeek R1 可以依靠混合專家架構(MoE)實現(xiàn)效率躍升,以強化學習突破數(shù)據(jù)依賴,借開源生態(tài)加速場景滲透,解決數(shù)學推理、復雜任務處理場景的各種問題。
技術架構上,強化學習驅動的高效推理帶來了大模型訓練的“規(guī)模效應”革命,對MoE架構進行優(yōu)化,相比傳統(tǒng)全參數(shù)模型降低30%的算力消耗,回答專業(yè)領域問題時延遲更低,實現(xiàn)“小力出奇跡”。
當然更加驚艷世人的是 DeepSeek R1 首次以長鏈邏輯與思維可視化的方式,展現(xiàn)了推理模型的特性,它也是全球首個展示完整推導過程的推理模型。
在推理能力的加持下,R1 的復雜任務分解能力大大提升,可逐步拆解跨領域問題。比如在解答高考數(shù)學題時,R1會逐步呈現(xiàn)概率計算路徑,而傳統(tǒng)模型只會直接輸出最終結果,用戶也可以從推理過程中找出模型的思考漏洞并進行改進。
DeepSeek的技術路線,決定了它更擅長自然語言處理和復雜推理類的問題,在代碼生成和編程輔助上也展現(xiàn)出了極強的能力。特別對金融、銀行和科研機構來說,DeepSeek 的出現(xiàn)能大大增加數(shù)據(jù)分析的效率,也算是掀起了一股產效比革命。
而且這種技術路徑不僅提升了模型的泛化能力,還通過MIT開源協(xié)議降低了開發(fā)者的使用門檻,推動AI技術的普惠化。
從行業(yè)趨勢看,DeepSeek的發(fā)展與《2025中國AIGC應用全景圖譜報告》中提到的“模型層關鍵趨勢”高度契合。
報告提到,中國大模型的競爭正從“技術有無”轉向“代差級領先能力”,而DeepSeek通過混合專家系統(tǒng)(MoE)和多模態(tài)技術突破,在模型深度推理能力上確實建立了差異化優(yōu)勢,還成為了全世界學習的對象。
此外,深度求索主張的開源策略與國內廠商“協(xié)作創(chuàng)新”的趨勢一致,現(xiàn)在還有自稱AI 工具的軟件沒接入 DeepSeek 嗎?
DeepSeek,偉大。
然后來談談夸克。
夸克和 DeepSeek 的最大不同之處在于,DeepSeek 的網(wǎng)頁搜索功能是一種輔助功能,夸克則把 AI 搜索作為了工具的核心。
阿里在定義夸克的時候,將這稱為“AI與行業(yè)場景的深度融合”。
阿里對夸克的期望很高,把它定位為「AI普惠平臺」:以“2億人的AI全能助手”為品牌核心,依托阿里生態(tài)實現(xiàn)“搜索+生成”雙向增強,確立了“AI+搜索”“AI+辦公”“AI+教育”三大主線。
阿里在打造 AI 時代的夸克時,在“提升搜索效果”上下了非常大的功夫,所以今天的夸克,是這樣的:
能搜到幾秒前發(fā)生的大新聞。夸克可以依托阿里云通義大模型與搜索生態(tài)的深度融合,實現(xiàn) 10 秒每次的更新頻率,抓取新消息的延遲也降低到了 3 分鐘以內。
弄了一個「超級框」。夸克將將AI對話、深度搜索、內容生成(PPT、文案)、學術研究等功能全塞了進去,它有點像過去的“百度一下”,不需要分門別類,簡化了用戶在搜索時的思考成本和操作邏輯。
擁有相對更低的 AI 幻覺。夸克設置了三審三校機制,醫(yī)療、法律等專業(yè)領域生成需經(jīng)行業(yè)專家審核,結合知識圖譜校驗,據(jù)稱可以將醫(yī)療問答錯誤率控制在5%以下。
從結果來看,避開 DeepSeek 和豆包等軟件的鋒芒,主攻 AI 搜索的夸克是成功的。每月?lián)碛?1.5 億上下的月活基本奠定了它在 AI 搜索工具的龍頭地位,并在去年高考期間靠著填報志愿、成績分析、職業(yè)規(guī)劃等功能狠狠出圈。
為了助力夸克成功,阿里也是費盡心思??淇?AI 能力依托于阿里的心血結晶:通義千問大模型。
雖然是一款基于Transformer和MoE架構的、不時髦的非推理類傳統(tǒng)大模型,但能力還真挺行。
實際上根據(jù)基準測試平臺Chatbot Arena的評測榜單,通義Qwen2.5-Max超越DeepSeek-V3、Open AI o1-mini和Claude-3.5-Sonnet等模型,以1332分位列全球第七名,是中國非推理模型中最強的。
具體來看,Qwen2.5-Max在數(shù)學和編程等單項能力上排名第一,在硬提示(Hard prompts)方面排名第二。
而在LMArena的盲測榜單中,Qwen2.5-Max 的數(shù)學推理(如MMLU-Pro、LiveCodeBench)和硬提示(Hard prompts)處理能力分別位列全球第1和第2,超越DeepSeek-V3(排名第8)。
夸克正是從通義千問力得到了文本、圖片、音頻、視頻聯(lián)合解析的多模態(tài)融合能力,在一些需要邏輯推理的場景中也可以發(fā)揮通義千問數(shù)學能力強的優(yōu)點。
夸克讓阿里看到了進軍在AI 領域的機會,2024 年開始夸克在年度下載量、年度月活兩個關鍵數(shù)據(jù)上屢創(chuàng)新高,也是疫情以來阿里在C 端增幅最快的產品之一。
或許對輕量化瀏覽器出生的夸克來說,延續(xù)“瀏覽器”這一歷史定位,從搜索路線切入 AI 的 C 端,期待成為DeepSeek、豆包這樣的國民級軟件,已經(jīng)是最好選擇。
最后,是今天開頭那則小故事的主角:火山引擎的豆包。
實際上,可能對大多數(shù)的用戶來說,豆包更加符合他們對 AI 工具的認知。能吟詩作對、能畫畫做視頻,為用戶改文案,生成某些平臺專屬的風格文案…
字節(jié)對豆包的定位是“全民AI入口”,主攻消費級市場,創(chuàng)意生成和社交娛樂是它的最大賣點,多模態(tài)交互是整個工具的靈魂。
豆包代表了中國AI工具在C端場景的深度滲透。比起 DeepSeek它功能更多;比起夸克,它生圖效果更好。
如果你覺得豆包不行,字節(jié)還為它安排了兩個馬仔打手保駕護航:即夢 App主打輕量級的視頻和圖片生成,可靈則面向專業(yè)級的企業(yè)用戶。
再依托字節(jié)的流量生態(tài),AI 產出的視頻素材直接給到短視頻平臺使用,圖片素材可以同步到飛書上作為插圖,美美實現(xiàn)生態(tài)閉環(huán)。
為了實現(xiàn)這些創(chuàng)意生成效果,過去豆包 AI依靠Transformer與擴散模型結合的基礎架構,結合語音-文本聯(lián)合建模和視覺生成技術的多模態(tài)技術融合,為用戶提供多模態(tài)功能。
4月17日,豆包發(fā)布了全新的1.5深度思考模型,采用了 MoE 架構,總參數(shù) 200B、激活參數(shù) 20B。
在繼續(xù)提高多模態(tài)能力的同時,豆包1.5 強化了模型的數(shù)學、編程、科學和推理能力,測試表現(xiàn)甚至超過DeepSeek-R1、QwQ-32B等國產推理模型,與OpenAI o1、o3-mini-high等模型能力相仿。
隨著架構優(yōu)化、資源分配優(yōu)化和推理效率的提升,深度思考大模型讓豆包的圖片生成、視頻生成能力進一步升級,不僅支持了“邊想邊搜”、“視覺理解”等實用能力,豆包文生圖 3.0 也將生成圖片的最大分辨率提高到了 2k 級別。
依托字節(jié)系應用的海量流量,豆包預計還能持續(xù)在月活上創(chuàng)新高。哪怕在創(chuàng)意生成的絕對水準方面還沒有達到 GPT-4o 的高度,但作為一款使用門檻低、上手簡單的國產 AI 軟件,豆包完全還可以美美地偏安一隅。
最終,DeepSeek代表的通用大模型、豆包代表的消費級應用、夸克代表的行業(yè)解決方案,構成了“基礎研究-場景落地-生態(tài)協(xié)同”的完整鏈條。
三個 AI 工具都已經(jīng)各自搶好賽道??鋸堻c說,只要你需要用 AI 工具,就繞不開上面三個軟件里的任意一個。
AI 圍城
回過頭來,還是不勝唏噓。去年的今天,主流的 AI 工具搜索的內容、生成的文字都幾乎處于不可用狀態(tài),當時也不會有人想在工作上用 AI 工具作為輔助,畢竟大概率是會幫倒忙的。
但一年之后,我們身邊涌現(xiàn)了各種各樣的 AI,不僅查資料的豐富程度、準確程度大幅度提高,AI 制作的頭圖、插圖已經(jīng)司空見慣。從 DeepSeek 平地驚雷的那一刻起,我們的生活就被深深改變了。
就是,這也不完全是一件好事。
AI 工具泛濫的一大問題是AI 幻覺問題日益嚴重,比如大家信賴的 DeepSeek R1,偏偏是眾多工具中 AI 幻覺偏高的;其他的 AI 軟件雖說各種手段降低了幻覺率,但其實也沒好到哪去。
在一部分的測試中, R1 的事實性測試幻覺率高達22.33%,更糟的是一些由幻覺產生的“AI胡說八道”又會成為語料,重新喂回給 AI,形成惡性循環(huán),最終把整個中文互聯(lián)網(wǎng)都污染了。
哪怕你不用AI,也不知道網(wǎng)上哪些是由 AI 編造的假信息。
|又是一次言之鑿鑿的胡說八道
另外,開頭那個關于豆包的新聞,總讓人止不住擔憂:老人家寧愿向 AI 告別,也不愿意和家人傾訴。
畢竟遠在大洋彼岸的美國,一年前有一位名叫Sewell Setzer 的弗羅里達州男孩,在聊天機器人程序 Character.ai的“慫恿”下選擇自殺,年僅 14 歲。現(xiàn)在他的家人還和 AI 軟件的公司打著官司,這是一宗“人類和 AI 走得太近”引發(fā)悲劇的典型案例。
當 AI 越來越智能,聊天機器人越發(fā)像人,我們就像身處由 AI 構筑的圍城里。把作品、言論、思想喂給 AI 作為語料,把最后的心情、感覺、心愿留給 AI,會不會終有一天,人類變得和 AI 太“親近”,又和人類太“疏遠”?
在這 AI 三國鼎立的一刻,人類和人工智能之間的關系,開始慢慢變得微妙起來。
本文為專欄作者授權創(chuàng)業(yè)邦發(fā)表,版權歸原作者所有。文章系作者個人觀點,不代表創(chuàng)業(yè)邦立場,轉載請聯(lián)系原作者。如有任何疑問,請聯(lián)系editor@cyzone.cn。