主人在调教室性调教女仆游戏_日韩欧美高清一区_日本在线视_日日草视频_欧美成人se01短视频在线看_日本网站在线看

首頁 > 實用技巧 > 干貨教程 > “開源模型驗貨官”Perplexity,給Kimi K2蓋了個戳

“開源模型驗貨官”Perplexity,給Kimi K2蓋了個戳

發(fā)布時間:2025-07-21 23:58:43

Perplexity 每一次納入新模型,都是很強的信號:這一次,亮的是 Kimi K2。

7 月 13 日,Perplexity 聯(lián)合創(chuàng)始人兼 CEO Aravind Srinivas 在 X 上發(fā)布消息:“Kimi K2 的內部評測結果非常驚艷,我們很快會啟動 post-training。”

Perplexity的站臺,讓K2在開源社區(qū)的熱度繼續(xù)飆升,這種盛況并不陌生——上一次出現(xiàn)類似的轟動效應,正是Perplexity宣布選擇納入DeepSeek-R1的時候。

這背后反映出一個有趣的現(xiàn)象:對于全球開發(fā)者來說,Perplexity用不用某個開源模型,實際上已經(jīng)演變成了一個重要的風向標。它所指向的,不僅僅是技術優(yōu)劣,更是開源模型能否經(jīng)受住真實產(chǎn)業(yè)環(huán)境考驗的關鍵信號。

AI搜索是離“真實世界任務”最近的試煉場,而Perplexity對模型的需求遠不止“便宜”這么簡單。

Aravind曾在Reddit上解釋為什么沒有接入GPT-4.5:“GPT-4.5的解碼速度只有11個token/秒,相比之下,4o是110個token/秒(快10倍),我們自己的Sonar模型是1200個token/秒(快100倍)。這導致用戶體驗不佳,因為他們期望快速、準確的答案。”

換句話說,實時響應和低延遲是選型的生死線。Perplexity的峰值請求量可達日常十倍,任何超過兩秒的等待都會顯著降低用戶體驗。在vLLM + FP8實測中,K2的MoE架構僅激活32B參數(shù),在相同硬件條件下輸出速度比R1快一倍,且單位成本更低,這正是高并發(fā)場景下經(jīng)濟與性能的最佳平衡點。

今年4月,Aravind預告了Perplexity的系列新功能,他強調這不是簡單的產(chǎn)品改動,而是底層模型的重構:“我們需要重寫基礎設施才能大規(guī)模實現(xiàn)。”

他描述的核心功能是更強大的深度研究代理,能夠思考30分鐘或更長時間,“包括工具使用、交互式和代碼執(zhí)行功能,就像Manus等最近的原型所展示的那樣。”

這本質上是一個純Agent模式:給定自然語言需求,模型必須自主拆解任務、調用工具、執(zhí)行代碼,最終生成完整報告。這種能力恰好與Kimi K2的“模型即Agent”理念完全對齊——K2不是把Agent能力當作后訓練插件,而是在預訓練階段就將原生Agent技能刻入權重。

K2在訓練階段引入了數(shù)百萬條合成Agent任務,覆蓋搜索、瀏覽器、日歷、Python、SQL等17種真實工具調用場景。模型學會在單一會話內連續(xù)編排16-20步操作,無需人類編寫工作流。官方演示中,K2用16次IPython調用將13萬行原始數(shù)據(jù)完成清洗、建模、繪圖并輸出交互網(wǎng)頁報告,全程零人工干預——這直接對應Perplexity設想的“30分鐘自主研究”。

當然,選擇開源模型的更深層原因在于完整的控制權。擁有完整權重意味著Perplexity可以任意進行LoRA、RLHF、工具蒸餾,無需擔心調用頻率、并發(fā)上限或隱私合規(guī)問題。K2采用MIT改協(xié)議,月活低于1億即可商用,Hugging Face直接提供fp8/fp16全套權重,128K上下文窗口足夠一次性處理整份財報。對Perplexity而言,這意味著“模型-索引-工具”三層架構可以完全私有化,不再受任何閉源條款約束。

Perplexity 在其發(fā)展過程中,逐步從依賴 OpenAI 的 GPT 模型轉向使用開源模型,并在此基礎上進行了自研和微調。

2023年下半年,Perplexity 宣布推出兩款新的“pplx-7b-online”和“pplx-70b-online”,分別基于開源模型 Mistral-7b 和 LLaMA 2-70b 構建。“我們從LLaMA-2發(fā)布之日起就開始使用開源模型,”Aravind Srinivas說道。

從模型特點來看,Mistral-7B以輕量化和高速度成為早期嘗試,驗證了小模型在特定任務的可行性;Llama-2-70B提供了更廣的知識覆蓋面;隨后,Perplexity還采用了Code Llama-34B,補強了代碼相關的垂直能力。

真正的轉折點出現(xiàn)在2025年2月,DeepSeek-R1讓Perplexity完成了從“使用開源模型”到“基于開源模型自研”的關鍵跳躍,獲得了完整的權重控制能力。而后,Perplexity又繼續(xù)深度調優(yōu)Sonar模型,展現(xiàn)了自研能力的成熟,專門針對搜索問答場景進行優(yōu)化。

如今選擇Kimi K2,正是這一戰(zhàn)略的最新體現(xiàn)——不僅在速度和成本上優(yōu)于R1,其原生Agent能力更完美契合了“30分鐘自主研究”的產(chǎn)品需求。

綜合來看,Perplexity的模型選型必須在高性價比與高性能之間找到平衡,同時滿足特定的產(chǎn)品需求。由于目前尚無開源模型能完全達到其標準,Perplexity只能階段性地選擇最優(yōu)解,這種“擇優(yōu)而用”的策略反而讓其成為了開源模型能力評判的重要風向標。

干貨教程更多>>

BBA中國決戰(zhàn)時刻:寶馬南京600人技術軍團打響“諾曼底” 奔馳和手表合作的Smart,越來越大了? 蘇州站智駕大賽,小米YU7擺脫墊底,魏牌藍山“意外”第二,阿維塔12成功衛(wèi)冕! 長城高層人事巨震!三大核心品牌換帥,引入新勢力背景高管 潮玩大玩具,24小時訂單破2萬,2026款哈弗大狗限時9.89萬元起售 拆解全球車馬自達EZ-6,拆出4個不可思議 樂道沈斐:“我更期待交付的成功。” 燃油轎車賣不動了?6月銷量榜單出爐 18款銷量過萬 軒逸第二 BJ40 燃油正式上市:12.69 萬起開啟越野平權時代,專業(yè)性能觸手可及 理想汽車,是一個值得被尊重的車企,我只說兩句 因起火、轉向等問題,林肯在華召回4863臺車輛,有你的車嗎? 魏建軍給賈躍亭做了嫁衣,高山8換臉成“美國高科技” “開源模型驗貨官”Perplexity,給Kimi K2蓋了個戳 從諾基亞到 HMD 的掙扎,將縮減在美國的運營規(guī)模,宣布退出美國市場 消息稱小米汽車上周新增訂單破9000 現(xiàn)在鎖單YU7最快41周交付 近億元機器人大單,優(yōu)必選拿下,2025年規(guī)劃人形機器人產(chǎn)能1000臺,預計交付幾百臺 得物與小紅書,互相抄作業(yè),對用戶需求的把握和預測至關重要 剛融了7個億的賈躍亭,推動新品牌FX車型量產(chǎn)、AI技術研發(fā)及市場擴展 字節(jié)AI編程工具TRAE SOLO來了!可一句話接單,代碼、頁面、上線全包了 小米REDMI首部短劇《時空合伙人》收官!結局出現(xiàn)雷軍聲音,劇中反派公司叫“耀界” 特斯拉進軍印度為時已晚?9年才退Model 3訂金,粉絲傷透了心 智己汽車“超級增程”宣布8月1日全球首發(fā),新一代智己LS6、LS9三四季度發(fā)布 DeepSeek、千問等六大國產(chǎn)大模型,誰是最強“金融分析師”? 微軟通報SharePoint零日攻擊,警告企業(yè)及政企客戶盡快安裝安全更新 iPhone下載App慢得要死,到底是因為啥? 上半年銷量穩(wěn)健釋放,雷克薩斯同比正向增長,豐田多品牌協(xié)同展現(xiàn)“抗壓力” 什么是“CDC+空懸”?就是空懸(空氣彈簧)對車身進行“穩(wěn)態(tài)控制”,CDC減振器進行“瞬態(tài)控制”,配合使用、共同協(xié)作提升懸架性能 廣汽向自己揮刀,剔除糟粕再談重生 | 茍活這半年 預售價32.99萬起!猛士M817一車打通城野生活邊界 這個盛夏7月,L3開始重塑智駕格局
主站蜘蛛池模板: www.日韩精品| 久久新视频 | 麻豆av在线播放 | 在线国产一区 | 欧美xxxx在线 | 黄色av一区二区 | 99精品国产免费久久久久久按摩 | 亚洲一区二区三区在线视频 | 国产乱码精品一区二区三区五月婷 | 国产一二三区不卡 | 国产尤物av| 国内精品国产成人国产三级粉色 | 国产欧美综合一区二区三区 | 综合色99 | 国产精品久久久久久久久久久久午夜片 | 精品国产31久久久久久 | 国产精品亚洲综合 | 日韩少妇精品av一区二区 | 中文av在线播放 | 欧美爱爱视频 | 91操碰 | 久久99精品国产一区二区三区 | 成人免费视屏 | 国产一区二区三区视频 | 成人高清一区 | 久久国产精品99久久久久久老狼 | 最近中文字幕视频在线观看 | 性做久久久久久免费观看欧美 | 亚洲日本一区二区 | 欧美一级在线视频 | 在线免费福利 | 精品伦精品一区二区三区视频 | 亚州成人 | 操操日 | 亚洲精品3区 | 91操视频| 国产精品亚洲综合 | 黄色特级片| 亚洲视频免费观看 | 国产成人欧美一区二区三区八 | 国产欧美日韩在线视频 |