全球最大游戏博主“偷师”DeepSeek,爆改国产大模型干翻ChatGPT

日期:2026-03-02 13:42:48 / 人气:5


在全球科技浪潮中,人工智能(AI)的发展日新月异,各大科技巨头纷纷投入巨资研发先进的AI模型。然而,令人意想不到的是,全球最大的游戏博主——PewDiePie,竟然凭借着自己的努力和对AI的热爱,“偷师”DeepSeek,成功微调出一个超越GPT - 4和Gemini 2.5 Pro的国产大模型。
一、PewDiePie的AI逆袭之路
PewDiePie本名菲利克斯·谢尔贝格(Felix Kjellberg),坐拥逾1.1亿YouTube订阅,近年来逐渐从游戏直播圈淡出,将大量时间投入到AI领域。去年11月,他发布《STOP.Using AI Right now》,展示了如何从零搭建一套带搜索、记忆和语音输出的个人AI助手。而此次新视频,他更是完整记录了自己从一个AI小白到微调出能媲美顶流AI模型的全过程。
(一)起步:从零开始的学习
在开始这个项目之前,PewDiePie对机器学习、模型训练和代码编程几乎一无所知。但他秉持着“不懂就学,一步一步来”的逻辑,选用阿里旗下开源的Qwen 2.5(32B参数版)作为底座模型,目标是超越在Aider Polyglot编程基准测试中的ChatGPT。这个测试涵盖六种编程语言,当时ChatGPT得分约为18.2%,Qwen 2.5在默认格式下仅有8%,不过换用「whole form」格式后可提升至16%。所谓「whole form」,是指模型修改代码时会把整段代码从头重写一遍,而非只改动需要修改的部分。
(二)数据工程的挑战
为了从根本上提升模型能力,PewDiePie深知需要进行微调训练,而这离不开大量数据。他尝试了几乎所有能想到的数据来源,挖掘60TB的开放代码数据集The Stack,爬取GitHub公开仓库,以及让大模型批量合成训练样本。最初他收集了约10万条训练数据,但过程混乱,多个LLM同时处理数据处理、测试、增强等工作,且数据质量问题严重。合成数据看似格式完美,实则错误百出,他搭建的「验证框架」因逻辑缺陷,让更多垃圾数据蒙混过关。第一次正式训练后,模型成绩不升反降,如此循环持续了数月。
(三)硬件方面的折磨
除了数据难题,硬件方面也给他带来了诸多困扰。为了加入「推理链」提升模型表现,需要大量算力持续运转。某次重启后,GPU突然冒烟,一块GPU损毁,原来是使用了来自不同工厂的魔改版RTX 4090显卡。而且他一直使用额定1500W的电源线,实际运行功率却超过2000W,换线后电脑仍频繁崩溃,最后他甚至把浴室电路“借”过来接入机器,还将GPU功耗从450W压到175W,只为避免家里电网跳闸。他还在视频里打趣说为了一切顺利,给整套系统举行了开光仪式。
二、DeepSeek技术文档的关键助力
在算力和数据的双重折磨下,PewDiePie开始调用DeepSeek API来合成约1.5万条高质量推理样本。这些样本数量虽少,但每一条都附有详细的逐步推理过程,是精心筛选的“精华数据”。用这批数据完成监督微调后,基准测试成绩达到19.6%,超越了ChatGPT。不过,他随后发现存在数据污染问题,检查后确认有少量污染,于是决定清洗数据、重头再来。
这一次,他意外发现自己此前一直在用Qwen的通用版本,而非专为代码优化的版本。换用正确模型、配合完整清洁数据集重训后,成绩跳升至25%。随后他修复了基准测试本身的Bug,即C++和JavaScript题目未被正确执行的问题,修复后重跑,成绩升至36%。经过最后一轮后训练,纯净去污染版本的最终成绩定格在39.1%,超越了GPT - 4 - mini及Gemini 2.0 Pro等多个早期主流模型。
PewDiePie多次强调DeepSeek技术文档对他的帮助。在他看来,DeepSeek不仅公开了模型权重,还发布了详尽的训练流程文档,将数据处理、推理增强等核心方法细节和盘托出。
三、中国AI研究的贡献
PewDiePie的成功,从选用阿里旗下开源的Qwen 2.5底座模型,到借鉴清华大学联合阿里巴巴、莫纳什大学关于推理链蒸馏的论文,再到利用DeepSeek的技术文档,这一系列过程绕不开中国AI研究对整个开源社区持续的实质性贡献。一个对AI几乎一无所知的内容创作者,能够在数月内完成从零到击败顶流模型的跨越,中国AI研究提供的开源资源和详细技术指导起到了关键作用。
四、AI焦虑时代普通人的思考
PewDiePie的视频发布后,在社交媒体上引起了截然不同的反应。有人感到震撼,也有人调侃他从游戏到机器学习的转变。然而,这背后也引发了我们对于AI焦虑时代普通人该如何自处的思考。
AI工具的门槛确实大幅降低,让普通人有机会接触以前只有顶尖工程师才能涉足的领域。但真正能沉下心来深度学习AI、并将其转化为生产力的人还是少数。对于无法辞职全职研究AI的普通人,《华尔街日报》采访的多位AI领域领导者给出了建议。Anthropic联合创始人Daniela Amodei认为,AI无法取代人与人之间的连接能力,如共情、沟通和善意,这些人类特质在AI普及的职场中会愈加珍贵。宾夕法尼亚大学沃顿商学院教授Ethan Mollick表示,需要整合多种技能的综合型职业在AI时代更具韧性。微软首席科学家Jaime Teevan则指出,传统文科教育在这个时代的价值被严重低估,与AI打交道需要基于自然语言的意图表达和批判性提问,这与人文学科的训练高度契合。
PewDiePie在视频末尾也分享了他的体会,他学会了预期失败,甚至拥抱失败。在模型最终取得好成绩之前,经历了无数次越训越差的循环,但正是这些失败让他逐渐理解了AI训练的底层逻辑。这种心态不仅适用于训练微调AI,也适用于我们在面对AI时代各种挑战时的态度。
全球最大游戏博主PewDiePie“偷师”DeepSeek,爆改国产大模型干翻ChatGPT的故事,不仅是他个人的逆袭传奇,更让我们看到了中国AI研究的贡献以及AI时代普通人应有的思考和态度。在这个充满机遇和挑战的时代,我们应积极拥抱变化,以正确的态度和方法去适应和利用AI技术。

作者:天辰娱乐




现在致电 5243865 OR 查看更多联系方式 →

天辰娱乐 版权所有