全球最大游戏博主“偷师”DeepSeek，爆改国产大模型干翻ChatGPT

日期：2026-03-02 13:42:48 / 人气：73

在全球科技浪潮中，人工智能（AI）的发展日新月异，各大科技巨头纷纷投入巨资研发先进的AI模型。然而，令人意想不到的是，全球最大的游戏博主——PewDiePie，竟然凭借着自己的努力和对AI的热爱，“偷师”DeepSeek，成功微调出一个超越GPT - 4和Gemini 2.5 Pro的国产大模型。
一、PewDiePie的AI逆袭之路

PewDiePie本名菲利克斯·谢尔贝格（Felix Kjellberg），坐拥逾1.1亿YouTube订阅，近年来逐渐从游戏直播圈淡出，将大量时间投入到AI领域。去年11月，他发布《STOP.Using AI Right now》，展示了如何从零搭建一套带搜索、记忆和语音输出的个人AI助手。而此次新视频，他更是完整记录了自己从一个AI小白到微调出能媲美顶流AI模型的全过程。
（一）起步：从零开始的学习
在开始这个项目之前，PewDiePie对机器学习、模型训练和代码编程几乎一无所知。但他秉持着“不懂就学，一步一步来”的逻辑，选用阿里旗下开源的Qwen 2.5（32B参数版）作为底座模型，目标是超越在Aider Polyglot编程基准测试中的ChatGPT。这个测试涵盖六种编程语言，当时ChatGPT得分约为18.2%，Qwen 2.5在默认格式下仅有8%，不过换用「whole form」格式后可提升至16%。所谓「whole form」，是指模型修改代码时会把整段代码从头重写一遍，而非只改动需要修改的部分。
（二）数据工程的挑战
为了从根本上提升模型能力，PewDiePie深知需要进行微调训练，而这离不开大量数据。他尝试了几乎所有能想到的数据来源，挖掘60TB的开放代码数据集The Stack，爬取GitHub公开仓库，以及让大模型批量合成训练样本。最初他收集了约10万条训练数据，但过程混乱，多个LLM同时处理数据处理、测试、增强等工作，且数据质量问题严重。合成数据看似格式完美，实则错误百出，他搭建的「验证框架」因逻辑缺陷，让更多垃圾数据蒙混过关。第一次正式训练后，模型成绩不升反降，如此循环持续了数月。
（三）硬件方面的折磨
除了数据难题，硬件方面也给他带来了诸多困扰。为了加入「推理链」提升模型表现，需要大量算力持续运转。某次重启后，GPU突然冒烟，一块GPU损毁，原来是使用了来自不同工厂的魔改版RTX 4090显卡。而且他一直使用额定1500W的电源线，实际运行功率却超过2000W，换线后电脑仍频繁崩溃，最后他甚至把浴室电路“借”过来接入机器，还将GPU功耗从450W压到175W，只为避免家里电网跳闸。他还在视频里打趣说为了一切顺利，给整套系统举行了开光仪式。
二、DeepSeek技术文档的关键助力
在算力和数据的双重折磨下，PewDiePie开始调用DeepSeek API来合成约1.5万条高质量推理样本。这些样本数量虽少，但每一条都附有详细的逐步推理过程，是精心筛选的“精华数据”。用这批数据完成监督微调后，基准测试成绩达到19.6%，超越了ChatGPT。不过，他随后发现存在数据污染问题，检查后确认有少量污染，于是决定清洗数据、重头再来。
这一次，他意外发现自己此前一直在用Qwen的通用版本，而非专为代码优化的版本。换用正确模型、配合完整清洁数据集重训后，成绩跳升至25%。随后他修复了基准测试本身的Bug，即C++和JavaScript题目未被正确执行的问题，修复后重跑，成绩升至36%。经过最后一轮后训练，纯净去污染版本的最终成绩定格在39.1%，超越了GPT - 4 - mini及Gemini 2.0 Pro等多个早期主流模型。
PewDiePie多次强调DeepSeek技术文档对他的帮助。在他看来，DeepSeek不仅公开了模型权重，还发布了详尽的训练流程文档，将数据处理、推理增强等核心方法细节和盘托出。
三、中国AI研究的贡献
PewDiePie的成功，从选用阿里旗下开源的Qwen 2.5底座模型，到借鉴清华大学联合阿里巴巴、莫纳什大学关于推理链蒸馏的论文，再到利用DeepSeek的技术文档，这一系列过程绕不开中国AI研究对整个开源社区持续的实质性贡献。一个对AI几乎一无所知的内容创作者，能够在数月内完成从零到击败顶流模型的跨越，中国AI研究提供的开源资源和详细技术指导起到了关键作用。
四、AI焦虑时代普通人的思考
PewDiePie的视频发布后，在社交媒体上引起了截然不同的反应。有人感到震撼，也有人调侃他从游戏到机器学习的转变。然而，这背后也引发了我们对于AI焦虑时代普通人该如何自处的思考。
AI工具的门槛确实大幅降低，让普通人有机会接触以前只有顶尖工程师才能涉足的领域。但真正能沉下心来深度学习AI、并将其转化为生产力的人还是少数。对于无法辞职全职研究AI的普通人，《华尔街日报》采访的多位AI领域领导者给出了建议。Anthropic联合创始人Daniela Amodei认为，AI无法取代人与人之间的连接能力，如共情、沟通和善意，这些人类特质在AI普及的职场中会愈加珍贵。宾夕法尼亚大学沃顿商学院教授Ethan Mollick表示，需要整合多种技能的综合型职业在AI时代更具韧性。微软首席科学家Jaime Teevan则指出，传统文科教育在这个时代的价值被严重低估，与AI打交道需要基于自然语言的意图表达和批判性提问，这与人文学科的训练高度契合。
PewDiePie在视频末尾也分享了他的体会，他学会了预期失败，甚至拥抱失败。在模型最终取得好成绩之前，经历了无数次越训越差的循环，但正是这些失败让他逐渐理解了AI训练的底层逻辑。这种心态不仅适用于训练微调AI，也适用于我们在面对AI时代各种挑战时的态度。
全球最大游戏博主PewDiePie“偷师”DeepSeek，爆改国产大模型干翻ChatGPT的故事，不仅是他个人的逆袭传奇，更让我们看到了中国AI研究的贡献以及AI时代普通人应有的思考和态度。在这个充满机遇和挑战的时代，我们应积极拥抱变化，以正确的态度和方法去适应和利用AI技术。

作者：天辰娱乐

全球最大游戏博主“偷师”DeepSeek，爆改国产大模型干翻ChatGPT

新闻资讯 News

案例展示 Case

现在致电 5243865 OR 查看更多联系方式 →

现在致电 5243865 OR 查看更多联系方式 →