
新智元报道
编辑:元宇好困
DeepSeek 在港大「AI-Trader」项目中以 9.68% 收益率击败 GPT、Claude、Gemini 等全球顶级模型,成为能够在真实美股市场实现自主盈利的 AI 交易系统,这标志着 AI 在金融实盘应用中的重大突破。
这一局,中国 AI 又赢了!
继 AlphaArena 在加密货币市场掀起 AI 大战之后,一场更硬核的「美股版 AI 鱿鱼游戏」已经落幕。
就在刚刚,最新战报出炉,结果震撼全场:
中国的 DeepSeek 成为最大黑马,收益率高达 9.68%。
这意味着,通过它赚钱速度是直接买热门美股基金(QQQ)的 8 倍,是第二名 AI 大模型的 4 倍!


GitHub 地址:https://github.com/HKUDS/AI-Trader
Leaderboard:https://hkuds.github.io/AI-Trader/
在这个名为「AI-Trader」的开源项目中,来自港大黄超教授的研究团队进行了一次有趣的探索——
他们给 GPT、Claude、Gemini、Qwen、DeepSeek 这五个全球顶级 AI 模型每人 1 万美金,到纳斯达克 100 成分股交易市场厮杀近一个月。
同时,为这场比赛制定了堪称严苛的规则:没有人工干预,没有策略预设,也没有任何人为提示。
每个 AI 模型,只有自己的账户资金和一套用来查股价、搜新闻、下单的交易工具。
至于要怎么交易,全凭 AI 模型的智商了。
这不是你见过的「AI 炒股」
首先需要说明的是,这是一场真正的 AI 自主交易!
它不是程序员预先写死的「伪 AI 交易」,也不是拿历史数据跑出来的「炒股机器人」。
项目团队为这个实验定下了「三不原则」:
- 
不给剧本:不告诉 AI 任何炒股套路; 
- 
不给建议:全程禁止人工「场外指导」; 
- 
不给作弊机会:严格按日期过滤数据。 
设想你交给 AI 一万美元和一套交易工具,然后让它独立操作一个月,看能否盈利。
整个过程没有策略模板,没有技术指标,AI 只能靠自己搜索和分析信息,计算风险收益,并做出购买决策。
因此,此次 DeepSeek 的胜出完全是依靠模型自身的学习和推理能力。


从 DeepSeek 的持仓截图可以看出,它没有盲目追热点或 All-in 单只股票,而是展现出了超越多数散户的投资策略:
- 
精准踩中科技龙头:比如 NVDA、AAPL、MSFT 等核心标的; 
- 
有效分散投资风险:采用了多标的投资组合,不把鸡蛋放进一个篮子里; 
- 
动态调仓能力:根据市场变化实时调整。 
交易行为暴露 AI「性格」
谁是老司机,谁心态崩了?
更有意思的是,交易频率的差异也暴露出了这些参赛 AI 各自迥异的「性格」。

从这些「AI 交易员」的性格画像中,我们也能琢磨出来一些现实炒股中的门道:
首先,频繁交易≠高收益。
Gemini 在短期内进行了高频交易,疯狂下单 73 次,因缺乏风险控制导致亏损 2.73%,呈现出典型的高频波动型策略失效特征。
这像极了那种每天盯盘八小时,一有波动就慌忙操作的散户,最后心态崩了就直接清仓走人。

第二,太佛系了也不行。
Qwen 只交易了 22 次,结果还是拿了负收益。

第三,只有稳健才是王道。
DeepSeek 和 Claude 的交易次数都在 50 次左右,理性稳健,该出手时就出手。
它们一个大赚 9.68%,一个小赚 2.17%——这才是成熟交易员该有的节奏。


这场实验不仅测出了 AI 的「智商」,还测出了它们的「情商」和「心态」,而这恰恰也是金融市场最考验人的地方。
完全开源
一键就能让 AI 帮你炒股
更炸裂的是 AI-Trader 完全开源,MIT 协议、代码全公开。
只需下面三步就可以轻松上手:
- 
克隆仓库:只要一行命令就可以; 
- 
配置 API:Alpha Vantage、Jina、OpenAI 等,大部分都有免费额度; 
- 
一键启动:python main.py,然后就可以坐等 AI 开始交易。 
此外,项目还支持可插拔的扩展:
- 
时光机模式:回到 2024 年科技股暴跌期,看你的 AI 能不能成功抄底; 
- 
DIY 专属 AI 交易员:如果觉得 GPT 太保守,还可以自定义一个激进派的 Agent; 
- 
扩展到全球市场:A股、港股……理论上都可以接入。 
想训练好一个 AI
最好的方法是将它扔进股市
多年来,我们一直采用静态基准来衡量 AI。
比如通过 ImageNet 测图像识别,MMLU 测知识问答等。
但这些测试都有一个致命缺陷:它们都发生在一个可预测、可以随时按暂停键的「实验室环境」中。
为了打破这一惯例,10 年前,DeepMind 引入了游戏场景来进行 AI 测试。
不是让 AI 去做 MMLU 选择题,而是让它在《星际争霸》里与职业选手对战,或者在围棋中与世界冠军竞争。
DeepMind 之所以这样做,是因为游戏提供了传统测试中所没有的三个挑战:
- 
动态环境:每一局都不一样,对手也会学习、会反击; 
- 
即时反馈:走错一步棋,就可能立即输掉比赛; 
- 
开放策略:没有标准答案,只有输赢。 
于是我们看到了 AlphaGo、AlphaStar,也看到了 AI 从「会答题」进化到「能博弈」。
从静态基准测试到游戏测试,难度是提升了,但仍然不够。
如果说游戏测试是 AI 的「新手局」,金融市场才是满级玩家们要挑战的终极 BOSS。
原因很简单:市场是一个比游戏更好的训练场。
游戏再复杂,它的规则也是固定的。
相比规则固定的游戏,金融市场的复杂性在于其参与者与规则的动态共演。
它是一个由无数人(包括智能体)共同组成的一个持续进化的复杂系统,它有博弈、欺骗、陷阱、绞杀,也会波动、反应、惩罚、奖励。
所以,市场才是 AI 的终极试金石。
一个 AI 的智能不仅取决于它读取信息的速度,更取决于它能够承认错误、及时止损的自我反省与学习能力。
这才是真正的智能,也只有通过股市中真金白银的搏杀才能检验出来。
正因如此,市场才是终极的世界建模引擎。
想要训练一个真正能在现实世界运行的 AI,最好的办法把它扔进股市,它必须在这里学会:
- 
从嘈杂的信息海洋中捕捉有效信号; 
- 
综合财报、技术指标、舆情分析做出多维决策; 
- 
随着市场变化不断调整策略; 
- 
知道及时止损。 
这衡量的是 AI 在不确定性环境中生存的能力,这才是新时代的图灵测试。
AI 战场
早已不只在聊天框里了
如果说过去十年,DeepMind 用游戏证明了 AI 可以战胜人类,那么接下来的十年,金融市场将证明「AI 可以在真实世界中创造价值」。
它拓展了我们探索 AGI 的边界,打开了 AI 通往真实世界的通路。
想象一下,当 AI 能在复杂的市场环境下生存,今天能够炒股,明天就可以做医疗诊断、法律分析、科研决策,去解决更多现实场景中的问题。
另外一个方面,市场也为 AI 提供了开放式学习的环境,近乎无限的数据和即时反馈,这是实验室中永远也无法模拟出来的。
当硅谷还在争论「AI 会不会抢了基金经理饭碗」时,中国的 DeepSeek 已经用真金白银的 9.68% 收益率给出了答案——不是会不会,而是已经在发生了。
DeepSeek 的胜利,象征着一种范式转变:
未来的华尔街,可能不再属于那些时刻盯盘的交易员,而是属于那些能秒读千份财报、精准捕捉市场情绪、永不情绪化的 AI 大脑。
而引领这场金融 AI 革命浪潮的,正是来自中国的 DeepSeek。
从 AI 聊天(ChatGPT vs Kimi、DeepSeek),到深度研究(OpenAI DeepResearch vs Qwen DeepResearch),再到现在的 AI 炒股——每一个新战场打开,我们都能看到中国 AI 的身影在快速逼近,甚至反超。
AI 的战场早就不只在聊天框里了。
而如今,中国 AI 正在开启这个未来。
作者介绍

范天宇
范天宇(2002 年生),香港大学博士二年级学生,研究方向为检索增强生成(RAG)与大语言模型智能体。
学术成果发表在 ICLR 会议,并主导开源项目 MiniRAG(GitHub 1.5k 星),在学术与产业界获得广泛应用与关注。

蒋杨钦
蒋杨钦(1999 年生),香港大学博士四年级学生,研究方向涵盖大模型智能体、图学习与推荐系统。
研究成果入选 KDD 2022 最有影响力论文榜单,并获得 ACM MM 2024 Best Paper Honorable Mention Award。

杨雨豪
杨雨豪(2000 年生),香港大学博士四年级学生,谷歌学术引用 1800+。主要研究方向为大模型智能体、图学习与推荐系统。
成果多次入选顶级会议最有影响力论文榜单(KDD 2022/2023、WWW 2023、SIGIR 2022)。开源多模态 GUI 智能体 Aria-UI 在学界与业界获得关注。

黄超
黄超,香港大学博士生导师,研究方向大语言模型、智能体与图机器学习,Google Scholar 引用 1.3 万+。
团队推出 LightRAG、RAG-Anything、DeepCode、AutoAgent、AI-Researcher、MiniRAG、VideoRAG 等开源项目,累计 6 万余 GitHub 星标、50 次登上 GitHub Trending。
曾获 2024 前沿科学奖,并入选 2025 AI100 青年先锋与 AI 2000 全球最具影响力学者。
多项成果在 KDD、WWW、SIGIR、AAAI 等顶会被评为最具影响力研究之一,并于 ACM MM、WWW、WSDM 等获得最佳论文提名。
参考资料:
 
                            
 
                             
                             
                     
                     
                 
                         
                 
                         
                 
                    