斯坦福天才少女一年缔造5亿美元独角兽!Pika再获8000万美元融资,金牌团队阵容首度曝光

  新智元报道

  编辑:编辑部

  斯坦福天才少女郭文景的 Pika,在成立一年之际再获一笔 8000 万美元融资。团队成员也首次曝光,6 位 IOI 金牌得主,包揽 9 块金牌。凭借超神的速度,这家公司的产品进化路线图震惊了一众硅谷大佬。AI 视频将走向何方?Pika 定会拿出新的惊喜。

  斯坦福天才少女的这家公司,依然在继续它的传奇。

  成立一年之际,Pika 迎来最好的生日礼物——新一轮约 8000 万美元的融资。

  至此,公司估值较上一轮融资已经整整翻了一番,接近 5 亿美元。

  Pika 联合创始人郭文景(Demi Guo)和孟辰霖(Chenlin Meng)

  本轮融资由 Spark Capital 领投,而参与投资的,涵盖了科技和娱乐领域各大投资公司,以及个人投资者,包括 Greycroft、Lightspeed、Neo、Makers Fund、著名演员 Jared Leto 和大西洋唱片公司 CEO Craig Kallman 等。

  此外,这次的名单中还包括了去年 11 月就参与投资的「老熟人」,比如前 Github CEO Nat Friedman、Quora 创始人 Adam D'angelo、Perplexity CEO Aravind Srinivas、HuggingFace CEO Clément Delangue、ElevenLabs 联创 Mateusz Staniszewski,以及 AI 大牛 Andrej Karpathy 等。

  这一切无不表明,市场对生成式 AI 的未来信心巨大,科技、影视、文娱……要被 AI 视频「改造」的领域,还数不胜数!

  回想 7 个月前,刚刚发布的 Pika 1.0 就效果炸裂,以电影般的质感、动画级的特效,掀起了 AI 生视频领域的大地震。

  虽然如今经过 Sora 的洗礼,我们对 AI 视频的视效阈值已经一再被拉高,但当时横空出世的 Pika 1.0,相比 Gen-2 等竞品,堪称一句「划时代」。

  值得一提的是,Adobe 在 4 月的时候钦定了三大视频 AI 合作商:Pika、Runway,以及估值 860 亿美元的 OpenAI。

  Sora、Pika、Gen-2 三个工具同时登陆 Premiere Pro

  如今,「每个人都能成为自己的视频导演」,这句口号听来依旧震撼。

  成为视频领域的 Anthropic

  在一周年之际,创始人郭文景对新智元表示——

  「Pika 想要构建更强大的视频大模型。而此次融资的目的,就是希望能够更加积极地训练大模型。」

  是的,Pika 希望成为的,就是 AI 视频领域的 Anthropic。

  这一轮 Pika 的新领投 Yasmin Razavi,此前也是 Anthropic 的领投。

  在 Anthropic 还没公开模型和产品时,Yasmin 就选择相信这个团队,领投了 Anthropic,并成为董事会成员。

  现在,Yasmin 也成为 Pika 最新的董事会成员。

  6 位 IOI 金牌得主,包揽 9 块金牌

  今天,我们要讲的除了创始人故事之外,还有团队背后鲜有人知的内容。

  工程团队

  在 Pika 的团队中,共有 6 位 IOI 金牌得主,包揽 9 块国际奥赛金牌,其中 3 位还是 IOI 世界第一。

  这一数字,甚至超过了前段时间爆火的 AI 工程师 Devin,背后的初创 Cognition Al 的「金牌程序员」——5 位金牌得主,10 块金牌。

  其中,创始人郭文景摘取了 IOI 银牌,是美国队十几年来唯一的女国家队队员,也是美国国家队教练。

  另一位创始人陈思禹(Karli Chen)更是鲜有的双料国家集训队成员,曾在 IOI 集训队获得国内前 12 名,也是全国物理竞赛金牌获得者。

  而且,Pika 工程团队中还有两个人获得了美国大学最高数学奖项,被认定为 Putnam Fellow。

  Putnam Fellow 是被认为特难的数学竞赛,每年选出 5 位个人成绩最好的人,将由美国数学协会颁发。

  科研团队

  在科研方面,Pika 团队的实力也不容小觑。

  他们纷纷来自世界最好的大学和科研机构,斯坦福、MIT、谷歌、Meta、OpenAl 等等。

  既有有连发几十篇论文的科研大牛,也有著名开源项目的主要开发者。

  创始孟辰霖是 DDIM、Img2Img、Model Distillation 的作者。

  这些方法,直接将扩散模型的推理速度提高了数百倍。也是 GenAI editing 方法的基石算法。

  团队的研究科学家,Omer Bar-Tal,是谷歌 CEO 吹捧的 AI 视频大模型 Lumiere 项目的一作,有一线大模型训练的经验。

  论文地址:https://arxiv.org/pdf/2401.12945

  另外,Pika 团队还拥有 Hugging Face 的 Diffusers 代码库的联创和最核心开发者。

  Diffusers 是 Hugging Face 最大的项目之一,训练 GenAI 模型的 Default Library,现已拥有超过 23k 星。

  顾问团队

  此外,这家体量虽小的初创公司,还有着非常强大的顾问团队。

  斯坦福 AI 实验室的主任,NLP 大师 Christopher Manning,是将深度学习应用于自然语言处理(NLP)的早期领导者之一。

  Manning 还是 ACM 院士、AAAI 院士和 ACL 院士。截至目前,他个人被引数近 25 万,成为 NLP 领域引用量第一人。

  两届奥斯卡得主,斯坦度大学工程学院的 Canon 教授 Ron Fedkiw,曾参与制作了很多著名电影,比如加勒比海盗、星球大战的技术特效。

  Fedkiw 一直以来专注于计算机图形学的研究,曾设计了一个平台,首次应用在《终结者3:机器的崛起》中的T-X 角色,现已被用来创造电影节最先进的特效。

  Fedkiw 的技术帮助《加勒比海盗2》获得了第 79 届奥斯卡最佳视觉效果奖

  他个人在计算物理、图形学、机器学习和视觉方面,发表了 140+ 篇论文,并出版了一本名为「Level Set Methods and Dynamic lmplicit Surfaces」的计算图形学书籍。

  斯坦福大学计算机科学系的教授 Stefano Ermon,在机器学习领域发表 300+ 篇论文。并在扩散模型研究领域发表过著名的 Score Matching 以及「Denoising Diffusion Implicit Models」。

  近期,Pika 荣幸被选为福布斯 Top AI 50 公司,与 Abridge、Harvey、Mistral 并称为四个「New and Noteworthy」公司之一。同时,Business Insider 将其评为 Top 44 最值得工作的创业公司。

  5 月初的时候,郭文景还被被彭博社评选为 The People in Tech to Watch。

  灵活的架构,「超神」的速度

  除了坐拥阵容如此豪华的团队,Pika 成功的另一个秘诀,就是快到令对手完全反应不过来的速度!

  去年年初,AI 视频领域早已在硅谷红了大半边天。

  以 Gen-2 为代表的背后初创 Runway 成为当时最具竞争力、最受欢迎的公司,并坐拥 100+ 员工,是估值 1.5B 美元的独角兽。

  彼时,Pika 还未诞生。

  如今,仅用一年的时间,Pika 已经成为了 Runway 的最大竞争对手。

  其实,Pika 的速度,从它成立缘由的那一点「小火苗」,就可以窥见。

  2023 年初,郭文景和同学参加 Runway 的首届 AI 电影节时,发现 Runway 和 Adobe Photoshop 的工具并不好用。

  2023 年 4 月底,为了开发更好用的 AI 视频工具,让「每个人都能成为自己的视频导演」,郭文景决定从斯坦福退学,Pika 由此诞生。

  一次失败的参赛经历,却让一家估值近 5 亿美元的公司诞生,这不啻是一段传奇。

  某天下午,天使投资人 Friedman 向团队提出了一个想法:在视频中嵌入文本。

  凌晨 3 点,他收到了一条短信,告知这项功能已经准备就绪。

  Friedman 被团队的高效震惊了,立刻决定进行下一轮投资。

  论文成果斐然

  Pika 的能力之所以可以不断迭代,完全是基于团队在研究领域取得的诸多成果。

  Pika 在全球范围内有超过 20 个研究合著者,来自清华姚班、北大、斯坦福、MIT、加州理工等顶尖高校以及科研机构。

  Pika 下一步计划是,将在今年晚些时候,发布文本到视频模型重大更新。

  郭文景透露,包括支持生成更高质量、更长时间的视频(目前只能生成 3 秒的视频,不过用户可以在视频生成之后再延长)。

  郭表示,「我们正在努力打造最佳的视频模型,同时也在打造一款真正服务于创造者的产品」。

  AI 电影,究竟还有多远

  从创立的第一天起,Pika 对于产品就是这样构想的——

  成为一个帮助用户把「想法」做成「视频」的平台,因此,团队需要创造全新的模型,实现这个「将任何人的概念变为现实」的功能。

  如何让每个人都能成为自己故事的导演?Pika 决定从最底层构建产品,让整个过程更有趣、更有挑战,也更容易理解。

  距离我们能从电影院看到一部 AI 电影,究竟还需要多久?

  在电影制作人 Paul Trillo 看来,从孤立的剪辑到制作一种以故事形式运行的工具,并且能让观众在观看时不会脱离其中,还有一段路。

  AI 能让电影实现到某种程度,取决于它能在多大程度上,执行使用者的真实意图和愿景。

  如今用 Pika,可以将视频中的对象改变各种风格

  Pika 希望自己的模型可以理解各种不同的输入,这无疑对模型的能力提出了很高的要求。

  从某种意义上,OpenAI 的 Sora 也采用了类似的根本性「拔高」。

  Sora 对世界上事物的物理运行方式,有着深刻的理解。这,就能让视频的主体能够直接做出正确的互动和反应。

  而让 AI 视频更接近电影的另一个因素,就是长度。

  如今,我们已经达到了用 3 到 8 秒的镜头所能讲述故事类型的极限,而更长时间的视频,则会开启我们讲述更复杂故事的能力。

  不过,即使能生成 60 秒视频,也并不意味着 AI 能创作一部连贯的电影。

  这也就意味着,如今的视频 AI,还有许多潜在的全新方向可以开卷。

  对此,制作人 Trillo 预测道:「或许两年后的模型会有极强的控制力,为电影制作人提供任何所需的细节」。

  而 Pika,无疑是该领域被寄托了最多希望的选手之一。

  因为它强大的执行力,意味着很多可能。

  短短一年时间里,Pika 已经初始的 3 人公司,组建了世界级的研究人员和科学家团队,还集结了一批创作力爆棚的创作者。

  难以想象,下一步他们将如何利用 AI,推动视频生成领域的最前沿。

  参考资料:

  https://www.bloomberg.com/news/articles/2024-06-05/spark-capital-jared-leto-back-ai-video-startup-pika

  https://www.washingtonpost.com/technology/2024/06/04

  /pika-funding-openai-sora-google-video/

  https://www.forbes.com/lists/ai50/?sh=80bf8b4290f4

  https://pika.art/blog