新智元报道
编辑:编辑部
谷歌神秘项目 Pitchfork 曝光!这次,会有多少码农被迭代?
做一个程序员,压力有多大?
反正,最近的一个传闻,是让码农们瑟瑟发抖。
传说谷歌正在研发一个秘密的新项目,教 AI 写代码。
据说,学会之后,AI 不仅能写代码,还会修复 bug。
写代码这件事,就应该让代码自己来
传闻,谷歌的这个秘密项目,会通过机器学习训练代码,让它们自己编自己,自己修复 bug,还能自己更新。
这个项目表明,谷歌向生成式人工智能(generational artificial intelligence)更近了一步。
现在的 AI,是愈发无所不能了。它们可以创建图像、视频,还能写代码。
如果这个 AI 再进化下去,未来还需要写代码的码农吗?
据知情人士透露,这个项目起初是由 Alphabet 的登月部门——X部门开发的,代号为 Pitchfork。
今年夏天,它被转移到了谷歌实验室。
众所周知,谷歌实验室看重的是「长期投资」,包括 VR 和 AR 项目。
现在,Pitchfork 已经成为了谷歌实验室下「AI 开发者援助团队」的一名员工。
根据内部资料,Pitchfork 的作用是「教代码自行编写、自行重写」。
它能够学习不同的编程风格,并且根据这些风格写出代码。
现在,这个团队正在探索不同的用例,来帮助开发者。
一名谷歌员工表示,开发 Pitchfork 的初衷是希望建立一个工具,将谷歌的 Python 代码库更新到新版本。
在不用雇佣多余软件工程师的情况下,怎么从一个版本过渡到下一个版本呢?
Pitchfork 应运而生。
团队负责人 Hatalsky 表示,随着时间的推移,Pitchfork 项目的目标逐渐变成了建立一个通用系统。
从去年年底开始,Pitchfor 已经可以降低 for X 的成本。
AlphaCode:吊打 72% 程序员
其实,AI 编程这件事,早就不新鲜了。
2022 年 2 月,Alphabet 的另一家子公司、谷歌的兄弟公司 DeepMind,就推出了一个名为「AlphaCode」的系统,可以使用人工智能生成代码。
根据 DeepMind 的说法,AlphaCode 可以与人类匹敌。
DeepMind 使用编程竞赛平台 Codeforces 上托管的 10 个现有竞赛来测试 AlphaCode,总体排名位于前 54.3%,也就是说它击败了 46% 的参赛者 。
DeepMind 声称,在使用编程竞赛平台 Codeforces 进行检测时,AlphaCode 解决了 100 万个样本中34. 2%的问题。
另外在过去 6 个月参加过比赛的用户中,AlphaCode 的数据排到了前 28%,可以说「吊打 72% 人类程序员」!
当时,DeepMind 就指出,虽然 AlphaCode 目前只适用于具有竞争性编程领域,但显然,它未来的能力绝不会止步于此。
它为创造某些工具打开了大门,而这些工具将使编程变得更容易被人们接受,并且有朝一日可以完全实现自动化。
Copilot:程序员的好帮手
再往前,在 2021 年,GitHub 与 OpenAI 共同推出了一款 AI 编程神器——GitHub Copilot。
输入代码时,Copilot 会自动提示程序中接下来可能出现的代码片段,就像一个经过训练用 Python 或 JavaScript 说话的自动补全机器人。
Copilot 能够填充必要的代码块,只要它们不是特别复杂或者特别有创造性,这对于相当于手工劳动的编程,可太有用了。
此外,Copilot 还优化了多名程序员间的线上协作功能,因此,它是生成式 AI 早期最成功的项目之一。
2022 年 6 月 22 日,Copilot 正式面向C端上线,定价 10 美元/月或 100 美元/年,并向学生用户和流行开源项目的维护者免费提供。
现在,成千上万的开发者都在用 Copilot。
在十几种最流行的语言编写代码中——有高达 40% 是依靠它来生成的。
GitHub 预测,开发人员将在五年内使用 Copilot 编写多达 80% 的代码。
微软首席技术官 Kevin Scott 还表示:「我们确信:GitHub Copilot 可以应用到数千种不同类型的工作中。」
不过,因为涉嫌侵权,在发布不到 5 个月后,Copilot 已经被愤怒的程序员一举告上法庭,索赔 90 亿美元。
Codex:AI 实时自动编程
OpenAI 开创了文本生成的先河。
从 2019 年,OpenAI 开始使用一种名为 GPT-2 的算法,在业内引发轰动;2021 年底,OpenAI 推出了 GPT-2 的升级版 GPT-3,可供任何人使用。
GPT-3 拥有 1750 亿个参数,是上一代模型 GPT-2 的 100 倍,也一举将此前同类 NLP 模型的参数纪录提升了 10 倍。
在图像生成领域,OpenAI 在 2021 年 1 月官宣了 DALL-E,它可以为文本提示生成原始图像。
在 2022 年 4 月,DALL-E 2 发布,它能够渲染更复杂的图像。
2021 年 6 月 30 日,通过搭载自家的 Codex 模型,OpenAI 与 GitHub 联合发布了 「AI 代码补全神器」GitHub Copilot。
不过当时,Codex 并没有透露过多细节,始终保持着神秘感。
去年 8 月 10 日,OpenAI 终于推出了改进版本的 Codex,还发布了基于自身 API 的私测版。
与之前的版本相比,Codex 的改进版本不仅可以解读简单的自然语言命令,还可以自动创建并完成代码,更加灵活和先进。
例如在 OpenAI 的太空游戏《space game》中,用户输入自然语言命令「Make it be smallish」,Codex 系统便会自动生成控制代码,使图中飞船的尺寸就缩小。
另外,还有一个能自己写软文的神奇工具——Jasper。
「Jasper」是一款 AI 内容平台,搭载 GPT-3 的文本生成技术,可帮助人类突破创意障碍,并以 10 倍的速度自动生成文本供公司使用,用于营销、博客和电子邮件等。
就在 10 月,Jasper 宣布筹集了 1.25 亿美元的资金,目前估值已达 15 亿美元,并声称有望在今年带来 7500 万美元的收入。
从去年到今年,井喷的生成式 AI
要说现在业界最火热的词汇,「生成性人工智能」肯定是其中之一。
用技术一点的说法,「生成性人工智能」是指无监督和半监督的机器学习算法,它使计算机能够使用文本、音频和视频文件、图像甚至代码,来创建新内容。
AI 根据用户提示生成的艺术作品、文本和代码,一次次让人类惊艳。
Gartner 在「2022 年新兴技术和趋势影响雷达报告」中,就将生成式 AI 列为能带来生产力革命的技术之一。
根据 Gartner 的预测,到 2025 年,生成式 AI 将生成所有数据的 10%(现在不到1%),以及面向消费者用例的所有测试数据的 20%。
并且,到 2025 年,50% 的药物发现和开发都会使用生成式 AI。
投资人工智能的大型生物制药公司
而到 2027 年,30% 的制造商将使用生成式 AI 来提高产品开发效率。
现在,生成式 AI 已经引发了硅谷的「淘金热」。
风投公司红杉资本就在最近的一篇博文中,阐述了生成人工智能的潜力,涉及语音合成、视频编辑、生物和化学等领域。
在文章最后,该公司得出结论:在未来,所有的图像,以及一部分文本和算法,都是使用 AI 生成的。
人类会因为 AI 而失业吗?
可以预见,随着生成式人工智能井喷,未来也将有更多、更先进的 AI 编程模型陆续出现,挤压程序员的生存空间。
那么,人类程序员会因为 AI 技术的发展而失业吗?
一个业界共识是:想要取代人类,「AI 程序员」们还有许多问题需要解决。
这主要体现在「商业化前景」和「法规伦理」两个方面。
Foundation Capital 的合伙人、Jasper 的早期投资者 Joanne Chen 表示,想要将一家生成式 AI 工具变成一家有价值的公司仍然很困难。
前不久,「AI 编程神器」Kite 宣布停止开发,运营仅 8 年便彻底凉凉。
在发布于 Kite 官网的最后一期博客中,创始人 Adam Smith 表示「我们拥有了 50 万名月活用户,但几乎没有产生任何收入。」
他认为仅仅使开发人员在编写代码时速度提高 18%,这对于他们来说也不够轰动,也并不足以使他们花钱购买增值服务。
产品的商业化前景不够明晰,这或许也是许多付费 AI 辅助软件的通病。
「伦理与版权」则是阻碍生成式 AI 技术走入人们生活的另一只拦路虎。
本月早些时候,GitHub 就被提起集体诉讼,指控使用了 Copilot 工具使用人工智能复制开源代码,并视软件隐私于不顾。
一些开发人员也抱怨,Copilot 所建议的代码看起来像他们自己的工作。
虽然 GitHub 表示,在极少数情况下,该工具会生成复制的代码,当前版本试图过滤和阻止与 GitHub 公共存储库中现有代码匹配的建议。但这仍然在一些程序员社区中产生了相当大的焦虑。
Chen 还表示,生成式人工智能的热潮可能意味着监管的缺位,并使它们用于「一些令人讨厌或危险的用途」。例如制作传播错误信息的视频等。
因此就谷歌可能推出的 Pitchfork 来说,虽然该项目尚处于早期阶段,但仍需要考虑如何训练这些模型的棘手伦理问题,例如偏见和潜在的版权问题。
所以,程序员是在自己「杀」自己么?
参考资料:
https://www.deepmind.com/blog/competitive-programming-with-alphacode