北大团队搞出ChatExcel,说人话自动处理表格,免费

  明敏 Pine 发自凹非寺

  量子位公众号 QbitAI

  做 Excel 表,真就动动嘴就够了!

  看,输入想要干的事:给学生成绩排个名吧。

  简单敲个回车,表格唰一下就列好了!

  检查一遍也没错。

  还能跨表格处理。

  比如标记出两张不同表格中排名都在前十的学校。

  哦豁,还有点超越 ChatGPT?

  毕竟给 ChatGPT 提出类似的要求,它只能帮我写出对应的代码,操作还得自己手动来。

  这就是最近在知乎上引起关注的 AI 工具 ChatExcel,一发布就登上了热搜榜。

  它主打用对话的形式实现 Excel 复杂操作(Chat-to-Excel),告别记函数、手动设置公式。

  做好的成品,支持一键导出成标准 Excel 表格,连复制粘贴这道工序都省了。

  而且不用注册、网页上就能用、不限使用次数,相当利好懒人和 Excel 小白。

  甚至懂 Excel 技能的人都感慨,自己会的这些是不是要没用了。

  这就是由北京大学深圳研究生院/信息工程学院 3 位硕博生,独立开发的项目。

  目前已开放 Demo 供大家试玩。

  看到这可能很多人都以为,“这又是一个受到 ChatGPT 影响开发的项目嘛”。

  还真不是

  GitHub 项目上的第一个 commit 是在 22 年 3 月就提交了。

  而背后真正的契机——

  其实是团队中一位小哥,想用技术帮女票解决点工作中的小烦恼啦。

  这到底咋回事?量子位联系了主创团队,来一一给大家揭秘~

  ChatExcel 表现如何?

  咳咳,别人女票的事稍后再谈,咱们先来看看 ChatExcel 的表现到底咋样。

  总体来说,它想做的事就是跳过学习 Excel、跳过写函数公式,直接把脑子里的需求变成表格里的内容。

  团队在知乎首发产品时,用了一张图做解释:

  老规矩,我们来上手体验下。

  进入主页面后,网站默认展示 demo,点击 UPLOAD 就能上传自己的表格。格式需要是标准 Excel 文件。

  我们找隔壁 ChatGPT 生成了一份学生成绩单,让 ChatExcel 进行计算操作。

  主要测试了需要插入函数的 Excel 操作。比如:给总分在 255 以上的人标记为A,总分在 240-255 的人标记为A-,总分在 210-240 的人标记为B。

  打完内容,敲一下回车,它就开始处理了。

  假如老师想知道谁是单科第一呢?输入:找到表格中数学成绩最高分的人。

  然后,它就生成了一个新的界面,里面只有最高分童鞋。

  如果还想对表格进行其他操作,点一下页面中的“UNDO”,它就能返回到操作前的表格了。

  我们还让它对表格中的学生进行成绩排名、并列出名次,ChatExcel 都没有出错。

  除此之外,他还能连续完成任务。

  比如想在表格里增加一栏平均分,可以先要求它增加一列:

  再进一步输入需求,让它把计算好的结果填进去:

  最后得到的表格,点击“DOWNLOAD”,即可导出为普通的 Excel 表格。

  体验下来,感觉 ChatExcel 主要有两大特点:

  • 连贯性
  • 准确性

  比如之前也有帮人生成 Excel 公式的工具,excelformulabot 能实现这一功能,但它是独立在表格外的,需要自己把单元格带入到给出的公式了。

  如果是具体一些的描述,还会出现给不出公式的情况。

  而对比 ChatGPT 来说,ChatExcel 计算的准确性更突出。

  比如计算同一个表格的平均数,ChatGPT 不是弄错到底有多少个人,就是计算的时候带错数字,反复纠正都救不回来……

  所以,ChatExcel 是怎么做到的?背后原理到底如何?

  把“乙方思想”贯彻到底

  ChatExcel 的原理一言以蔽之,就是直接把“大白话指令”转换成类似于 VBA 这样的程序语言,然后再执行程序。

  底层基于 Transformer 架构,基本技术路线就是无监督训练+具体场景微调。

  但 NLP 模型搞数学,一直都很容易出错,强大如 ChatGPT 都很难避免。

  为此,团队在训练模型的过程中,将重点放在了符号逻辑上,期间还有意引入了一些逻辑符号的新知识。

  由此我们也看到,它在计算上出错的概率并不高。

  除了数学能力出众之外,ChatExcel 最大的一个特点就是持续交互。

  这是因为 ChatExcel 每次的生成结果,都是基于用户提出的新需求+上一轮生成的表格。对模型的理解力及运算其实提出了更高的要求。

  为什么要实现这一功能?

  团队介绍说,如 Dall·E、ChatBCG 等 AI 工具,完成任务的方式都是单次不持续的。但在人们的实际使用过程中,想法是一步步推进的。

  举例来说,用户和 ChatExcel 之间的关系就好比甲乙双方,ChatExcel 是乙方,用它处理表格的我们就相当于甲方:要求只管提,改到满意为止。(Doge)

  同样,这个乙方思维也体现在开发团队自己身上。

  Demo 发布后,很多人跑来围观、试用和提建议。最常出现的反馈是,ChatExcel 有点理解不了提出的要求,需要重新措辞调整。

  对于这些情况,团队先阐明态度:建议我们全盘接受。

  同时也进一步解释了原因,目前开放的 demo 还不是很完善。

  这一方面是为了看看大家的反馈做进一步优化;另一方面,也是希望收集更多的资料,让模型之后能更聪明一些。

  比如,有人就提出:既然都已经有“undo”(撤销)操作,什么时候可以把它处理表格的过程显示出来。

  还有人附议,表格数据太多就很难检查它是否处理正确:提高 ChatExcel 执行任务的透明度,方便检查错误。

  对于这些建议,团队和我们说,他们已经在开始着手调整了。

  比如很多人反馈的语言理解问题,他们打算之后在对话框下根据用户的输入,推荐一些标准操作语句,大家直接选择就可以了,不用自己研究措辞,有点现在 AI 客服那味儿。

  除此之外,还有这些功能也在开发的路上了:

  • 表格上传格式更加兼容
  • 展示 ChatExcel 处理表格的具体过程,更加透明化

  以及 ChatExcel 更加具体的原理介绍,之后也会在官网以博客的形式发布。

  甚至包括代码,也会进行开源。

  受到女票启发,把业余项目做成正式课题

  说来 ChatExcel 的诞生,也是相当因吹斯听了。

  它受启发于团队成员的女票、导师立刻拍板认可、把业余项目做成正式课题……

  这还要从 Kid 和 CY 拉起小团队说起。

  他们都来自北京大学深圳研究生院信息工程学院袁粒老师的课题组,已经是准博士了,还有一位成员正在读硕士。

  作为机器学习的基础理论研究者,他们日常和论文打交道更多。

  为啥突然从理论研究转向应用?

  这还得从 Kid 的女票说起。

  他说自己的女朋友是一位中学信息老师,日常工作中经常需要帮年纪大的老师处理 Excel 表格问题。

  为了帮女朋友多分担一点工作(bushi) ,当然也看到确实有很多人深受 Excel 复杂操作困扰,Kid 就萌生了试试看的想法。

我觉得 Excel 公式的使用,多少还是需要编程思维的,这对于很多人、尤其是不擅长电脑操作的人来说,很不友好。而拿着工具书从头啃,也确实比较麻烦。

  当时正值 OpenAI 的 Copilot 大火,看到 AI 在提升生产力上大有可为,他就拉着 CY 一起,打算仔细研究研究这事儿。

  但事情前期,并没有想象中顺利。

  一方面,它刚开始只是个业余项目,大家都是抽空来做。

  另一方面,团队在技术路线上也做过重大调整。

  最初,他们觉得 ChatExcel 应该是往判别式模型那块儿走的,于是就顺着这一思路推进,但没想到:前期处理工作量太大,需要引入非常非常多的符号逻辑,数据要求很高。

  这对于小团队来说基本上是致命的,因为数据量意味着人力物力时间成本都会飙高。

  没有办法,Kid 和 CY 就坐下来重新复盘这件事:我们想到李沐老师发过一个视频,讲“BERT 和 GPT 之争”,我们最初都觉得 BERT 各种指标表现更好。GPT 呢,有点摸不清它想干啥。

  但仔细一想,从任务本身的需求来看,生成式才是我们真正想要的东西。

  加之去年 OpenAI 一系列生成式工作开始大火(如 Copilot、Dall·E),两个人最后决定,推翻原有思路,重新从生成式模型做起。

  明确了技术路线,后续推进也就更顺了。

  加上这项工作还得到了导师袁粒的认可和支持,团队在资源和经费上也更充裕了一些。

  (p.s.但团队也和我们解释说,目前其实还不能负担太多成本,运行速度会受到影响、一些命令行识别也还存在问题)

  不管怎样,历经 1 年时间,ChatExcel 终于发布 demo。

  但这只是计划的第一步

  团队表示,接下来还将对产品做更多迭代升级,并会开源代码、揭秘背后技术。

  对于 ChatExcel 的定位,他们坚持“小而美”。

  Kid 介绍说,大模型的确是当下的趋势,如 OpenAI、百度等都在通用大模型领域不断推进成果。但他们认为,在一些子任务领域上,模型的能力还有待提升,这可能会是未来的一个趋势。

  由此,他们目前会更加专注于模型特定场景下的能力提升。

  至于长远目标,团队希望打造一个“Chat 生态”、交互式 AIGC。

  终极“Chat 生态”(幻想版)大概会长这样:

  而回到 ChatExcel 本身,团队表示的确有商业化的考虑,但会是 To B 层面的。

  (听说 demo 一发布就已经有不少公司联系他们了)

  在 To C 这边,会坚持公益开放的形式,人人都能用。

  而回看整个开发过程,Kid 和 CY 的很多感受都记忆犹新。

  比如看到 ChatGPT 做表格大火后,他们又惊又喜。

  “惊”,是因为开始担忧会不会有很多同类产品出来?自己的项目没有生存余地了?

  Kid 说自己看到这些新项目不断涌出后,晚上都要睡不着觉了。

  “喜”,则是因为觉得自己的想法和趋势发展一致,这也是一种肯定。

  至于项目本身,他们的态度非常坦然,问题全盘接受,但对自己的成果也很有自信。我们现在依旧觉得自己的方案很“优雅”。

  感觉做理论的人转来做应用,总是能想到一些奇怪的思路 hhh。

(应受访者要求文中 Kid、CY 为化名)

  传送门:

  https://chatexcel.com/

  参考链接:

  [1] https://www.zhihu.com/question/586673687

  [2] https://zhuanlan.zhihu.com/p/607997627