知乎周源政协提案:加快知识开放,推动全民共享数据红利

  警惕部分市场主体滥用支配地位实施垄断的行为。

  文|《中国企业家》记者赵东山

  编辑|李薇

  头图来源|受访者

  作为一名新任全国政协委员,知乎创始人周源今年仅带来一份提案——关于加快知识开放,推动全民共享数据红利,主要聚焦目前网络知识数据库领域存在的,部分市场主体滥用支配地位实施垄断的行为。

  在互联网时代,知识数据共享带来的长期好处自然不必多言。然而,部分企业在面临当前的利益问题时,还是会采取短视的行为,甚至侵犯到行业生态伙伴和消费者的合法权益。早在 2022 年 4 月,“中科院因近千万的续订费用不堪重负停用中国知网数据库”的消息就曾引发网络热议,甚至部分研究学者控诉在知网下载自己的文章还需要付费。

  当时,《人民日报》官方微博发文评论此事称,“知识无价,收费有据,但一种商业模式屡屡冲撞公共利益,频频敲打世道人心,乃至不时打法律擦边球,确有反思必要。如何平衡商业逐利与公共利益关系,该有个说法了! ”

  2022 年 12 月,中共中央、国务院还发布《关于构建数据基础制度更好发挥数据要素作用的意见》,即“数据二十条”,指导思想包括“促进全体人民共享数字经济发展红利”“强化反垄断和反不正当竞争,形成依法规范、共同参与、各取所需、共享红利的发展模式”“建立公共数据、企业数据、个人数据的分类分级确权授权制度”。

  知乎作为一个互联网内容社区,同样聚集大量专业学者和海量的专业问答,因此,周源把眼光聚焦到共享数据红利方向,他希望和行业一起打造健康的国家知识生态体系,参与建立可持续的全球型知识共享空间。

  以下为《中国企业家》对周源委员的采访实录(有删改):

  新委员,新感受

  《中国企业家》:首次当选全国政协委员,你有哪些感受?

  周源:首先肯定是一个荣誉,当然也是个责任,我希望能充分发挥自己的优势,为社会多做一些积极的贡献。

  第一,因为知乎是互联网企业,可以更高频次、更大范围地去了解现在年轻人所关心的各种问题,其实也是联系群众,在此基础上形成一些意见,同时我们也可以在里面有所实践,形成一个闭环。

  第二,要更加深入、持续地关注社会热点,包括很多民生的问题。知乎并不是一个制造热点的地方,但是知乎是很多人习惯每天来寻找各种热点解读的平台,知乎有非常多不同行业、不同背景的人给出的不同答案,对此进行分析和研究,在此基础之上,有针对性地形成更具体的一些建议和方案。

  第三,针对我个人,作为全国政协委员,要不断地学习,保持独立思考和创新的思维,不断提升自己的理论水平和素养,避免被一些片面的东西所左右,要更深刻地看到表象背后的问题,提升分析判断的水平。

  《中国企业家》:这一次作为新的政协委员准备了多少提案,提案的思路大概都来自于哪些实践和思考?

  周源:今年只有一个提案——关于加快知识开放,推动全民共享数据红利。过去一段时间的思考主要有几点:

  第一,关注数字经济和技术创新领域,找到推动平台经济、数字经济发展,包括科技创新进步的持续动能。

  第二,关于提倡知识开放和数据共享,通过促进全民共享数字红利,来推动数字经济和社会的可持续发展。

  第三,关于教育和科技的结合,提高人民群众的科学素养和创新能力,最终达到社会全面进步和繁荣。

  《中国企业家》:为这个提案你做了哪些准备?思路过程是怎样的?

  周源:包含几个方面:第一,国内的大致现状是什么情况;第二,通过行业专家了解,假设在一个理想的情况下,在数字经济和整个社会发展层面,我们会看到一个什么样的景象;第三,相关的政策、法律法规有没有一些新的变化;第四,针对国际上的一些情况做了一下对比。

  知识围栏现象成因和破局

  《中国企业家》:你认为提案中提到的知识围栏、数据孤岛现象主要是怎么形成的?

  周源:从宏观行业角度看,还是存在市场垄断。市场监管总局在之前的反垄断案件中也指出,数据库市场的主体存在滥用支配地位实施垄断的行为,比如大幅提高服务价格销售数据库产品。也包括通过各种方式来签订独家合作的协议,比如我们的学术期刊出版单位、高校,最后也没有办法向第三方机构授权使用学术期刊、博士论文这些学术文献等等。

  其实这里就存在价格不合理,包括限定交易的行为所造成的市场垄断状态,这个最后就会限制整个中文学术数据库的良性竞争,也会伤害用户的合法权益,最终影响整个市场相关的发展和学术交流传播。

  摄影:邓攀

  《中国企业家》:其实之前国家也提倡过反垄断和打破数据孤岛,你觉得之前为什么没有能够真正地去促成开放?

  周源:首先知识开放会带来好处,比如可以加速科学和技术的进步,避免研发重复和浪费资源,进行知识的普及和传播也有利于提升整个公民的科学素养,还会促进社会公平。

  但是这个事有一个变化的过程。我们看科普中国的战略,其实也不是一年战略,是一个长期战略。通过长期的积累,最后能够让公民的科学素养达到一个百分比的提升,这些都是知识开放带来的好处。与此同时,开放本身也是一种能力,需要不断积累。

  反过来看,在这个过程中市场主体商业上的好处却是立刻的,它会导致一些数据库的市场主体滥用支配地位,一些垄断的行为就可能会出现。这个时候如果把商业的得失放在首位,就会忽略掉市场良性的发展,包括一些公共利益。

  怎么在公共利益和商业利益之间去明确自己的边界?它也有一个过程,但是现在的现象它已经暴露出来。

  不过,2022 年 12 月,中共中央、国务院发布《关于构建数据基础制度更好发挥数据要素作用的意见》,即“数据二十条”,指导思想包括“促进全体人民共享数字经济发展红利”“强化反垄断和反不正当竞争,形成依法规范、共同参与、各取所需、共享红利的发展模式”“建立公共数据、企业数据、个人数据的分类分级确权授权制度”,对于公共数据,“推进互联互通,打破数据孤岛”。建议尽快推出“数据二十条”执行细则,加快数据开放与共享的实施进程。

  把握免费和收费的边界

  《中国企业家》:前一阶段关于 ChatGPT 话题,我们采访了 360 集团创始人周鸿祎,他同样提到了数据孤岛可能导致人工智能引擎训练的局限性。在知乎中,同样既有海量的免费内容,也有会员付费内容,你在行业共享和付费商业模式设计时做了哪些考量?

  周源:数据库作为一个知识内容的集成平台,一方面具有商业属性,另一方面也是一种公共资源。

  从商业模式角度来看,当前部分数据库主要的收入来源是通过收集已有的论文、文献这些知识成果进行二次营销,而这些内容有很大比例是属于公共数据,比如很多论文和研究成果,是政府和公共基金资助的,应该是全民开放的。

  但如果数据库从现在的二次销售转向服务的提供,比如说通过数据分析加工,再二次创作形成了新的增值,形成了自身的服务能力,就产生了新的创造性成果。所以数据库选取什么样的商业模式,是很值得去考量的。

  对于知乎来说,我们是一个非常开放的专业讨论社区,最基础的模式就是你只要有问题,恰好这个世界上有人知道,通过问答的方式就把大家联系在了一起,然后产生出了可承载的内容,再提供给更多的人来使用。

  在发展的过程中,我们发现因为过去的积累,能够产出值得付费内容的创作者变多了,他们也开始进行新的创作。所以知乎并不是在进行已有内容的二次销售,而是创造了全新的内容。这些内容由于赢得很多关注者和消费者,就会获得一个比较正向的反馈和一个新的商业模式。

  我们是非常在意创作者的知识产权保护的,也关注他们产生的内容是否有好的口碑和质量。在过去三年,知乎走出一大批既有良好口碑,收益也不错的创作者,最开始可能是万元户,到现在有百万元户了,这个商业模式在产生新的价值。

  《中国企业家》:在商业模式中,你在 2022 年三季报的时候也讲要在年底尽快盈利,去年知乎在商业化方面面临哪些挑战?如何破局?

  周源:过去三年发生了很多的事情,有个词叫“全流域降水”,有时候不是只针对你,行业上下游可能都会受到影响,我今年对大环境还是充满了信心。但是整体来看,从去年到今年,企业本身的发展还是会呈现很大的波动和弹性。

  知乎去年主要的财务指标是按照预期在发展的,也超出了市场的预期,显示出了一定的韧性和抗压能力。我们到去年三季度的时候,总体的收入同比增长了接近 30%。

  知乎收入结构由两条曲线构成,分别是社区业务和职业教育业务。社区业务既包括了营销类的收入,也包括会员收入。

  我们在去年三季度月均付费用户数已经超过了 1000 万,同比增速超过了 99%。职业教育增长速度也比较快,我们的职业教育付费用户规模增长 300%,环比增长 40%,增长很快,前景也非常广阔。在这两个引擎的助力之下,我们对我们的发展和盈利充满了信心。

  ChatGPT 和未来规划

  《中国企业家》:知乎上有非常多高质量的语料素材,你和知乎对 ChatGPT 是否会做一定的业务跟进?此前知乎在人工智能领域有哪些布局和积累?

  来源:视觉中国

  周源:第一,我们非常密切地在关注 ChatGPT 相关的技术发展,同时我们也看好它在内容产业释放的积极价值;第二,作为一家技术驱动的公司,肯定积极去拥抱新技术的,希望我们的整个内容生态能够受益。

  但是,我们在过去技术积累的过程中,并不是单纯的去做某项技术,我们特点是场景加上技术,或者场景加上人。

  我们原来有一个机器人叫悟空,它主要是通过算法防止各种垃圾的产生;我们还有个机器人叫瓦力,它是在社区里扫垃圾的,只要是用户出现一些不友善的行为,它就变成了保镖;还有我们的内容推荐系统。

  这些都是场景 +AI,通过技术创新驱动的方式,提升效率,然后达到一个比较好的用户体验。

  我们技术上也有一些积累,比如积累了大量的用户行为数据样本,也积累了很多工程方面的经验,还包括我们的运营知识,这些东西非常有利于大语言模型,等到它在社区得到广泛应用的时候,其实可以得到加速的效果。

  《中国企业家》:ChatGPT 火了之后,除了数据的开放度,各大平台的数据内容质量和污染度成为大家关心的话题,这其实也跟你之前提过的专业讨论的社区氛围密切相关,知乎在保证内容专业度和高质量方面有哪些产品机制和措施?

  周源:知乎的定位是专业讨论,围绕此相关的各种机制,我们持续在投入和迭代升级。比如:我们在 2021 年就提出了“获得感”的内容标准,即开阔眼界、带来帮助和引发;第二,怎么将这一标准变成策略和算法,此后就可以围绕它进行数据化迭代,它就可以取得不断改进的量化进展,形成一个端到端的闭环去迭代。在这以后,我所期望的东西逐步在发生,好的内容得到更多的流量收益,整个社区的生态也因为这些事情能够发展得更好。

  《中国企业家》:你今年的提案背后是不是也考虑了 ChatGPT 的技术特点?

  周源:长期来看,肯定是有很大的关联性的,因为它都属于数字经济发展过程中,要么是需要解决的问题,要么是未来需要产生的融合,或者说未来它有可能产生争议的部分需要做个建设。所以从长期来看,这些问题都属于基础的问题。

  《中国企业家》:2023 年,你对知乎有哪些期待?会采取哪些措施?

  周源:第一,坚持生态第一,包括创作者体验、内容获得感、良好的社区氛围、匹配社区发展节奏的商业化增速。

  第二,持续在第二曲线进行投入,职业教育其实差不多也探索小三年了,到现在我们看到了第一阶段的收益。第二阶段,我们希望能提升这个行业的效率,把解决行业痛点当成目标,让消费者在这个过程中能够得到收益,赢得口碑。它跟整个知乎的社区会形成非常好的联动,职业教育是社区的延伸,同时社区也可以作为职业教育的入口。

  第三,我们非常坚定地加大对自主创新方面投入的比重,包括你刚才提到的 ChatGPT 相关的大语言模型,以及与知乎的应用场景的结合,通过技术创新提升用户体验。