新浪王巍:人工智能在捕捉新闻热点上发挥越来越大的作用

界面新闻

text

作为老牌门户,新浪在移动新闻资讯领域起步有些晚。但经过四年的投入,新浪新闻客户端的用户规模已经从行业第十名追赶到行业第三。

2016年第一季度,新浪新闻客户端开始发力,当时的月活跃用户规模(MAU)仅为2540万。此后的几年中,新浪新闻客户端的月活跃用户每年以2500万左右的速度增长。截至2020年一季度,新浪新闻客户端的月活跃用户达1.3亿人。

回想过去几年奋起直追的过程,新浪首席信息官王巍对界面新闻表示,新浪管理层决定从2016年开始加大移动端的投入,把新浪新闻App打造成为一个综合的智能媒体平台,这个决策是至关重要的。

新浪新闻客户端在起步时,今日头条已经崛起,随后几年,移动互联网的增长红利也逐渐消退,这对一个刚起步的产品来说,是一个非常大的挑战。在王巍看来,让人工智能技术发挥更大作用,加强精细化运营并提升内容优质程度是新浪新闻客户端能在2018年之后继续保持增长的关键。

2018年,新浪加强AI技术的应用,辅助专业编辑对内容进行甄选把关。在算法上,新浪新闻客户端更注重满足用户的短期兴趣和长期兴趣阅读,避免因为不断根据兴趣推荐而造成的过度推荐。2019年,新浪成立AI媒体研究院,以 “智能+”移动资讯媒体为核心,打造智能媒体生态。

王巍表示,人工智能在捕捉新闻热点以及制作热点专题上发挥了越来越大的作用。

在捕捉热点上,新浪新闻通过人工智能学习以往全网热点、垂直热点的爆发路径,通过“人工+智能”的方法去归纳去总结一些热点预测的规律,可以成功地预测一些热点。

在制作热点专题上,原来人工制作至少需要半小时,而引入人工智能技术之后,系统能够快速帮助编辑找到过往和热点相关的新闻,编辑在5分钟内就可以制作好一个专题。

7月26日,在2020全球人工智能技术大会(2020GAITC)“AI时代下的新媒体与社交娱乐”专题论坛上,王巍与中国工程院院士、清华大学、浙江大学教授杨易等多位专家学者共同探讨了人工智能在新媒体、社交娱乐等领域的前沿应用与发展趋势。在他看来,整个内容生态信息生态会因人工智能技术产生一些非常大的变革,一定程度上会打破我们现有社会的一些连接结构,对传媒行业产生的影响是非常巨大的。

以下为界面新闻整理的与王巍对话实录:

界面新闻:现在各个新闻客户端的内容以及内容呈现形式都有一些趋同,如何在同质化中寻找到差异点?

王巍:确实是有一些同质化的趋势,新浪新闻作为媒体最重要的还是以优质内容为根本。但我们和别人不一样的是,新浪拥有全中国最好的社交媒体。依托于微博的数据和内容,我们给用户提供有特色的内容。

新浪成立快22年了,新浪新闻所有的内容、数据已经形成强大的树形结构的知识图谱。新浪新闻在这些知识图谱形成的大数据基础之上,做了很多人工智能的建模和应用,能够广泛应用到新浪新闻的媒体推荐的机制里来。

同时,微博内容和数据跟新浪新闻的是打通的,微博成立11年收集到了每一次在微博上爆发的热点,它的形成过程,酝酿过程,爆发过程,甚至是它层层转发的再爆发过程。新浪新闻可以去学习这些全网热点、垂直热点的爆发路径,通过“人工+智能”的方法去归纳去总结一些热点预测的规律,就可以成功地预测一些热点,或者是比别人更早地发现整个媒体网络上热点的酝酿过程,从而更早的去推送有关热点的内容。

比如,2019年4月的巴黎圣母院大火,大概是当天凌晨微博上旅游类博主发了第一条博文,新浪后台的大数据和人工智能的监控平台鹰眼监测平台监测到这篇微博,而且它很短的时间内被转发数量超过10倍,阅读量增长几十倍。我们就觉得这是一个潜在的热点,正在爆发。我们马上去做人工的核实,当天晚上欧洲媒体的报道出来后,新浪新闻就在第一时间把巴黎圣母院大火变成一条新闻,推送到用户的手机,实现全网分发。

总结来讲,在大数据、人工智能时代,我们通过对同一条新闻高频率的抓取转化量、阅读量的数据,去比较前后这两次抓取数字的变化,就可以发现热点。这种热点的内容可以用在图片新闻、文字新闻,也可以用在直播新闻上。

除此以外,新浪新闻与微博双平台打通后,形成的网状知识图谱,也解决了“信息茧房”的难题。

界面新闻:视频直播类的内容,如何通过人工智能监测发现热点?

王巍:我刚才讲的是知识图谱。实际上人工智能还有很多个分支,其中非常重要的是视觉处理。我们还有一个后台叫云剪系统,是基于视觉处理技术的。比如,在一场体育比赛直播中,我们会抓视频流和语音解说流,通过计算机视觉技术和自然语言处理技术,识别整场比赛里面最精彩的篮球中的扣篮三分球、足球中的射门,把两三个小时的比赛处理成三五分钟的精彩集锦。

界面新闻:从整个行业来看,人工智能、算法等新技术给媒体带来的改变主要有哪些?

王巍:由5G、云计算、大数据、AI、物联网、区块链等新技术协同创新所驱动的智能经济打破了原有的社会联结架构,相应的这些技术也驱动着媒体生态格局也发生着巨变。根据我的经验及认知,我认为人工智能、大数据等新技术对智能媒体的影响主要体现在三个方面:

第一,对内容生产的影响。随着人工智能的逐渐发展,地震新闻、天气、交通等模板类新闻,都可以由机器自动生成。

第二、对内容形式的影响。随着人工智能的发展,智能媒体能够提供给用户的内容不再局限于文字、图片、视频,未来VR和AR技术会更多的应用于视频内容中,用户不仅能够阅读,观看,甚至通过虚拟现实技术,进入到虚拟的环境中,而通过增强现实技术,还能够将虚拟与现实连接,给用户带来个性化的阅读体验。

第三、对媒介载体的影响,未来,内容消费场景不再局限于PC、手机端,智能设备、智能穿戴、智能家居、智能汽车、无人驾驶等均将成为用户观看、收听新闻资讯的媒介。

面对新技术带来新的发展机遇,新浪新闻重点发力布局全景生态,将优质内容分发到除移动客户端之外的社交媒体、智能音箱、智能家居、智能穿戴设备、互联驾驶的汽车屏等更多的分发场景与设备,并以社交圈层传播、精准定向、场景时机推送、智能语音等多种方式最终触达用户。

界面新闻:今年的新冠肺炎疫情让用户对即时准确的信息需求量猛增,这是否让你们对新闻客户端接下来的发展趋势有新的思考?

王巍:在疫情信息传播中,数据驱动的信息传播迅速展开,疫情传播应用场景不断涌现,应用范围持续拓展,提高了疫情信息的生产、聚合、分发效率。更涌现出一批满足用户多元需求的新型信息产品。

比如,新浪新闻的实时权威的疫情地图,它是一个将大量抽象的数据用图形、图表等具象的形式表现出来的可视化新闻报道产品,让复杂、晦涩难懂的数据信息,以简单明了、易于理解的方式展示给大众。截至3月31日,我们的实时疫情地图累计被查看超过27.5亿次。

同时,中国智能媒体集结抗“疫”,集中展示了媒体智能化发展的创新空间和发展潜力。具体表现在:

第一、主流价值导向将引领智媒的发展;

第二、自然语言处理、深度学习、计算机视觉、知识图谱等技术领域的加速突破,会推动媒体认知智能的升级;

第三、人工智能应用将从当前生产、分发等重点环节逐步渗透至全流程、全环节,推动智能媒体纵深发展;

第四、智能媒体将推动商业模式的创新,重构内容服务体系,推动经济效益稳健提升;

第五、以先进技术为支撑,以创新管理为保障,以内容建设为根本,才能不断激活媒体的AI能力。