加入收藏 | 设为首页 | 会员中心 | 我要投稿 云计算网_宿迁站长网 (https://www.0527zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 站长资讯 > 评论 > 正文

隐藏在今日头条百亿市值背后的算法:巨大可能与现实困境

发布时间:2016-01-28 04:33:23 所属栏目:评论 来源:虎嗅网
导读:无论2016年科技圈热门的噱头有多少,对数据基础设施方面的耕耘仍然是决定实力的关键。阿里之类电商数据帝国自不待言,今日头条、一点资讯等在资讯数据领域的开拓更加值得注

用资讯测试读者,是把读者看作已完成的人格。而人性是永远在路上的未完成之物。人性和人类的创造物,需要彼此激发,螺旋上升。分类聚合算法只是把自己看作一个置身事外的观察者,正如科学试验里的观察者,以为自己不在事件之中。但这是不可能的,算法已然在参与人性的构建,只是采取了消极的方式——人以群分,每个人沉沦在自己的趣味里。后果是读者的极化,老死不相往来,像黑客帝国里的人茧。人茧衰弱的同时,系统的活性也在衰减。

极端分化的人群与极端分化的信息一样,缺少活性。而搜索引擎则没有那么主动地去极化人群。人在搜索时候主动性更强,我倒希望一点资讯是在利用搜索引擎收集读者的主动性方面有所建树,以此刺激算法。

我们可以用贝叶斯算法本身的问题来解释这个危险:

研究者John Horgan在《科学美国人》上发表了一篇文章《被追捧和被歪曲的贝叶斯理论,究竟有什么大不了?》(由“机器之心”网站提供中文翻译),讲述了贝叶斯算法自身的一个矛盾(具体论证过程此处免去,可参见上面的文章链接):

“贝叶斯理论没什么神奇的。归根结底,它就是在说,你的信念只和它的证据一样有效。如果你有好的证据,贝叶斯理论就能得到好结果。如果你的证据不足为信,贝叶斯理论也就没什么用。进入的是垃圾,出来的也是垃圾。”

对贝叶斯算法来说,初始确定的概率很重要,比如前面提到“40%的成年男性喜欢阅读军事新闻”,这个概率判断就是初始确定的概率,能通过社会统计获得比较接近现实的数字,一般也比较符合常识。但是对于很多事情,比如“上帝存在”,初始概率就难说了,有人会定为百分百,有人会定为零,于是最终结果不过反映了给出初始条件者自己的主观愿望。即便“40%的成年男性喜欢阅读军事新闻”,表达的也是现有的社会状况。最终的资讯推荐结果则反过来强化了这个初始概率——爱看军事的就更多地看到军事新闻。认为性别是后天建构的女性主义者恐怕就会讨厌这种刻板状况。

所以,目前的算法是不太懂得体贴各种人类需求的。未来它应该让不同的趣味,不同的人群相逢。

今日头条应该收购豆瓣而不是入股各种媒体

张一鸣演讲批评微信朋友圈信息推荐效率低,在某种程度上是对的。在朋友圈获得优质信息的效率取决于你的朋友质量,有精彩朋友才有精彩资讯,如果都是晒海滩的当然没意思。头条不受社交关系限制,对于缺乏丰富社交层次的人来说,获得信息效率高。可是缺少社交属性和社交关系的积累也是头条的软肋所在。

腾讯目前正在低调运行“天天快报”,与微信平台以及腾讯媒体开放平台分开,未来未必不会整合。那样就可以结合社交推荐和算法推荐,尤其可以利用朋友圈里各种专业人士、学者点赞推荐或阅读撰写资讯的行为(只要他们愿意公开)。帝国的反击迟早要来,头条们的算法武士应该尽早打造具有熵增能力的资讯关系,并发展一种把“兴趣”人格化的算法社交方式。

算法需要人,这话不止是说需要社交关系,而是策划者的想象力。我见过有人围绕豆瓣上的影片打分,手工收集打分者读书数据,非常有趣。比如给电影《胜利大阅兵》五星的人喜欢看什么书,给一星的人又看什么书。在这个基础上,如果加以聪明的算法,就可以激发出新型社交模式,不过这里不展开。

蓝媒汇报告称头条购买了不少媒体的股份,比如世界说、新榜、华尔街见闻等等。从算法的逻辑讲,我以为这不是最优的收购方向。在我看,与那些拥有社交数据的媒体比如微博合作才是对的。头条们应该收购豆瓣。不是说要做社交,而是要拥有社交数据并利用算法激活之。豆瓣之类集聚的人之想象力,为什么不能和机器算法互相滋养?

这些技术起家的公司已聘请资深媒体人加盟,头条请了林楚方,一点资讯请了吴晨光,都是媒体圈很有名气的主编级人物。不过媒体人目前的作用主要是公关,撬动自己掌握的丰富媒体资源,或者利用自己的表达能力替不善言辞的技术人表述产品。

我觉得,如果媒体灵魂和算法的结合暂时困难的话,何方先做智库?眼下官方对智库建设青睐有加,头条们的数据再加一点媒体眼光,就可提供很多技术落后智库无法提供的报告。

这需要人的想象力。比如最近帝吧远征脸书,举国震惊,也引发了很多评论。无论各方如何评价,这都是90后乃至00后网络新人的一次亮相。各方都不太了解他们,商业公司需要了解他们,政府机构也需要了解他们。众说纷纭,很多是从主观偏见出发。

想了解他们有很多办法,比如去采访他们,去贴吧收集材料做统计。但百度或者头条们显然可以有更快捷的智能办法,能够通过相关评论资讯的阅读和其他关联数据,来考察相关人群的特点,他们的地域分布,他们的收入状况,他们的兴趣爱好。

在9月大阅兵期间,范玮琪因为在微博晒娃遭到大量谩骂,有人批评骂人者是民粹,是买不起好产品的loser。但是学者邹振东通过大数据分析发现他们的组成和其他群体类似,iPhone使用率很高,颠覆了主观判断者的意见。并最终发现是微博的算法推荐导致范玮琪和读者的意外碰撞。

这些命题需要有人想到,才能动用算法去做。而人的因素不像算法可以总结成可复制的标准算法。

洞察并善用人的智慧,发挥人群的博弈,而不是让个人成为资讯喂食对象,才会让算法也变得更有灵气。今日头条、一点资讯和天天快报,哪一家会走得更远?

延伸阅读:

  • 今日头条张一鸣眼中的未来媒体:是时候把过滤信息权力让度给社交关系和算法
  • 今日头条说浙江人爱创业?爱学贷力证:梦岂止于想
  • 今日头条总编辑夏勇:让技术与数据服务好民生
  • 今日头条张一鸣:技术让世界越来越美好
  • 新闻难道比游戏还有趣,今日头条人均用户时长超越开心消消乐

(编辑:云计算网_宿迁站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读