口无遮拦的钉钉与坐立不安的腾讯,支持使用微信小程序

图片 1

原标题:​硅谷AI技术文章:Google 机器学习40条最佳实践(中)

原标题:iPad 支持使用微信小程序

原标题:口无遮拦的钉钉与坐立不安的腾讯

硅谷AI技术文章:Google
机器学习40条最佳实践(上)

微信公众平台官方公众号今日晚间发布消息,微信 iOS 6.7.2 起已支持 iPad
使用小程序和小游戏。用户登录 iPad
微信后,可通过小程序的各个入口打开小程序和小游戏。

图片 1

机器学习第二阶段:feature 工程

开发者可对小程序进行大屏幕的适配,并根据业务的实际情况,决定是否支持用户转动屏幕。为了提升小程序页面的启动速度,在原分包加载能力的基础上,小程序新增分包独立加载功能,允许分包独立于主包与其他分包运行,并支持预下载。此外,为丰富小程序地图服务的使用场景,小程序地图组件新增个性化底图样式小程序示例。开发者可通过开通腾讯位置服务更换小程序地图样式。返回搜狐,查看更多

2010 年 11 月 27 日,深夜十一点半,仍在加班的张小龙忍不住发了一条饭否:
一个产品,要加多少的功能,才能成为一个垃圾产品啊。

上一篇内容主要是说机器学习的第一阶段,主要涉及的内容是将训练数据导入学习系统、测量任何感兴趣的
metric,以及构建应用基础架构。当你构建了一个可以稳定运行的系统,并且进行了系统测试和单元测试后,就可以进入第二阶段了。第二阶段的很多objective
都很容易实现,并且有很多明显的 feature
可以导入系统。因此在第二阶段,你应该多次发布系统,并且安排多名工程师,以便创建出色的学习系统所需要的数据。

责任编辑:

张小龙那时还不是微信之父,著名的 Allen 仍在追赶者的行列里。在他身前,是
Talkbox、Kik、Whatsapp,甚至是米聊。

第16条规则:计划发布和迭代。

后来者微信能后发制人,靠的是功能优化完善。一定意义上说,张小龙说得对,这些竞争对手跑得太快,却没有掌握好功能多少的平衡。功能太少,用户喜新厌旧,但如果功能太多,产品会愈发臃肿,最终被用户抛弃。微信早期的成功,是野心克制的胜利。

你现在正在构建的 model肯定不会是最后一个
model,所以
model一定要简单可行,否则会降低未来版本的发布速度。很多团队每个季度都会发布一个或几个
model,基本原因是:

可惜,不知道今天的张小龙还能不能想起自己写的另一个段子:你强烈反对的,一定是你自己也拥有的。

  • 要添加新的 feature。
  • 要调整正则化并以新的方式组合旧的 feature。
  • 要调整 objective。

最近腾讯很烦。

在构建model
时,需要考虑以下几点:添加、删除或重组 feature 的难易程度;创建 pipeline
的全新副本以及验证其正确性的难易程度;是否可以同时运行两个或三个副本。

今早,国家新闻出版署又宣布对网游采取总量调控。腾讯股价再度下跌。腾讯在舒服日子里待太久,以至于有人发了个揣测贴,说张小龙去年有一半时间在国外打高尔夫。这种传言说着说着大家就都信了。

第17条规则:放弃从经过学习的 feature
入手,改从可以直接观察和报告的 feature 入手。

但这种优渥或者说对外展现出来的优渥态度,一夜之间似乎也失去了。

这一点可能存在争议,但确实避免许多问题。经过学习的feature
是由外部系统或学习器本身生成的
feature,这两种方式生成的feature都非常有用,但可能会导致很多问题,因此不建议在第一个
model
中使用。外部系统的objective可能与你当前的objective之间关联性非常小。如果你获取外部系统的某个瞬间状态,它可能会过期;如果你从外部系统更新
feature,feature 的含义就可能会发生变化。因此采用外部系统生成的feature
需要非常小心。因子model和深度model
的主要问题是它们属于非凸model,无法保证能够模拟或找到最优解决方案,并且每次迭代时找到的局部最小值都可能不同,而这种变化会导致无法对系统发生的变化做出准确的判断。而通过创建没有深度feature的
model,反而可以获得出色的基准效果。达到此基准效果后,你就可以尝试更深奥的方法。

8 月 24 日,钉钉 CEO
无招在一次峰会上演讲时说,滴滴、今日头条、快手所有这些顶级互联网公司,没有一家在上班时间允许使用微信工作,就连腾讯,上班时间也不允许使用微信办公。

第18条规则:探索可概括所有内容的 feature。

这句话本身所想表达的意思,倒没什么大问题。多数企业都有自己的办公协作系统,越是大企业,越需要一套企业社交工具,不能放任在微信里。虽然无招表述的不够严谨,但大概意思不差。

机器学习系统通常只是大系统中的一小部分。例如,想象热门信息中可能会使用的帖子,在它们显示为热门信息之前,很多用户已经对其转发或评论了。如果你将这些信息提供给学习器,它就会通过观看次数、连看次数或用户评分来对新帖子进行推广。最后,如果你将一个用户操作当作label,在其他地方看到用户对文档执行该操作就是很好的feature,你就可以借助这些feature引入新内容。但是要记住,一定要先弄清楚是否有人喜欢这些内容,然后再研究喜欢程度。

唯一奇怪的是,这样一个表述上的误差,居然引来了腾讯的回应和追打。这倒是有史以来第一次。

第19条规则:尽可能使用非常具体的 feature。

钉钉挑衅微信,早就这不是什么新鲜事。这家公司从诞生开始,就气势汹汹,要在社交王国里搞一轮革命。为此,钉钉包下过报纸头版广告,嘲讽微信群聊不安全,也设计过挑衅微信的创意海报,一路贴到腾讯楼下。

对于海量数据来说,相比学习几个复杂的feature,学习数百万个简单的feature会更简单一些。因此最好使用feature组,其中每个feature都适用于一小部分数据但总体覆盖率在
90% 以上。你可以使用正则化来消除适用example 过少的feature。

无招也不是第一次主动发声,过去几年,无招多次在公开场合历数微信是精神鸦片、效率低、不安全、破坏专注力和创新等等。这些表述,无一不比这次的口误更尖锐。但腾讯和微信从未应战过。

第20条规则:组合并修改已有的
feature,以便用简单易懂的方式创建新 feature。

反倒正是这句表达,让腾讯有点坐不住了。

组合并修改feature的方法有很多种,你可以借助机器学习系统通过转换对数据进行预处理。最标准的两种方法是”离散化”和”组合”。”离散化”是指提取一个连续feature,并从中创建许多离散feature。”组合”是指组合两个或更多feature
column。但是你需要拥有大量数据,才能使用具有三个、四个或更多基准featurecolumn的组合学习model。生成非常大的featurecolumn
组合可能会过拟合。这时你就可以使用”组合”的方法将feature
column组合起来,但最终会得到很多feature(请参阅第 21 条规则)。

先是公关老大张军亲自出马,朋友圈和微博上公开怒怼,”
我们有这个规定?我怎么没听说过?”

处理文本时,有两种备用方法:点积和交集。点积方法采用最简单的形式时,仅会计算查询和文档间共有字词的数量,然后将此feature
离散化。如果使用交集方法,只有文档和查询中都包含某一个词时,才会出现一个feature。

接着,微信官方账号 ” 腾讯微信团队 ” 也罕见地转发张军的朋友圈,”
难道天天上我的是一帮假同事?”

第21条规则:你在线性 model 中学习的 feature
权重数与你拥有的数据应该大致成正比。

这句转发有多诡异呢?这个账号上一次发微博是什么时候?2016 年 6 月 1
号。而整个 2016 年,这个账号只发了两条微博。

在model
的合适复杂度方面有很多出色的统计学习理论成果,但这条规则是基本规则。曾经有人有过这样的疑虑:从一千个example中是否能够学到东西,或者是否需要超过一百万个example才会有比较好的效果。之所以会有这样的疑虑,是因为他们局限在了一种特定的学习方式中。问题的关键在于你应该根据数据规模来调整学习model:

一向沉得住气的微信团队,也居然被无招的一句无心插柳给炸得坐不住了。位子稳固时,谁都是沉稳大度的,位子不稳时,你反而会急于辩白。

1.如果你正在构建搜索排名系统,文档和查询中有数百万个不同的字词,而且你有1000
个 label example,那么你应该在文档和查询feature、TF-IDF
和多个其他高度手动工程化的feature之间得出点积。这样你就会有1000 个
example,十多个feature。

今时不同往日。今时今日,腾讯在游戏领域产品创新不力、收入下滑,内容赛道上,今日头条战鼓喧天,而在一向最坐得住的社交领域,如今也是大军压境。

2.如果你有一百万个example,那么就使用正则化和feature
选择使文档 feature column 和查询feature column
相交。这样你就会获得数百万个feature;但如果使用正则化,那么你获得的feature
就会有所减少。这种情况下你会有千万个example,可能会产生十万个feature。

以子弹短信为例。子弹短信在聊天功能上的少许改变,立刻就足以引发病毒式传播。以今天子弹短信的体量,想要以几个功能改善来挑战微信生态,的确还有点儿远,但若将子弹短信视作一次传播话题。那么,这背后的用户心理就很值得玩味了。

3.如果你有数十亿或数千亿个example,你可以使用feature
选择和正则化,通过文档和查询标记组合feature
column。这样你就会有十亿个example,一千万个feature。统计学习理论很少设定严格的限制,但能够提供很好的起点引导。

有个朋友用这句话来形容子弹短信背后的微信态势:天下人苦微信久矣。

最后,请根据第 28 条规则决定要使用哪些
feature。

猎豹移动 2018 年 Q1 报告显示,与去年相比,2018
年以来,微信的周活跃和周人均打开次数都有了明显下降。QQ 和 QQ
空间的月活更是从 2016 年开始持续下跌至今。

第22条规则:清理不再使用的 feature。

微信曾经是一个革命性的产品,但今天,微信已经生长为一个臃肿的生态。不知道张小龙是否意识到,自己正在成为曾经怒喷过的那种人:功能太多、产品臃肿。

发表评论

电子邮件地址不会被公开。 必填项已用*标注