TA的每日心情 | 开心 2022-9-23 15:09 |
---|
签到天数: 2 天 [LV.1]初来乍到
超级版主
- 积分
- 10889
|
作者 | 姚旭 编辑 | 小智 本文将通过对比传统国内互联网公司和 Facebook 等硅谷互联网公司的团队构成和项目流程,结合其中对比的利弊,以及融合两种风格在小红书落地的实战经验, 总结一条,以数据驱动和 Ownership 为核心的高效团队组建和协作的方法论,作为增长型公司如何在“效率”上超越大公司的最核心的竞争力。本文整理自 QCon 2018 上海站上的演讲。 从硅谷到中关村到底有什么差别?以 Data Driven+Ownership 组建高效团队!6 u8 B# e: V, M# Q7 z: [
效率差距 在加入小红书之前,我曾先后在百度、知乎、Facebook、Airbnb 工作。今天就想分享我在这过去的十几年间看到过、经历过的不同公司在“效率”上不同做法,以及一些自己的总结。
( B _/ ^2 a: l“从硅谷到中关村到底有多远?”大家在十年前觉得硅谷是技术型公司的圣殿。但是,今时今日中美互联网公司,这些差别都变得非常小。
% N. t: b, M+ ]3 M: y5 t
) ~4 \: R) s2 }
2018 年初 Mary Meeker 的年度互联网报告里面,Top 20 市值 / 估值的互联网公司中国占了一半,但从实际角度,还是在一些领域内差距明显。以 Facebook 和阿里巴巴为例。他们两个的市值曾经非常接近。但平均每个员工创造的收入,Facebook 大概是阿里巴巴的 3 倍。这个数据代表了一个公司的效率。, ^0 T: L7 S( f3 g0 N
h6 f( z) x0 q a% q站在今天,中美互联网企业最明显的差距就是团队效率。
5 w" B8 W- C" z% Y
- `& `' L- N: M6 v接下来,我们将对比差别产生的原因,及能从硅谷能学到的东西,包括在小红书的一些实践当中看到的效果和遇到的问题。4 {4 A( _! a* r, C5 _9 |6 t
互联网时代的软件工程 我们今天对于效率的讨论,都是在互联网时代这个大背景下如何能够最大化团队的效率,最大化团队的产出。但中文互联网元年大概是在 2000 年左右,我们现阶段的所有互联网企业都是脱胎于那个软件时代。4 M8 |3 f+ [) b9 M4 W2 i3 \
& E9 ~+ x, W3 B! L软件时代和互联网时代有什么区别?软件时代 release 周期大概是半年到一年,背后的逻辑就八个字:质量第一,按期交付。8 y8 c) L4 C! _- ~' b0 c z
5 j, i0 `$ O# m9 b
我们来讲讲其中的巨无霸:微软。
3 m7 ?/ k1 c6 o: @! }& Z/ z
) C! P! T$ O- e ?$ K在中国互联网企业里,大家沿用了微软的开发流程。PM 中心制,以交付文档作为各个阶段的结果产出。这是一个对于整个软件开发而言好的流程。8 {( v0 B0 l3 j0 D% p- H' v5 L T) p
4 k) l& L- M. S+ U7 E/ Q但到了互联网时代,这样软件工程有什么问题?; M; m4 E b c$ V) P) b+ S; h6 V) f
8 i3 u6 G: i. B3 r! K2 V
- 第一点,所有原始设计的功能点的周期不再是月级别,是周级,甚至可能都是天级。
4 b% a" T& }6 b+ ]; b# Q - 第二点,职能化区隔。基本上我们的团队构成都是以职能切分,PM、工程师、测试工程师等。" T0 ~7 Y- g, r
在复杂的互联网场景中,我们就会出现 PM 的需求和排期,会分别细化到客户端团队,到服务器后端等。Team 越来越大,时间却越来越少。流程能带来安全和质量,但流程不能带来效率。
7 d' o* j4 P Z! j0 O8 [ T我们再来看看互联网时代下带来的变化:
% O" A& c ]# p$ `- Y: l! F
' O; t/ R) d6 w- 第一点,迭代速度比不出问题重要。如果一个特别严重的 BUG 放到线上,1 分钟就能定位,5 分钟就能 Release 修复,可能只影响到了非常少的人,可以用迭代速度去弥补出现的问题。9 \: d# Z4 ?1 F+ w
- 第二点,一个基本功能的 MVP,也就是一个功能的最小化产品单元,比一个完备的产品设计要重要得多。! K) \. \) ~9 K* \3 n
- 第三点,用户反馈就显得比按期交付更重要。应该用最小化的产品单元,用最快的迭代速度,将用户的反馈收集到,确定这个产品的功能要不要,做不做深耕。: {2 z" q' `3 O# R$ _! G
) S5 A7 B" V; z; M# u+ x5 Z& Q
在互联网时代下,对比传统软件时代,我们的最终生产效率能差多少?10 倍肯定是有的。效率就是第一竞争力。
+ e+ C" V% ]- c6 D3 p% A0 f) X* {& g- z. ]5 k3 ]
我们再举个互联网时代公司的例子:Facebook。
3 C) u- ~9 `+ J: B) `Facebook 的一个最小 TEAM 单元叫做三人组,是设计师、产品经理和工程师,三个人完成基本功能。三个人之间不是流水线上各自独立的环节,而是相互讨论,相互交织。
9 ~! c( j6 W) ]+ F5 O7 d
7 T+ I+ A( e% Y' V/ [产品经理,他不再只是 Product Manager,而是 Problem Manager,让大家能看到问题的全貌,一起来探索解决的方案。
, F+ y5 n' D# h; e4 B- E; B
# ^+ [5 x; \' G A7 y+ c* a( S6 {& e三人组这样的团队,与那个按职能来划分的团队相比,有什么区别?
- M7 q, n- g# [- ~/ \6 B第一点,对问题负责,所有人不再只负责流水线上的一环,而是负责最终结果。
- M" F- W& ]+ x4 z0 U" @第二点,因为存在大量的面对面交流,而不是文档交流,它的结果是对于主观能动性的激发是大的。, [ d3 V: k1 `' Z
这两点是为什么能激发 10 倍的效能的基础。对一件事情有 Ownership 可以激发个人巨大的效能。" v. ?- J2 C1 _% ]0 F E
以效率为中心,带来了哪些变化呢?
8 Z4 z3 J; D+ o6 l* i变化 1:团队
6 y6 M2 M. \8 K我们先来看看团队的变化。+ I C( Y" P% p
& U7 A F3 E; f: H! J例如 Instagram 从创业团队做大,一定要有术业有专攻。对于 Instagram 而言,第一个切分出来的团队是基础架构,他们支撑一个底层业务。2 E+ @4 p) ^$ M. q- \5 W( F2 G
第二个拆分出来的团队是 Growth。这个增长团队是闭环的,为了目标就是一个,如何协同一起把这件事情做成,把问题解决。# J; |/ n- [4 \2 o% k6 B, [; \
之后,还会切分出 Engagment 团队,以及 monetization 团队。/ M: A* e/ k: y$ J* G! q6 ]. z _5 C
团队的切分方式都是以能让大家分享同样一个用户侧的目标,或者是公司级的目标。
6 p* S. c' m: \" [! W在实际场景当中,大家最怕与跟自己职能不一样的人放在一起。但我认为,单一驱动在今时今日这个场景下面是不存在的。
% T2 O/ p9 W( o驱动大家的东西,是用户侧的反馈,或者叫数据。每个人都应该放下只有我说了算的 EGO,平等的对话,在各个地方收集问题,一起找到解决路径。
* ~, V/ L* L1 s在这样的团队里面,带来了第二种变化,数据无比重要。职能不一样,团队的共同语言是什么?数据驱动决策的含义,就是团队里面每个人都需要去阅读数据,读懂数据。
% x6 T6 u5 x! E& U- K8 u6 P数据驱动分几级:
- p6 Y- l* d" U& }* E* A# R
# t* b0 D7 } r2 A/ B: e j J; H- 第一个,公司级。出个 Dashboard,加个 BI 团队,负责给老板跑数。这是低 level。$ Y- c# i8 c3 |+ c0 ]+ C' @ `% M; Y
- 中等 level 是团队级,每个团队都有自己的可以量化的目标和结果。8 v+ j: \' ?3 C) Q5 W
- 高等 level,应该是团队当中的每一个人每天都在跟数据打交道,每个人都能用数据,每个人都会用数据。但这需要有配套的机制和工具做辅助。1 n( @- u8 G$ j2 @: l/ i
0 o' G ?" P" W6 X' F2 D
在 Facebook 内部,五年前有三大工具:Scuba,Hive,Ods。ODS 传统 KV 储存,主要是一些计数器。HIVE 就是数据仓库,可以跑很大的数据量,缺点就是反应慢。SCUBA 在 Facebook 内部是人大家日常使用最多和最有帮助的工具,可以实时地做多维聚合。2 l& P& Y8 s. k3 U; }! q1 U
6 l+ Y6 \3 q2 `* f) G
, s: P- n7 ~. g2 a( l) S实际应用工具当中的一个转变,对人的影响是非常大的,工程师关心的不单是 CPU、MEMORY,关心的是全链路业务上面的用户反馈,要有工具能看到结果长什么样子。产品经理也要有能力自己取数,要有 data sense。
6 b/ ^4 K( b4 z7 Y# S1 \# z: T7 x& x5 o i
这样,数据科学家和数据分析师不再是取数工具了,而是可以去做数据分析,找到驱动数据变化的深层原因。5 y/ S. w, B/ @) _% L
最后数据应该是公开的,应该是能覆盖到尽量多的维度,数据的生产者和数据的消费者应该是一体的。我想知道,我做了这个功能有没有人用,有多少人用,用得好不好,这才是最大的驱动力。, L$ o& i' I3 |$ w% ~! m
变化 3:职责 优秀的团队,需要对结果负责。对结果负责很重要的一点,或者说做出成功产品的团队核心是什么?叫做 DOGFOODING。
3 i3 Y. c# |5 t9 |+ o
7 U# [: S1 ^- b- E7 _$ r! I
DOGFOODING 是什么意思呢?就是自己用自己的功能,自己吃自己的狗粮,或者狗屎。自己做出来的功能,首先自己要先用起来。5 F" ?" M: O* J7 I6 H7 F/ f' ^
( f0 ^0 v' K# l. ^ h. ]
在 Facebook 有几种简单的工具去支持大家快速做用户侧尝试,哪怕是只给自己使用尝鲜:
8 j- c$ f3 l, y& P. N$ g" |
$ ?* A1 s# ?8 B" H- ^/ R- 一种是 gatekeeper。通过在 gatekeeper 上设置过滤条件,对一小批用户做测试。0 K3 f' r% w6 B! y$ d: T
- 另外一种是 AB 测试,切 10% 的用户尝试新功能,另外 10% 的用户最对照。+ W2 D: `& d- _- |! w
那工具为什么可以让大家变成对结果负责呢?原因叫做赋能。因为有能力,所以有担当。3 Q8 f* m) H7 j
* D- C' T6 S+ i+ W/ ?
除了靠各种 CI,Canary 工具以外, gatekeeper 和 AB testing 也可以让你小流量去实验,实验个 5000 用户,觉得没问题,再放大,用这样的工具去辅助这样的权力。
3 v3 h9 w* h/ R
. _3 ?3 T+ v& _总结来说,在互联网时代,为什么 Data driven 和 ownership 可以提供 10 倍的效能差别?因为在大目标对齐的情况下,各个小团队之间可以组成一个分布式的决策机制,大家可以跨职能的团队协作,去中心化进行决策,做到面对不确定性时的敏捷。
7 _2 v4 ~! ^. m- i+ y) ~
( j* q% K) s% ]3 Y
小红书的实践 ! [9 N" ?& v0 l4 q5 `
最后我们来看一下过去这两年,对于效率,我和我的团队一起在小红书的一些真实的实践。 v6 \8 I* H; Q! d1 o7 Y& L
小红书是一个生活方式平台,里面涉及到衣食住行,吃喝玩乐,并且可以完成从发现到决策到记录的全链路流程。
) r6 |+ g( _: K( g6 g
. c/ r! \; j8 Z我们是一个面向用户、有丰富数据的平台,这是我们产品上的天生优势。我们一天的用户阅读量有数十亿次,这种流量规模情况下,我们可以做非常多的 AB Testing,用 1% 的流量就可以做非常多的事情。
2 e7 D% A7 \) b+ b
' U5 E! T* A1 Y我们刚才讲的对于各种效率理念,在过去两年一步一步在小红书做落地实践。虽然有种种挑战,过去的两年里面我们还是摸索着落地了很多效率层面上的改进:6 z6 H' t% d) K. M& D4 K6 H7 C' F1 d
首先第一点:数据赋能。每个人都会玩的数据平台。我们自己做了一个前端,后面主要是 Hive,Presto,Spark 等等这样的数据计算平台。在这里用户可以套用模板写 query。在小红书团队中最引以为傲的一点是,几乎每个人都会写。然后通过一些工具可以把这些数据变成一个图,或者是变成一个每天监控的 dashboard,还可以变成 high level 的报警。
/ I8 |% f( T; Q1 ~; L# P
! n7 O: ~% Q2 N3 r
第二点,工程赋能。工程师有能力决定自己功能什么时候上,要什么时候上,或者要不要上。我们用了 Phabricator 做 Code Review,集成了后面 Jenkins 做 CI。所以工程师在这里边每天会看到说我现在有多少个 Diff 等着我去 Review,以及我的 diff 在被 review 的状态是什么样子。当有一个 reviewer 点击了 accept,就代表可以上线了,就触发了我们最终的 deploy 流程,就上到线上,这是对于工程权力的下放。
& L/ q4 S0 Q. o$ I" {5 a9 N
" {9 h( g$ m+ f第三点,实验赋能。我们现在线上 AB testing 平台一天有 300+ 个实验,也就是说我们每天在尝试的新功能有 300 多个。AB testing 就是应该犯错的,AB testing 就应该是 10% 的成功率才对,或者更低,代表实验的效率更高和跑得更快。
) d" r( e# Y2 [5 H3 J, ?( s
% w* m# A2 X. D9 @我们刚才讨论这些关于效率的话题,在小红书团队里面都有所实践并且一直在进步。我能看到工程师、产品经理、数据分析师在团队里面效能的变化,效率成倍的激变。' }8 e) z, U- w( x% c+ s, b
& h0 v3 v4 s% \- @8 O. h6 i我们大概在今年年初的时候,我们整个的用户突破了 1 亿,现在已经超过 1.5 亿。小红书所有核心指标都是一年 4 倍到 5 倍地指数级增长。+ a. W% u9 P1 J0 W% i4 m2 A
, H! T4 B a" E
我们就是一个从十来个人的团队到 100 多人的团队,QPS 从百到万到十万,去撑起了这么一个每年 5 倍左右的核心 metric 的变化。
0 p0 e7 f5 f9 F$ Z3 T" g
" l* o! [% ^' Y) {7 k: K* Q
那么从硅谷到中关村到底有多远呢?7 [: \7 w1 L# Z1 G) l M
: p0 }- @2 D1 s$ G% C在小红书,我们其实就是 为一线团队做两件事情,一个叫做放权,一个叫做赋能。4 Y+ x2 N2 b7 z8 k$ |% D# {+ R
放权的意思是通过 Data Driven 的方式给予决策权的分布式下放;赋能的意思是通过工具,无论是测试工具也好,CI 也好,实验平台也好等等这样的工具能让团队每个人有 ownership。最后,欢迎大家加入小红书团队,来一家高增长的公司高效率地做事情。' c2 ~ H/ q5 u3 d: P
本文彩蛋 硅谷一直以其“不断创新、鼓励冒险、包容失败、崇尚竞争、平等开放”的文化闻名于世。许多公司从一个灵感迸发的火苗,在这里长成参天大树。究竟硅谷公司里有哪些令人着迷的工程师文化,可以让人管中窥豹略见一斑呢?请在 InfoQ 后台回复关键词:硅谷,获取一篇以 Facebook 为例的项目开发流程和工程师的绩效管理机制文章。
4 N+ l7 h* V k4 V; f( D( H作者介绍
7 x5 x$ M9 O0 _" X7 E8 t! Q: o* U4 Y! ?" K& v% X7 b3 s
姚旭,小红书社区技术负责人,端到端地负责小红书的社区功能,包括大前端,搜索、推荐、基础架构和相关的机器学习系统。 加入小红书前,曾在 Airbnb、Facebook、知乎和百度等公司担任首席架构师和主任工程师职位。
4 A4 h$ R( r; \3 l6 a _' c& i D
可能是讲分布式系统最到位的一篇文章
8 ~. t$ j8 R' @/ D6 i$ ]! y' Z; A) O6 `3 i
高效的技术团队需要技术管理两手抓,你找到正确的上升途径了?关注新一届的 QCon 大会,100+ 技术大咖给你解答启发。5 b; n* E; M# d& `( V1 B
QCon 北京 2019 现已全新起航,除了一些常规的专题设置外,新增了用户增长、智慧零售等当下热点话题,在技术深度和广度上不断延展。目前大会 7 折报名中,立减 2640 元。识别二维码了解 QCon 十周年的精心策划。
8 J' m8 q4 K8 R/ o; ]% h8 H
- A( c3 v+ d3 q2 d! L `议题讲师持续邀约中,如果你有好的话题并乐于与他人分享,欢迎点击「 阅读原文 」提交议题。' `) \, `- _+ M+ v$ y
6 u' Y2 Z; w6 ?$ o8 e/ A5 x! `# d, z
6 j- v4 t {( y7 H2 T0 w
来源网址:http://www.yidianzixun.com/home?page=article&id=0KdET5Wf |
|