【考研日记】第123天——今日总结(2019年07月26日)-简书(考研日记500字)
今天上班,只背了一个小时单词。但关于人生未来规划方面的收获很大,经过一天的学习和思考,我终于彻底想清楚了,如何平衡风险大收益高的考研和风险小收益低的工作之间的取舍问题。
之前的我一直陷入了一个思维误区——即总觉得这是一个非此即彼的抉择,所以总是因为考研放弃了在单位的发展机会,另一方面又会因为上班而影响到考研的复习进度。到最后,两方面都没有显著的进展与收获,我却浪费了太多的时间在纠结苦恼中,致使工作后人生中最宝贵的五年时间,都在反复地做无用功!
今天突然想到了投资中的一个组合投资理论,该理论通俗地说就是——不要把所有鸡蛋都放在一个篮子里!关于这一点,吴军老师在他的得到专栏中介绍了一个 助我们在没找到确定答案前如何做决定的理论——“最大熵原理”,其含义如下:
“最大熵原理”这个词听起来有点唬人,但是它的原理并不难理解,我举两个例子你就明白了。
第一个例子是我在博士毕业找工作时,给别人做报告时举的。通常在美国,博士生要找一个研究型的职位,需要在应聘的研究机构做一个学术报告,展示自己的学术水平。
我做的研究就是最大熵模型的算法,这个算法背后是一大堆数学公式。如果直接推导数学公式,听众就走光了。因此为了给大家讲明白这个道理,我每次去做报告的时候,会随身带两个骰子。
在做报告时,我会先拿出第一个骰子掷一下,问听众五点那个面朝上的概率是多少?所有人都说是1/6,因为各个面朝上的概率是相等的。这种猜测当然是对的。
我随后又问听众们为什么猜1/6,而不是1/2或者1/10?大家都回答说,因为对这个骰子一无所知,只好假定它每一个面朝上的概率是均等的。
接下来我拿出另外一个被我做了手脚的骰子,我把几个角给磨圆了,然后给大家看,问大家五点朝上的概率是多少?这时没有人再猜1/6了,因为他们看到这个骰子并不均匀,他们有人猜是1/3,有人猜1/2,总之不再是1/6,说明大家在得到新的信息后,会自动考虑到“现在5点朝上的概率应该变化”这个事实。
当然,具体到那个骰子,5点朝上的概率大约是2/5,这是我经过实验验证过的,而在5点对面的2点,朝上的概率近乎是零。
于是,我又把这个事实告诉大家,接下来我再问听众,那么剩下的四个面朝上的概率分别是多少呢?大家通常会猜是3/20。因为认为除去五点和两点的概率总和2/5,剩下的3/5概率要由四个面均分,于是平均来讲就是3/20了。
为什么大家要平均分配剩下来的概率,而不会觉得1点朝上的概率比6点朝上的概率来得大呢?因为这样对大家来讲风险最小。
听我报告的人每次在作判断时,其实就是基于简单的算术加上直觉。而人作出这种基于直觉的预测,背后的依据是让风险最小,平均分配概率符合这一点要求。所幸的是,让风险最小的直觉碰巧符合了信息论中最大熵原理,因此它作出的判断是基本正确的。
接下来我们就说说最大熵原理,它的含义是这样的。当我们需要对一个随机事件的概率分布进行预测时,我们的预测应当满足全部已知的条件,而对未知的情况不要作任何主观假设。
我们在第一个骰子的问题上,得不到任何已知条件,因此我们不能有任何主观假设,猜每一个面朝上的概率是1/6就可以了。
但是,当我给大家看了做过手脚的骰子,大家就得到了部分信息,所以在第二次作预测时,大家首先要保证预测符合已知的信息,也就是说5点和它所对应的2点朝上的概率应该分别是2/5和0。
但是对于任何的未知,依然不能作任何主观的假设,于是大家在其他四个面朝上的概率上,均匀分配剩下的概率,猜3/20就可以了。
如果我们按照上述的方法,去建立一个概率的模型,可以证明这样的概率模型会使得熵,也就是不确定性
,达到最大值,因此这种模型被称为“最大熵模型”,而相应的,建立模型的原则就被称为最大熵原理。
最大熵原理也可以用老子的智慧从另一个角度诠释一下,那就是“过犹不及”。我们学了信息论,知道信息是用来消除信息熵,也就是不确定性的。
在上面的例子,大家在猜骰子哪面朝上时,已经利用了所有已知信息,将信息熵减少了,该确定的已经确定了,我们不可能进一步减少信息熵了。于是剩下的信息熵就达到了最大,这就是把信息使用地刚刚好。
如果我们自作主张地想进一步降低信息熵,作了很多主观的假设,作出来的预测反而不准确了,我们在前面学了,不准确的预测风险是极大的。因此这就是老子所说的“过犹不及”了。
那么这个最大熵模型在技术上有什么好处,或者相对其它技术有什么优势呢?
首先,它显然和我们所有已知的信息相符合,因为我们的模型就是用已知信息搭建起来的。
其次,这样的模型最光滑。光滑在数学上是一个什么概念?你可以理解为它不会遇到黑天鹅事件,方方面面都考虑得很周全。最大熵模型光滑的原因,在于我们对于未知的信息,没有作任何的主观猜测,就可以保证结果能覆盖所有的可能性,不会有所遗漏。
我们还是以那个做了手脚的骰子为例来说明。我们只知道两件事,五点朝上的概率大约是2/5,两点朝上的概率大约是零,对于另外四个面的概率不知道。
这时候你可以赌,比如赌三点朝上的概率为1/3,四点朝上的概率为零。你或许会赌对,又或许会赌错,但是长期看下来,这样赌的风险很大,因为不符合概率上的计算结果。
因此,我们可以认为,一个光滑的模型,可以让预测的风险最小。而最大熵原则恰好满足这一点。
我们在投资时常常说这样一句话,不要把所有的鸡蛋放在一个篮子里,其实就是最大熵原理的一个朴素的说法,因为当我们遇到不确定性时,就要保留各种可能性,而不要随便作主观的假设。
最后,如果你得到的信息是矛盾的怎么办?其实很多时候,我们之所以难以决策,就是因为它们相互矛盾,我们常常在“如果这样……”可是“又会那样……”的两难境地。
最大熵模型用数学推理的办法解决了整个问题,它无法同时满足两个矛盾的先决条件,会自动地在这两个条件中找到一个中间点,保证信息的损失最小。可以讲,最大熵模型在形式上是最漂亮、最完美的统计模型,在效果上也是最好、最安全的模型。
了解了最大熵模型的这么多好处,很多人会想,那我们就在各种场合使用它吧!
凡事有一利就有一弊,最大熵模型虽然有很多好处,但它最明显的弊端是计算量太大,直到21世纪之后,由于计算机速度的提升以及训练算法的改进,很多复杂的问题才开始采用最大熵模型来解决,比如自然语言处理。
这个问题一解决,就马上被用在了新技术上。当然,和钱紧密联系的行业总是喜欢最先采用新技术,因此美国的不少对冲基金,包括著名的文艺复兴技术公司,都是最大熵模型的最早使用者,它们也因此取得了很好的收益。
我在约翰·霍普金斯大学期间改进了这个模型的训练算法,然后写了一个简单的编程工具,后来有人把我论文中的算法做成了开源的代码,今天你如果需要使用这个模型,并不需要从头开始,只需要使用开源软件即可。
对大部分人而言,最大熵重要的是原理,而不是公式模型,毕竟模型使用的人会非常少。对于最大熵的原理,每一个人都应该记住以下三个结论:
1.如果你获得了全部的信息,事情就是确定的了,就不要用概率模型进行预测了。所以,最大熵模型的应用场景是你获得了一部分确信的信息,但是没有获得全部的时候。这时你要保证所建立的模型满足所有的经验,同时对不确定的因素有一个相对准确的估计。
2.在没有得到信息之前,不要作任何主观假设。这一点对投资非常重要。很多人觉得股市连续涨了半年就一定会下跌,或者下跌了半年就一定会涨,这些都是主观的假设。
我们在前面介绍投资时讲过,要想获得投资最大的收益,就需要将钱长期放在一个健康的股市中。事实上时机你是把握不住的,而时间是你的朋友。很多人对所谓时机的判断,都是主观的,其实是一种投机行为。
3.不要把鸡蛋放在一个篮子里,而要让凡事变得“平滑”,因为按照最大熵的原理,这样做风险最小。
此外,透过最大熵模型,我还想表述一个事实,那就是形式上简单的东西,获得它未必容易,在数学上漂亮,形式简单,但是实现起来反而难度很大。
我上节课讲到奥卡姆剃刀法则时说简单的方法常常最有效,可能会有人将简单和初级、低水平划等号。形式上简单的东西未必初级,相反,要把道理总结得简单易懂,自己需要有深刻的理解,在科学上,要得到形式简单的规律,反而要做更多的工作。
看完了吴军老师的讲解,我终于明白了自己之前的决定是多么的愚蠢,在没能确定哪条路更适合我之前,就把所有的时间和精力投资在一个方向上,就像罗胖老师在罗辑思维节目中提到的如何找到那个选择题的最佳方案一样:
假设你现在面对两个按钮:如果你按下第一个按钮,直接给你一百万美元;如果按下第二个按钮,你有一半的机会拿到一亿美元,当然还有一半机会就什么都没有。这两个按钮只能选一个,你选哪个?
我拿这道题在办公室里同事当中测试了一下,大部分人都选择直接拿一百万美元走人。因为这本来就是飞来横财,拿了入袋为安。而另一个选项一亿美元,万一按下去,什么都拿不到呢?我的小心脏啊,根本承受不了这个损失。这么选的人,风险偏好比较小。
当然,也有人选择按第二个按钮的,这种人风险偏好比较大。他们的理由也很简单,反正是飞来横财,那不如赌一把。那我就继续追问,你这么选的话,如果正好落在那不幸的50%上,什么都拿不到,你会特别懊悔和心疼吗?他们想想说,好像也有点,连一百万美元那只煮熟的鸭子也飞了啊。
那正确答案是什么呢?
当然是选有50%的机会拿到一亿美元。但是,我给出的理由不一样。
一个熟知现代社会规则的人,会这么处理。第二个按钮,如果按下去有50%的机会拿到一亿美元,那么按照概率,这个按钮的选择权价值就是5000万美元。我承受不了这个损失,那好,我把这价值5000万的机会卖给一个有能力去赌的人,比如说用2000万美元跟他成交。那对于买的人来说,用2000万美元买一个价值5000万美元的概率权,在账面上是非常划算的。而你现在有2000万美元了,是不是比选第一个100万美元强得多?
好,你可能会说,我找不到愿意赌那么大的人。那我们优化一下上面的方案,你找一个比你有钱的人,你说:“我把这个选择权卖给你,但是首付100万美元,如果你中了一个亿,我要求再分成一半,你觉得怎么样?”
对你来说,100万美元他作为首付给你,已经落袋为安了,剩下就让他去赌个运气,反正也比第一个选择强。而对买家来说呢,他是拿100万美元的成本去赌5000万美元的一半概率,这个买卖他也非常划算,他会干的。
接着往下想,这个方案还有没有更近一步优化的空间呢?
还有,当然那就更复杂了。比如,把这个选择权切碎了发行彩票,这样就更是稳赚不赔,当然这个普通人就干不了了,得有政府授权。
听到这里,你可能会觉得有点奇怪。开始的时候,我面对的选择,明明一个是确定的,一个是不确定的。可是这不确定的最后怎么就变得确定了呢?而且收益要高得多呢?
对啊,这个例子里面,藏了这个世界的一个绝大的秘密,就是穷人思维和富人思维的区别。请注意,我这里说的是穷人思维和富人思维,而不是指穷人和富人。
我们人生在世,时时刻刻都面对各种各样的选择。每一个选择背后,都有成和败的概率。
穷人思维,就倾向于拿到确定的东西,他不要概率权。而富人思维正好相反,每次选择的时候都愿意根据成功的概率来下注,不管每一次的成败、输赢,他一直都坚持这么下注。
请注意,珍视概率权,不是让你去赌,而是跳出自己的直觉本能,用概率的思维去思考自己的每一个选择。
如果概率权算得过账来,那就勇敢去下注,比如说用100万美元的价格去试试50%的机会拿到一亿美元的概率权。从直觉上来看,虽然有风险,但是在概率思维看来,这已经是划算得不能再划算的买卖了。
穷人不珍视概率权,不是不去赌,他们反而更容易去赌一些极小概率的事情。比如花钱买彩票,两块钱两块钱地买,想博一个发财梦。
但是明白彩票原理的人都知道,这成功的可能性几乎为零。而组织销售彩票的人,他是按照概率思维来设计这个机制和游戏的,他们反而是稳赚不赔的。所以你看,就彩票这件事来说,是穷人在补贴富人。
举个例子,你看富人是怎么想的。扎克伯格,facebook的老板,他当年刚创立facebook公司4个月,就有人出价1000万美元要收购他的公司,两年后,雅虎公司出价10亿美元收购。其间当然还有很多次机会,谷歌、新闻集团等等都曾经有过收购意向,每次出价对于当时的扎克伯格来说,都是一次大发横财,从此余生可以花天酒地的机会,但是每一次扎克伯格都拒绝了。
你是马上就拿到10个亿,还是以百分之几的可能性,也就是概率,在数年之后拿到1000个亿?这是一个选择,你看,扎克伯格面对的这个选择,跟我们今天刚开始举的那两个按钮的例子是不是很像?
几年之后,另一家创业公司snapchat用类似的方式拒绝了扎克伯格的30亿美元收购的邀请。
这就是硅谷的精神之一,它可不仅仅是发财梦,它是一种财富观,是一种雄心壮志,是一种对概率权的把握。
我创业几年,说实话刚开始也是不太理解那些风险投资人的逻辑。一个创业项目,看起来不是很靠谱,没有任何确定性,投资人居然就敢成百万、上千万、上亿的钱白给创业者花,而且还只占很少的股份。按照直觉思维来看,这些投资人不是疯了吗?
但其实,这是因为人家风险投资人看世界,和我们普通人的角度不一样。
他们是看概率权的。
一个创业公司,刚开始可能都没有盈利,但是投资人已经把这个行业的前途,这个创业者、创业团队的素质和未来的市场风险等等都用概率思维给算过了,给出了一个估值。这个估值虽然是纸面财富,但是它包含了一系列概率的算计,它是真实的市场定价。风险投资人他就这么一直下注,一直下注,下了很多次之后,只要有一次大赚,就全部回来了。
所以,风险投资不是外面看起来的那样,是赌博,是猜钢镚,它是有一个精密算法的财富游戏。
那怎么摆脱穷人思维,把握概率权呢?
我刚才提到的那篇文章中就说到,我们普通人最最缺乏的,其实不是钱,而是有一个老爸随时随地告诉我,你很牛。
那为什么书香门第或者财富世家会出一大串的牛人,除了基因、资源这方面的原因,可能还有以下几个原因:
第一,你从小就有足够高的参照点,不会被小利益勾走,更能承受风险(其实是低概率的),从而捕获高回报。就像最开始的例子,如果你家里已经有了1000万美元,你对那白来的100万美元就没有那么饥渴,你受到的诱惑就没有那么大;
第二,身边一群人的示范效应,你老爸、叔叔、伯伯会不断告诉你要往前看,你行的,你是很牛的,你的出息绝不仅仅是现在这些;
第三,在这样的环境里长大,你内心的理想、激情有更大的机会被点燃。
可惜,我们绝大多数人不会出生在书香门第或者是财富世家,那怎么办?
对,这就是这个世界留给每一个人的一道后门。你可以通过学习,通过认知升级,通过改变自己的大脑,通过克服自己与生俱来的本能,认识概率权,掌握概率权。
要知道,这是我们脑子里发生的事情,虽然它千难万难,但是毕竟我们不需要任何额外的资源,没有任何人能够阻止它发生。
所以我不应该贸然的选择其中的一条路,然后一根筋地往前走,直到撞到南墙后才回头。而应该多条路同时进行,然后直到得到了更加确切的信息,明白往哪条路走收益更大,再做出下一步的决定!
而在没有更多的信息之前,我应该少进行主观判断,避免“过犹不及”,失去了另一条路上的机会!
下面分享下我的今日收获吧:
1.吴军老师的投资智慧:
我们假定一期基金有1亿美元可以用来进行风险投资,怎样投资效果最好?我们列出三个做法:
平均地投入到100个初创公司。
利用我们的眼光投入到一家最可能的公司中。
利用哈夫曼编码原理投资。
我们还假设如果投资的公司最后能上市,将获得50倍的回报;如果上不了市,只是在下一轮融资被收购,将获得3~5倍的回报。在硅谷地区,获得投资的公司最终能上市的概率大约是1%,大家不要觉得这个比例低,它已经比世界其他地区,包括美国硅谷以外的地区和中国,高很多了。至于被收购的概率,在硅谷地区大约是20%,比中国要高很多。
如果使用第一种方法,基本上是拿到一个市场的平均回报,也就是一轮基金下来大约是31%到71%的回报,如果扣除管理费和基金本身拿走的分红,出资人大约能得到20%~50%左右的回报。通常一期风险投资基金投资的时间是2~5年(持续的时间可以长达7~10年),这样年化回报大约是5%~20%之间。
这是硅谷风险投资的平均水平,大家不要觉得风险投资一定能挣钱,在中国,大部分风险投资基金是赔钱的,而在硅谷赔钱的基金的比例也高达40%。
第二种方法,只投一家,这其实是赌博,如果碰上这家公司上市,有50倍的回报,碰上被收购的有2~5倍的回报,但是绝大多数情况则血本无归。
如果所有的基金都玩这样的赌博,虽然平均回报率和第一种情况相似,但是投资风险高达500%。根据投资领域普遍采用的夏普比率(请回到《硅谷来信》查看第145—148封信)来衡量,这是极为糟糕的投资方式。
第三种方法是按照哈夫曼编码的原理,可以先把钱分成几部分逐步投入下去,每一次投资的公司呈指数减少,而金额倍增。具体操作方法如下:
第一轮,选择100家公司,每家投入25万美元,这样用掉2500万美元。
第二轮,假定有1/3的公司即33家表现较好,每家再投入75万美元左右,也用掉2500万美元。至于剩下了的2/3已经死掉或者不死不活的公司,千万不要救它们,更不要觉得便宜去抄底。
第三轮,假定1/10的公司,即10家表现较好,每家投入250万美元,再用掉2500万美元。
第四轮,假定3%的公司,即3家表现较好,每家投入800万美元左右,用掉最后的2500万美元。
这样通常不会错失上市的那一家,而且还能投中很多被收购的企业。由于大部分资金集中到了最后能够被收购和上市的企业中,占股份的比例较高,这种投资的回报要远远高于前两种,大家可以估算一下,大约有3~10倍的回报。
当然,这还达不到凯鹏华盈40倍的回报,但是已经非常好了。你也可以认为,一个系统的方法和坚守纪律能够带来3~10倍的回报,而对于凯鹏华盈来讲,投资人的经验和人脉,带来的是剩下的那几倍回报。
当然大部分人不会去参与风险投资,但是这种分配资源的原则在哪儿都适用。我在之前《google方法论》中介绍google和facebook等公司的管理方法时讲到,它们内部其实是一个大风投,各个项目一开始都有获得资源(主要是人力和财力)的可能性。
但是很快,通常是三个月到半年,类似的项目就要开始整合,资源开始集中到更有希望的项目上去。最后能够变成产品上市的,是少数项目,但是大量的资源投入在其中了。这样既不会失去新的机会,也不会浪费资源。
今天的华为养了一个拥有几万人的庞大的预研部门,很多人觉得这是有了钱之后嘚瑟浪费,但是你可以把它看成是一个内部的大风投,每一个前期研究,都得到一定的发展机会,而投入的资源并不需要太多,最后能够进入到获得巨大资源攻坚阶段的项目,终究是少数。
这个道理对个人来讲也是适用的。美国有名的私立学校哈克学校的前校长尼克诺夫博士讲,在孩子小时候,要让他们尝试各种兴趣爱好,但是最终他们要在一个点上实现突破,他将这比做用圆规画圆,一方面有一个扎得很深的中心,另一方面有足够广的很浅的覆盖面。
2.人生中最难的莫过于做选择,而选择中最难的莫过于不确定。如果你在无法判定选择的利弊时,则最好不要抱有赌一把的心态!因为赌对了虽然可以让你实现梦想,但万一赌错了也会让你陷入万劫不复之地。希望今天的分享能给大家一些新的启发,让你在今后的人生中,面对无法判断的选择时,能多一分淡定与从容,少一分忧愁与苦恼!
3.今天给大家分享的是范仲淹的《苏幕遮(碧云天,黄叶地)》:
碧云天,黄叶地,秋色连波,波上寒烟翠。山映斜阳天接水,芳草无情,更在斜阳外。
黯乡魂,追旅思。夜夜除非,好梦留人睡。明月楼高休独倚,酒入愁肠,化作相思泪。
以上就是本次分享的全部内容,非常感谢你的认真阅读,期待我们下次分享时再见!
发表评论