FanPost

汇票订单重要吗?(如果是,怎么做?)

在最近关于选秀的争论中,波特兰仍然是一个未完成的项目,让我们花点时间在选秀顺序的背景下重新审视一下选秀策略。球员的选秀位置如何预测他们最终的表现?一个乐透新秀(1-14)和一个稍晚的第一轮新秀(16-30)和第二轮新秀(31-60)有多大关系?最重要的是,这些问题的答案应该如何影响团队的策略(如果有的话)?

为了找到答案,我收集了来自BasketballReference.com的数据,并启动了Stata、Excel和Tableau。下面你会发现一些关键的发现和一个可视化的图表来帮助说明我的观点。但是,不要让我的中等水平的数据科学技能也阻止你猜测——你的想法是什么?这有什么关系?这将如何影响球队选择下一个爵士/斯蒂芬/勒布朗/杜兰特/PG13/比尔德/德雷蒙德/布罗迪/约基奇/伦纳德?

*注:关于方法的注释,包括我为什么选择“赢-分享”作为关键指标的解释

发现

零碎的

  • 在历史上,偶数排名的前10位新秀的平均胜率都低于奇数排名的对手。第1、3、5、7号选秀选手的总胜率最高(按此顺序排列),其次是第4、6、2、8号选秀选手(按5-8顺序排列)。是的,你没看错——第二顺位的表现已经被第三、第五、第七和第四顺位的表现超过了。
  • 只有3个第二轮选秀的平均胜率超过2。其中包括(可以预见的)第31顺位和第34顺位,然后(奇怪的是)第38顺位。

专业的见解

总的来说,分析表明(确实如此!)就赢分而言,更高的选秀权往往会在他们的职业生涯中表现得更好——但并不总是以我们预期的方式。在选了11个左右之后,相关性的大小就会下降,这使得20多岁的中奖彩票在某种程度上成为一个不确定的区域。事实上,我的分析指出,与专家们讨论的典型范围(如抽签、第一轮、第二轮等)相比,有5个区间似乎与未来表现更密切相关。这些范围包括-

  • §精英(1-7名;中位数win-share: 21.4;平均胜利份额:35.3):在过去20年的NBA选秀中,排名前7的球员在总胜利份额中占了很大比例。这并不奇怪——顶级球员往往是顶级球员。
  • §次级精英(8-10人;中位数win-share: 13.85;平均获胜份额:24.1):老实说,次精英可能被归入“精英”行列。但我选择将其分开,因为在选7之后,有一个微妙但独特的下降,持续了3次(见下图)。很多伟大的球员都来自这个波段,但在此之前的挑选似乎产生了更高的平均赢分。
  • §不确定区域#1(选择11-27;中位数win-share: 8.3;平均胜率:15.6):在选11后,NBA球探预测伟大的能力急剧下降。相应地,十几岁和二十几岁的玩家的最终输出呈现出大量的变化。我将这个范围称为第一个“不确定区域”,因为它(a)包括了在这个范围内职业表现与选秀位置只有轻微关联的球员,(b)因此,球队似乎更有可能在12号选秀中选择一个赢家,而在22号选秀中选择一个赢家。
  • 不确定区域#2(选择28-38;中位数win-share: 1.85;平均获胜份额:9.9):第二个不确定区域的逻辑与第一个相似。在这个区间内,这些顺位的NBA表现与顺序的相关性很小。不可否认的是,这个范围的界限比它的前身更不完美,因为Pick 38的异常值显著地提升了范围的后端。排在38位的新兵和排在28位(!)的新兵的win -share几乎是一样的,两者之间有很大的差异。
  • 第二轮的最后阶段(选择39-60;中位数win-share: 0.3;平均胜率:6.7):可以预见的是,在NBA,第二轮中后期的球员往往很少产生胜率,如果有的话。这些球员中的很多人——坦白地说,他们仍然是令人难以置信的运动员——最终在g联盟或海外打球,因此从来没有见过足够的NBA比赛时间来积累数据。

在我看来,这两个不确定的区域代表了团队在制定选秀策略时最相关的发现。让我们以2017年为例,看看它的应用可能会如何。截止到2020年8月,2017年6月10 - 23岁之间的球员在效力数据方面是无处不在的。是的,所有这些球员仍然相对年轻,但仍然,你可以预料到一些与统计输出相关联的高草稿订单趋势。当你在多诺万·米切尔(13名)、巴姆·阿德巴约(14名)和约翰·柯林斯(19名)之前选秀时,扎克·柯林斯(10名)、马利克·蒙克(11名)和卢克·肯纳德(12名)就没那么多了。此外,我还会提名贾勒特·艾伦(22岁)、OG Anunoby(23岁)和凯尔·库兹马(27岁)。

尽管2017年的结果可能看起来有些微妙,但对所有20年数据的分析表明,它更具有典型性。(另一个不确定的例子——2014年的选秀中,有15岁的阿德里安·佩恩,17岁的詹姆斯·杨,18岁的泰勒·恩尼斯,还有19岁的加里·哈里斯,23岁的罗德尼·胡德和25岁的克林特·卡佩拉。前3名选手的赢分结合甚至不要接近最后3名玩家的总胜利份额单独)。

那么,这对球队未来的选秀意味着什么呢?一个重要的教训是,如果你的选择落在不确定的区域(区域1:选择11-27;区域2:顺位28-38),这是最好的掷更多的骰子比同一区域的单卷高。这是对那些关注“这个家伙”的球队的警告,他们愿意用很多次选秀来接近他。在这种情况下,如果你为了一个第一轮选秀而向另一个团队发送多个第一轮选秀权,我建议你花点时间看看历史数据。除非你是为了进入最顶端的彩票(最理想的是选1-7),否则你最好还是坚持你在十几岁和二十几岁时得到的选择。这样做可以最大限度地增加你的选秀者成为你想要的球员的可能性。简单地说,选秀既可以是一个战略谜题,也可以是一个概率游戏。尽你所能多打几手牌。

在那之后,联盟在前十名之外挑选赢家的能力就变得相当不稳定了。尽管花费了大量的时间、精力和资源去发掘、评估和预测年轻球员的长期能力,球队还是会错误地判断那些不是蓝筹股的新秀的潜力。因此,对于那些有多个选秀权的总经理和球探来说,他们可能会对一个球员很有信心,并且愿意用多个选秀权去换一个更好的球员,我的建议是,除非你能跳到另一个区间(见下文),否则就按你得到的去做吧。历史似乎表明,你可能会说服自己对球员的未来更加确定。

按命令草案划分的总赢份额中位数(2000-2020年)

快速的方法分

-对于这一项,我通常倾向于用中位数来衡量中心,尽管我也研究了平均值。从NBA历史的角度来看,二十年似乎是一生,但从统计学的角度来看,它的结果是一个略显逊色的数据集。这意味着异常值——天知道,NBA就有这样的异常值(安东尼·班纳特、德拉蒙德、马克·加索尔)——最终会对比赛结果产生戏剧性的影响。中位数虽然不完美,但可以解释这一点。

我选择关注“赢分”,而不是VORP、Box Plus-Minus、玩家效率评级和每场比赛得分,这些是衡量玩家成功的最常用的指标。为什么,你问?在我看来,这主要是因为,伟大取决于成为一个赢家。如果你不能帮助你的球队在职业生涯中持续赢得比赛,那就不得不问了——你到底有多优秀?

-你说为什么要关注过去的20年?诚实的答案是,通过从互联网复制/粘贴来聚合数据需要很长时间。但这也有一个实质性的原因。勒布朗和他那一代的伟大球员都是在2000年代初被选中的,所以从2000年开始,由于后卫的历史性变化,他们的防守是可防的。但是,如果你有一个空闲的周六,并且想要把所有的时间都追溯到球员们穿着戴西·杜克斯(Daisy Dukes)球衣的时代,比尔·拉塞尔(Bill Russell)在一个休闲活动中打出了三双,而三分线在某些高管眼中只是一闪而过,那就请自便吧。