寿险数据分析：保险预测模型之经验教训

作者:白玉杰

        数据分析预测是现代管理与决策的基础，在金融行业广泛利用。保险公司与保险服务行业近些年都在尝试通过对各险种数据分析，用于增加对客户的了解并提高公司未来收益。本文介绍了寿险行业在建模预测方面的一些经验教训。本文英文原文选自瑞再网站，英文标题为“Data Analytics in life insurance: lessons from predictiveunderwriting”，作者是William Trump。

        大型企业都在思考能利用大数据做些什么。瑞士再保险公司在过去12年里运行了寿险数据分析项目。回顾这段经历，WilliamTrump分享了该公司在数据处理与预测建模方面的5条经验教训。

        2012年，瑞士再保险公司建构了第一个寿险预测模型。采用统计技术分析过去的数据--银行与寿险数据，用于获取新的健康预测因素。接着，获得的预测因素被用于预选一组消费者，提供最低保费的寿险。

        瑞士再保险公司认为，应该以更明智的方式使用数据来改善客户体验，于是便开始使用预测技术。我们从数据丰富的机构开始，在获得保险数据后发现了突破。我们一直在模拟银行与大的保险公司利用数据在做什么。这些公司利用对客户的了解（比如过去的购买数据）来获得有竞争力的优势，比如通过预先批准客户的定制产品，或者在不同时期为客户提供特定的信息。

        瑞士再保险公司最近开发了第14个保险预测模型，其中大多数模型是在过去五年中构建，主要针对银行保险业。同其他开拓性工作一样，一路走来学习了很多经验教训。因此建模过程也发生了相应变化。我们在建模中制定的五个大的方针，希望可以同大家分享。

         1.从一开始头脑中就要有目标

         这听上去显而易见，但也有这方面的反例。比如，有些金融服务领域内外从业者利用大数据时头脑中就没有明确的商业目标。我们先问个问题：您要达到的目的是什么？

        人寿保险公司试图利用大数据实现的目标众多，包括：减少健康客户购买保险的核保程序；提高自留额；提高对营销活动的响应；对不同客户群实行差异价格。明确的目标对于获取必要的数据以及采取适宜的分析方法至关重要。

        2. 客观看待限制条件

        有些对于利用大数据能达到的目标的设想不切实际。相反，数据的有效性频繁受到限制。瑞士再保险公司总是发现，最强大的健康预测模型从一开始就是在定制的基础上构建的。这从定义上意味着过去的数据数量质量都要充分，但这样的数据往往又难以获取。

        银行保险投入大量资金将数据变成财产。因此，银行保险到现在已经在利用数据方面占据了最为有利的地位。这也是瑞士再保险公司到目前为止做的工作最多的领域。银行过去大量的数据(包括保险决策与索赔)意味着在同银行数据作比较时，将我们的统计技术应用到匿名数据文件时能获取独特的见解。

        很明显的是，我们已经注意到我们客户以及银行手中数据在数量与质量方面存在的巨大差异。

        3.数据不完善不是借口

        数据不充分或数据质量不佳总是被当作不作为的借口。这本身就是个错误，正如Eric Siegler 在其预测分析学一书中所说：“只有极少数预测能走的远”。即使是数据相对不足的保险公司也可以并且应该利用数据改善保险流程。我们建议探索利用可获得的数据能做些什么，而不是不能做什么。

        五年前，寿险公司就开始自问是否应该进行该类型的分析工作，但现在他们开始自问应该如何进行数据分析。这是个不错的进步。
寿险公司频繁地询问不同类型的数据源，怎样利用这些数据源来预测健康、购买或放弃行为。以下是我们到目前为止得出的：

• 代理/经纪机构数据：只有所有经纪机构手里的数据一致的话，才适合预测建模，但通常他们手里的数据不一致。即使一致，仍有数据深度方面的问题，即，关于每个客户的信息有多少。
• 一般保险数据：适合风险、采购与放弃行为预测分析；但我们发现该类数据通常很浅，每个客户一致地掌握了少数变量，总计15-20个。因而，以这种方法建构的预测模型的可用性，我们应客观看待。
• 第三方数据源：该类数据具有很好的广度（覆盖大多数成年人口）与深度（多个数据域），因此在市场上具有很强的预测功能。该类数据在美国与英国得到了最好的证明。
• 会员卡/超市数据：通常同银行数据一样功能强大，如果不比银行数据更强大的话。这方面的挑战正在说服数据提供者提取/分享他们的数据。

        4 .数据不是万能的

        从事预测分析的大多数人都面临这样的风险，那就是可能认为适当的数据能得出完善的预测结果。然而，很不幸的是，事实从来不是这样。从一开始，模型就有错误（比如，放弃投保倾向较低的客户取消了保单）。另外，我们发现通常不是我们期望客户怎么样，客户就怎么样的。

        寿险保险公司必须制定适合他们数据的模型。利用过去代理面对面销售产品的数据不能准确地预测客户对新的在线产品的响应。

         分析学能帮助改善这一过程，但实用的销售方法与信息仍然很重要。只有当我们采用了良好的分析方法，再加上强有力的销售流程（或自留额），才能期望得到最好的结果。

       来自行为经济学领域的不断增加的证据为我们提供了一个有利的提醒，我们并不像我们认为或宣称的那样完全理性。考虑到这一点，瑞士再保险公司以测试学习的态度看待我们的数据建模。只有这样我们才能确定客户行为背后的真实动力。

        5.大数据- 空谈的多，行动的少

        从原则上来讲，所有寿险公司现在都已经有了大数据的理念。但在实际中，整个寿险行业在利用获得的数据进行分析方面仍然行动迟缓。

        我们的研究证明，将寿险数据与其他可描述性数据（比如，银行、一般保险数据）进行比对能获得很多结果，以便于预测健康、购买或放弃投保行为。一些寿险保险公司已经带头开始了该项工作。我们希望更多的寿险公司能紧随其后。

       上述内容仅仅是我们目前为止得到的一些经验教训，并不是任何意义上的最终结论。数据建模与保险预测是一个持续的学习过程，我们一直在同我们的客户协作以实现功效最大化。

References
参考著作：
1. Siegel, E.(2013) Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, orDie. Hoboken, New Jersey: Wiley

（编译：张中良）

【英文原文】
http://cgd.swissre.com/global_dialogue/topics/Healthcare_revolution/better_predictions_result_in_better_decisions.html

（以上内容英文原文及图片均来自互联网，不代表“保险资讯”及中国保险学会的观点和立场）