大数据能预测彩票么?
大数据的核心是预测,这个预测能力是建立在海量数据和相关性分析之上的。如果想用大数据来预测彩票,首先遇到的问题是数据量不够。像大家常用36选7、大乐透或者双色球这样的彩票,每次开奖的“大数据”只有7个数字(大乐透是6+1),这么少的数据,即使积累上百万个期数,相对于大数据而言,其数量还是不够的(大数据的语境下,“百”“千”的量级与“万”“亿”的数量级是不能相提并论的)。而如果想通过周边的数据来辅助预测,则必须证明周边数据与开奖号码存在强相关关系,这也是个难点。综上,用大数据预测彩票是不可行的。
然而不可行并不代表不可能。如果将预测彩票的结果转换成预测彩票的结果是否为中奖,而如果购买者在预测之前有足够的“大数据”,例如自己的中奖历史,则这种预测彩票是有可能实现的。
如果某个人在预测之前有100个数据,每个数据都标记了某一次购买彩票的中奖情况(是否中奖),则可以进行模型训练。需要说明的是,如果使用逻辑回归模型,需要更多的特征作为输入(例如购买的时间、地点、天气等等),并且训练样本足够多的情况下,则可以进行是否中奖这个二元问题的回归。当然,随着样本量的增加和特征的扩充,模型的复杂程将越来越高,其性能将越来越大(前提是模型能拟合数据,即不是欠拟合和过度拟合)。