2019数学竞赛几何?
我参加的是2019年美赛,报名的是H题(数据可视化),最后题目出来的样子是这样的: 数据集是关于美国17个州以及华盛顿特区的汽车注册数据,一共186253行,每行一个州的数据,包括44个字段描述每个州的特征。字段有日期和时间字段,还有整数、浮点数、字符串等类型的字段,还有一整个字段是关于每个州的车牌号是否合法的字段。所有字段都有详细的说明。 题目要求是对给定的数据建立合适的模型进行预测,然后对预测的结果进行可视化展示。
我的思路是先提取特征再建模,特征的提取我做了主成分分析,因为PCA本身可以解决多变量问题并且可以降维,这样方便后面的建模,并且PCA的特征提取是不需要参数调整的。建模仿真我用的R语言里的包,可自动调整模型参数(优化方法),这个包在优化函数的时候采用了不同的策略以适应不同的问题,我试了三种策略,最后得出最佳的模型。
最终结果和解释性图形见下图 可视化图形是我自己用Python做的,就是直接用numpy的matplotlib接口画图,虽然简单但效果不错。 最后成绩出来之后我是第七名(共30分),这个成绩对于美赛这种5人一队的比赛来说已经很不错了。