存书签 书架管理 返回目录

“国科杯”的比赛是开放赛制,似乎是政府科技发展相关机关联合几大高新技术企业一起出的赛题。虽采用的是开放式赛制,赛题却十分传统。

“城市交通拥堵问题因素分析,”赛题十分实用,所有参赛队伍就会根据主办方给定的数据自行数据清洗和分类,并且最终能绘制出相关模型,找出影响一个城市交通拥堵的主因素和次因素,并根据数据结果提出相应对策。

很明显,这是一道商业应用赛题,可能也是主办方的几家相关企业在开发产品的过程中需要解决的。如果后面参赛选手能够提交非常精确的分析结果以及合理的方案,那么这个比赛对于解决实际问题还是非常有意义的。

比赛分为预选赛和决赛两个赛段,分别为期1周和2周。在预选赛参赛阶段,参赛队伍需在规定时间内完成数据处理和分类,并找到主因素,建立合适的模型,这个赛段会淘汰掉数据不合格,主因素不对,模型不合适的队伍。

决赛阶段会给参赛团队提供更多时间完善模型、完善相关因素分析,直到找到所有的影响因子并且根据主次提供相关方案。

“数据量非常大而且杂,前期的数据处理工作会有一些困难,费时间,”陆婉下载完数据包以后,在群里做了一个初步判断。

“没关系,就这个赛题而言,前期的数据处理工作倒是最关键的,我们4个人一起把这个阶段工作做好。”吴拜很有信心地给大家提供了方案。

“数据虽然杂,但是主办方已经做好了标记,我们先来把数据查漏补缺做分类吧。”吴胜提议到,认真的时候,吴胜也像那么回事。

林芮和陆婉需要先把数据过了一遍,查漏补缺,紧接着交给吴胜做分类和验证。

虽然已经知道这次的数据包量非常大,打开陆婉发给自己的数据包时,林芮还是比较惊讶,对于一个数据圈入门没多久的新人,这个任务难度确实有些大,然而,对于林芮难说,越是艰难的任务,她便越是想好好挑战。

“你没问题的,我相信你,林芮,”陆婉在微信给林芮打气。

“嗯,我保证努力完成任务,谢谢你的鼓励。”有陆婉的信任和鼓励,林芮没有太多畏难和犹豫,低头投入了茫茫的数据之海中。

其实有了林芮第一轮的清洗,数据已经很干净了,只是关系到后面模型分析结果的准确性,林芮需要再仔细检查有没有错误的数据需要修正或者剔除,有没有缺失的字段等等。

一直到第二天中午,林芮熬了一个通宵,中间饭了忘了吃,水也没沾一滴,等检查完最一串数据,林芮又重新从头到尾翻了一遍,这才谨慎地把数据包传给了吴胜。

“辛苦了,菜鸟,”微信另一头,吴胜又嘻嘻哈哈地调侃了下林芮。“没想到你这速度还可以啊,我以为起码还得一天才轮得到我接手呢。”

“哈哈,会有那么一天,你不会再叫我菜鸟的,”林芮不服气地打了个哈哈。

“嗯,孺子可教,”吴胜欠揍的继续调侃,“现在从态度上看,确实不太像菜鸟。”

“......”要是知道吴胜住哪,林芮真想爬着网线过去把他狠狠揍一顿。

吴拜在群里告诉大家作品已经提交的时候是在预选赛截止的前一天,大家稍稍把心都放了放。

等到预算赛结果出来那天,几个人的系统消息提示都是“您队伍的赛题方案已已经通过预选!”大家才彻底放下来心来。林芮跑去官网翻了翻数据,通过预选的队伍只有600支,记得上次看到的报名数据是8000多支队伍啊。看来这次比赛的难度确实要比上次高。

而接下来决赛阶段的工作十分关键。

吴拜提交的模型还比较简单,因为数据种类非常多,需要验证每个类别的数据和模型之间的关系,直到模型能够把所有数据类型和自变量关系都能容纳进来。

群里还有大神担心有些数据样本量不够,无法做准确验证,试图引进外部数据,然而主办方却没有应允。

这样,把量少的数据通过模型建立函数关系,并把其纳入模型难度就非常大了。

可是,再难,大家都得应着头皮上。

吴拜建议队伍每个人都用数据放到模型里一一验证,有问题和建议给吴拜反馈。

林芮接到这个任务,头皮有些发硬,这个确实不是自己擅长的,但终究可以锻炼学习不是?

整整一周,林芮边跟着陆婉的指导自己学着验证,边在搜索引擎上恶补建模,7天之后,林芮把自己的成果反馈给吴拜,虽然大脑已经一片空白,事后却觉得颇有收获。

后面的工作都交给吴拜了。偶尔,陆婉会在群里@吴拜需不需要帮忙,或者问候关心,吴拜都没有回复。

等到“国科杯”决赛作品截止当天,吴拜在群里发了一条消息:“决赛作品提交成功,下面就听天命了。”

陆婉一句辛苦了,大家纷纷跟风复制粘贴向队长表达关心。

提交完作品,大家便都真正放了心。

林芮又开始改起自己的简历,搜索自己心仪公司新出来的岗位。自从上次面试失败,林芮再没有投递过简历了。现在林芮准备瞄准她想去的



本章未完,点击下一页继续阅读
上一章 目录 下一页