5月10日晚,我校“产业之光”系列讲座之《大数据的发展及未来》在张江校区举行,讲座嘉宾是中国最早从事数据挖掘的华院数据技术(上海)有限公司首席运营官麦星先生。教室座无虚席,前来聆听的本科生、研究生都期望与行业内的专家进行交流,跟上信息时代的步伐。
首先,麦先生引出了第一个概念:数据挖掘。何为数据挖掘?正如其英文data mining的释义,数据挖掘可以理解为数据“采矿”,也就是在海量信息中发现有价值的数据。在没有进行“挖掘”的时候,原始的“脏”数据就像一个黑箱,里面只有堆积如山的信息,看不出价值,不仅如此,其存储也极其消耗物资成本,但是进行数据挖掘后,就可以把无用信息筛除,保留有效信息。他举了一个例子,问大家如果要定位描述200个人,需要什么变量。同学们提出很多思路,当说到三维位置的时候,麦先生引入了一个新的应用情景:现在的一些航空公司已经可以做到座位号与姓名相互联系,这样的联系除了可以“对号入座”,还可以形成“精准服务”的商业模式,即使航空公司获得的客户信息少之又少,但在大数据的技术支持下,航空公司仍可以通过采集信息,来进行模型运算、评估,推送针对客户的“个性化”广告产品等。
华院数据作为中国最早从事大数据分析挖掘的企业,2014年开始大规模深度孵化垂直行业和领域的大数据公司,其子公司涉及到了多个方面。麦老师给我们着重讲了P2P平台下如何用大数据的技术支持来降低贷款风险。P2P贷款作为一种新型的贷款方式,与传统信贷有很大不同,其中最显著的就是没有像传统信贷一样采集客户的背景信息、资产信息等,有时候仅知道客户姓名、手机号码等极其有限的信息就可以与客户交易,其承担的风险也是不言而喻的。这时候就需要大数据来做背后的技术支持,通过建立线性方程,深度挖掘各种价值信息,进行建模评分,给出客户的信誉评估,使P2P贷款公司有了相关的评判标准。
具体到大数据这项技术本身,麦老师认为,所谓“大”就是有海量的信息来源,原来不能直接作为数据的图像、音频现在也可以被识别,并且可以更高速的计算。随着存储能力的提高,计算成本的降低,大数据的处理也日益灵活。
在问答环节,麦老师与同学们热情交流,探讨了“魏则西事件”、政府控制与个人隐私该如何权衡等时下热点问题,结合自身经历,发表了一些对大数据瓶颈、未来的发展方向及就业前景等问题的看法。整场讲座中同学们都积极参与,了解专业知识在产业中的应用,为将来在信息产业一展身手做好准备。