大数据背景下的数据处理及人工神经网络
1.正式科研:1v1线上定制指导
2.项目收获:科研报告、导师推荐信
3.科研补充包:48课时科研基础课+15课时学术写作基础课
涉及领域
本课题涉及到矩阵分析、图论、大数据、自然语言处理、人工神经网络、人脸识别等方面的知识,适合申请数学、计算机等相关专业的学生。
适合人群
(1)有意提高自身知识水平及学术能力的学生;
(2)有意掌握前沿科研热点及科研方法的学生;
(3)有留学意向、跨专业深造的学生。
研究前沿性
随着信息技术的不断发展,各行各业的量化研究中都衍生出大量的样本数据。在这样的大数据背景下,如何充分挖掘数据中包含的有价值信息,针对特定的研究课题,建立科学的研究模型,使用统计学理论将数据中隐含的价值提炼出来服务于现实问题,便是面临的一大挑战。本课题基于若干重要的现实问题,建立成熟的数学模型,并分析如何从大量样本数据中提取服务于模型的重要参数,借此帮助学员对现代数据处理技术建立起初步认知,掌握一定的数据处理技能及现实问题的分析能力,对数据科学领域有更深入的理解。
研究介绍
本课题结合当前的大数据背景,从使用统计方法处理自然语言出发,介绍机器智能的基本架构与现阶段的发展概况,并简析若干科技领域中出现的基本数据处理模型,其中包括语音助手、机器翻译、搜索引擎、Google的核心PageRank技术及人工神经网络等,最终通过人脸识别技术的原理分析展现神经网络这一工具的强大之处,并回顾现代数据处理技术的演变过程。
课题要点
课题研究方法
文献综述、模型解读、统计分析。
课题难点
对于大数据背景有一定的理解,具备基本的统计分析能力。
1v1定制化辅导参考任务
任务一:大数据背景介绍
阅读相关文献,了解大数据背景的相关信息及自然语言处理的含义,理解“从规则到统计”这一数据处理模式的转变,并简析机器智能的基本背景;
任务二:介绍若干基于统计背景的数据处理模型
理解统计语言模型是自然语言处理的基础,掌握用数学方法描述自然语言的一些方式。
简析隐含马尔科夫模型,理解其在通信领域的作用;
任务三:介绍搜索引擎的原理
简析布尔代数,其在逻辑学与数学间构建了一座桥梁,并开创了数字化时代;
简析图论与网络爬虫,理解互联网搜索引擎的基本工作原理。
任务四:介绍以PageRank为首的若干Google技术
介绍Google的民主表决式网页排名技术PageRank,理解其背后的图论及矩阵理论背景;
介绍Google大脑的相关信息,并由此引申出人工神经网络的基本概念及原理,理解统计分析在其中起的重要作用。
任务五:介绍人工神经网络及人脸识别技术简析
介绍早期人脸识别技术运用的矩阵分析基本方法;
介绍现代人脸识别技术中运用的神经网络技术,并由此回顾现代数据处理技术的发展路线,体会现代数据处理技术的主流思想与根本方法。
任务六:项目收尾
撰写整体报告;
准备一次20~30分钟的presentation。