计算机科学
一封专属导师推荐信
一封完整的科研报告
一次完整的科研经历
【计算机科学】
基于深度学习的智能翻译及文本生成研究
1、项目介绍
正式科研:1v1线上定制辅导
项目收获:科研报告、导师推荐信
科研补充包:48课时科研基础课+15课时学术写作基础课
2、涉及领域
本课题涉及到深度学习 | 自然语言处理 | 智能翻译 | 智能翻译等方面的知识,适合申请自然语言处理 | 深度学习 | 计算机科学等相关专业的学生
3、适合人群
有意提高自身知识水平及学术能力的学生
有意掌握最前沿科研热点及科研方法的学生
有留学意向、跨专业深造的学生
4、研究前沿性
智能翻译,是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程,涉及语言学、计算机科学、数学、逻辑学等学科;文本生成是智能翻译的一个关键模块,以文本、图像、数据等作为输入,通过计算机处理输出文本。与传统技术相比,目前的智能翻译和文本生成技术虽然很大程度上提高了产出的质量和效率,但也存在如时态混淆,长句逻辑混乱等系统性错误。
本项目研究了基于深度学习的智能翻译及文本生成研究技术及应用,有助于提升模型的训练效率,同时有助于提升生成文本的流畅性以及稳定性。
5、研究介绍
本项目主要的研究对象是智能翻译及文本生成相关深度学习模型。在本项目中,学生首先学习掌握智能翻译、文本生成以及深度学习相关基础知识和经典模型,了解相关研究方向,基于已掌握的内容形成个人研究思路;其次,学生将掌握本项目使用的研究方法和建模软件,确定研究方案中的具体细节;最后,学生将通过建模仿真完成个人研究,并进行相关结果分析,总结研究过程中的不足,提出改进建议。
通过本项目,学生拓宽了自然语言处理领域的知识储备,熟悉了计算机科学研究范式,提升了个人建模仿真和分析的能力。
6、课题要点
课题研究方法
文献阅读、建模仿真
课题难点
需要有一定的自然语言处理基础,具备较好的英文文献阅读能力及一定的软件建模与处理能力。
7、1v1定制化辅导参考任务
任务一
掌握查阅文献和研究方法
掌握查阅文献和面向文献学习的方法;
掌握文献管理的方法;
通过查阅文献,学习该方向的研究热点和方向;
掌握快速提炼文献重要信息的方法。
任务二
学习相关基础知识
学习相关基础知识;
掌握机器翻译或文本生成的形式化定义;
调研并总结文本生成的任务分类,以及每个任务的形式化定义;
选定任务后,调研整理该任务中具有里程碑意义的模型,以及模型的发展脉络,比如LSTM->GRU->Attention->Transformer;
基于对现有研究内容的把握构建自己的研究思路。
任务三
掌握研究的方法并设计研究方案
根据个人兴趣和可行性选择要研究的任务;
根据个人兴趣和可行性选择要研究的任务;
整理所选任务的常用开源工具;
根据实际情况和个人基础选择合适的开源工具。
任务四
开展研究
在标准数据集和评测基准下复现经典的基线方法;
分析基线方法表现的不足,重新思考模型优化方案的可行性和成功率;
分析基线方法表现的不足,重新思考模型优化方案的可行性和成功率;
分析基线方法表现的不足,重新思考模型优化方案的可行性和成功率;
根据实验结果迭代优化自己的方法。
任务五
分析与总结
对实验结果的关键参数作出描述性统计分析;
根据分析结果对优化后模型作出评述;
根据分析结果对优化后模型作出评述;
总结本项目研究过程中的缺陷并提出改进建议。
任务六
项目收尾
撰写整体报告;
准备一次20~30分钟的presentation。