全国服务电话:024-23251177
您的位置:首页 > 学术科研 >人工智能与数据科学专题: AlphaGo到GPT中RLHF的进化:深度强化学习与图神经网络在结合用户意图以优化模型输出中的原理研究【大学组】

人工智能与数据科学专题: AlphaGo到GPT中RLHF的进化:深度强化学习与图神经网络在结合用户意图以优化模型输出中的原理研究【大学组】

阅读 317
2024-04-27

  开始日期: 2024-05-25

  课时安排: 7周在线小组科研学习+5周不限时论文指导学习

  适合人群

  适合年级 (Grade): 大学生及以上

  适合专业 (Major): 计算机科学、人工智能、数据科学、电子与计算机工程等专业,软件工程、自动化等相关专业或者希望掌握强化学习的学生;对人工智能、大数据以及交叉学科和方向感兴趣的学生;

  学生需要具备线性代数及概率论与数理统计基础,至少会使用一门编程语言实现神经网络,有过强化学习开发经验的申请者优先

  建议选修: Python编程与数据处理

  导师介绍

  Pietro

  剑桥大学 University of Cambridge终身正教授

  Pietro导师现任剑桥大学计算机科学与技术终身正教授,意大利国家认定Top100科学家, H-index64,被引用次数35000+。教授2021年连中三篇计算机顶会ICML,其论文还曾发表在包括世界级学术期刊 《Nature》。导师持有欧洲学习和智能系统实验室(Ellis;欧洲大型跨国人工智能研究所,目前拥有千位全球顶尖计算机工程师、数学家和其他领域科学家,旨在重构欧洲人工智能前沿研究)席位、剑桥大学大数据研究指导委员会席位。Pietro导师的研究兴趣为人工智能图神经网络建模,在国际知名学术期刊发表论文多篇,曾荣获欧盟委员会未来与新兴技术(FET;迄今欧盟规模最大、资助力度最强的科研资助项目之一)会展三等奖。

  任职学校

  剑桥大学建校于1209年,是世界范围内历史最为悠久的大学之一,英国Top2名校,G5名校之一。剑桥大学享有世界声誉,在英国社会和高等教育系统中具有极其重要的地位,同时具有广泛的世界性影响。许多青年学子都以到剑桥大学深造为理想。剑桥大学在2020年QS世界大学综合排名位列第7。

  项目背景

  近年来,人工智能数据科学技术不断突破与发展。卷积神经网络CNN开启了深度学习新篇章,推动计算机视觉落地自动化驾驶等诸多领域;循环神经网络RNN推动了自然语言处理,使得机器翻译、智能语音技术日趋成熟;深度学习之上,强化学习图神经网络GNN的崛起正在深度赋能数据挖掘,将成为企业场景拓展、数据整合、行业效率飞跃的关键。项目将聚焦强化学习,特别是图神经网络GNN这一构筑未来数字生态的核心数据科学技术。

  项目介绍

  项目内容涉及强化学习核心理论和技能,具体包括遗传算法、强化学习框架、Q-learning、行动者-批评(actor-critic;AC)模型、马尔可夫决策过程、优化控制、图神经网络(graph neural networks; GNN)、自动机器学习(Auto ML)等。学生通过项目了解如何开发基于强化学习的生产力软件,在结束时提交项目个性化研究课题报告,进行成果展示。

  个性化研究课题参考:

  强化学习在博弈论中的应用:类alpha算法开发

  利用经验留存解决强化学习所需样本太多问题的可行性分析

  强化学习中的机器奖励设置方法迭代

  为强化学习过拟合的特定场景重新建模的自动过程研究

  具有精确尺度估计的动作-评价网络结构与强化学习优势函数

  项目大纲

  强化学习:项目将在本周聚焦遗传算法和强化学习框架。 Introduction to reinforcement learning

  环境:强化学习由智能体和环境两部分构成。项目将在本周探讨离策略、无模型强化学习算法 Q-learning、行动者-批评(actor-critic;AC)模型、马尔可夫决策过程等。Environment

  优化:项目将在本周深入学习强化学习与优化控制。 Optimization

  集成与控制 Integration and Control

  集成:项目将在本周进一步探讨图神经网络(graph neural networks; GNN)、自动机器学习(Auto ML)等。 Integration

  项目回顾与成果展示 Program Review and Presentation

  论文辅导 Project Deliverables Tutoring

  项目收获

  7周在线小组科研学习+5周不限时论文指导学习 共125课时

  项目报告

  优秀学员获主导师Reference Letter

  EI/CPCI/Scopus/ProQuest/Crossref/EBSCO或同等级别索引国际会议全文投递与发表指导(可用于申请)

  结业证书

  成绩单

留学也是一种投资,你的留学预算充足吗,简单3步,轻松了解留学预算?

费用计算

版权及免责声明:
1、如转载本网原创文章,请务必注明出处:寰兴留学(www.huanxingedu.com);
2、本网转载媒体稿件、图片旨在传播更多有益信息,并不代表同意该观点,本网不承担稿件侵权行为的连带责任;如转载稿、图片涉及版权等问题,请作者在两周内速来电或来函联系,我们将立即删除。

全国统一服务热线
024-23251177
服务邮箱:ben@sas-ben.com
投诉邮箱:ben@sas-ben.com