SMP 2024前沿技术讲习班 | 讲习预告

会议官方
发布于 2024-09-06 / 488 阅读
0

SMP 2024前沿技术讲习班 | 讲习预告

第十二届全国社会媒体处理大会(The Twelfth China National Conference on Social Media Processing, SMP 2024)由中国中文信息学会社会媒体处理专委会主办,河南师范大学、河南科技学院、河南工学院和新乡工程学院联合承办,将于2024年10月10日-13日在新乡召开。本次会议以“大模型时代的AI+”为主题,内容呈现包含7个特邀报告、4个讲习班报告、1个PNAS特别论坛和11个专题论坛。

SMP 2024前沿技术讲习班邀请到了来自学术界和工业界的多位一线优秀学者专家于2024年10月10日-11日进行讲习报告。报告主题涵盖社会媒体处理的研究和应用热点,包含大模型对齐与评测、大模型与科学、大模型与智能体、大模型与社会科学。

 

讲习班报告日程

时间

2024/10/10(周四,二楼和谐厅)

讲者

9:00-12:00

大模型对齐与评测

柯沛,电子科技大学

14:00-17:00

大模型与科学

孙浩,中国人民大学
裘捷中,之江实验室

 

 

 

时间

2024/10/11(周五,二楼和谐厅)

讲者

9:00-12:00

大模型与智能体

汤斯亮,浙江大学
陈旭,中国人民大学

14:00-17:00

大模型与社会科学

吴超,浙江大学
张伊妍,中国人民大学

讲习班主席

浙江大学 杨洋 副教授

主席1.png

主席简介:杨洋,浙江大学计算机科学与技术学院副教授、博导、人工智能系主任,国家优青项目获得者。博士毕业于清华大学计算机系,曾访问美国康奈尔大学,与图灵奖得主John Hopcroft教授合作。主要从事面向大规模图数据及时间序列数据的人工智能研究,发表国际顶级学术期刊/会议论文70余篇,获人工智能顶会AAAI 2023杰出论文奖。担任国际期刊IEEE Transactions on Big Data编委、中国中文信息学会社会媒体处理专委会常委以及KDD、WWW、AAAI等国际学术会议程序委员会委员。

清华大学 陈慧敏 助理教授

主席2.png

主席简介:陈慧敏,清华大学新闻与传播学院助理教授,博士生导师。2020年获清华大学计算机系博士学位,2020年至2022年在清华大学新闻与传播学院从事博士后研究。主要研究方向为社会计算、智能与计算传播,在多个计算机、传播学等国内外知名期刊和会议上发表论文,曾获CAAI-BDSC 社会计算青年学者新星奖,中国计算语言学大会最佳论文奖。担任中文信息学会青年工作委员会委员、社会媒体处理专委会委员、人工智能学会大数据与社会计算委员会委员、中国新闻史学会网络传播委员会理事、Journal of Social Computing期刊青年编委,曾任全国社会媒体处理大会本地主席、讲习班主席、计算语言学大会学生研讨会主席。获国家自然科学基金青年基金、深度参与多个国家自然科学基金面上项目、社会科学基金重大项目。

讲习班嘉宾

10 日上午 大模型对齐与评测

电子科技大学  柯沛 副教授

柯沛.png

报告题目:大模型的生成质量评价与对齐

报告摘要:大语言模型在众多自然语言处理任务上均取得卓越性能,其文本生成能力已逐渐接近人类水平,这给生成文本的质量评价带来了巨大的挑战。因此,如何准确评价大模型的生成质量,以及如何在各类评价指标上将大模型的生成质量对齐至人类文本,成为了当前自然语言处理领域的研究热点。本次报告将围绕上述核心问题展开,从数据、方法等多个层面系统性地介绍相关方向的前沿研究工作。

讲者简介:柯沛,电子科技大学特聘副教授,博士毕业于清华大学计算机系,主要研究方向是大语言模型、自然语言生成和对话系统。近年在ACL、EMNLP、IJCAI、ICLR、ICML、TACL等国际顶级会议和期刊上共发表论文20余篇,获NLPCC 2020最佳学生论文奖。谷歌学术总引用量1300余次,曾担任ACL、EMNLP、NAACL等国际会议的领域主席。担任中国中文信息学会大模型与生成专委会副秘书长,入选2023年度博士后创新人才支持计划。

 

10 日下午 大模型与科学

中国人民大学 孙浩 副教授

孙浩.png

报告题目:从数据中发现物理规律

报告摘要:现代科学的发展主要依赖于简洁而优美的数学方程,得益于符号方程可解释、可通用的特征,即便是复杂系统,其运行机制也可以被合理诠释。从数据中自动挖掘、提取控制方程作为一类典型的符号回归问题,是自然科学发展和工程应用中数据助力科学探索的前沿挑战。该报告将介绍符号学习与推理基本概念和方法,讨论如何从数据中自动提取数理方程,进一步探索用于描述未知系统状态的数学方程或定律、发现新知识。

讲者简介:孙浩,1988年生,中国人民大学高瓴人工智能学院长聘副教授、博导,国家高层次青年人才,哥伦比亚大学博士、麻省理工学院博士后,曾任美国匹兹堡大学、美国东北大学终身序列助理教授、博导。从事智能科学计算理论方法与前沿交叉研究。在Nature Machine Intelligence、Nature Communications等国际一流期刊和ICLR、IJCAI等计算机顶会发表论文70余篇。主持国家海外高层次人才计划青年项目、国家自然科学基金(重大培育、面上)、美国科学基金(重点、面上、专题)等科研项目十余项。先后获得福布斯北美30位30岁以下精英榜(科学类)、美国十大华人杰出青年、中国智能计算科技创新人物等荣誉。

 

 浙江大学-之江实验室 裘捷中 研究员

qiujiezhong.png

报告题目:生命科学领域基座模型的设计和对齐

报告摘要:生命科学被认为是大语言模型的下一个前沿。本报告聚焦于生命科学领域的基座模型,首先综述生命科学各领域的基座模型设计,包括蛋白质、核酸、单细胞组学的基座模型。随后介绍报告人在应用生命科学基座模型进行生物分子挖掘和设计方面的研究工作,主要介绍蛋白设计算法 InstructPLM,该算法通过多模态指令微调实现蛋白质结构和序列信息的对齐,指导蛋白语言模型进行蛋白质序列的设计。

讲者简介:裘捷中,浙江大学-之江实验室平台百人计划研究员。本科和博士毕业于清华大学计算机科学与技术系,导师为唐杰教授;香港中文大学计算机科学与工程系荣誉博后,导师为王平安教授。研究领域为 AI4Science,大规模预训练和图学习,Google Scholar 引用 5700 多次,曾获得2024年国际基础科学大会(ICBS)前沿科学奖、2024 KDD China优秀博士学位论文奖、2023年CCF博士学位论文激励计划提名、2023年北京市优秀博士学位论文提名、2022年SIGKDD 博士论文奖亚军。

 

11 日上午 大模型与智能体

浙江大学 汤斯亮 教授

汤斯亮.png

报告题目:多模态大模型赋能自主智能系统

报告摘要:基于多模态大模型的智能体研究已成为人工智能领域的关键方向。本次报告将探讨该领域的核心概念和技术。首先,介绍多模态大模型的基础框架及其在处理视觉、语言和声音数据中的优势。然后,详述如何利用这些模型构建高效、强理解能力的多模态智能体,并讨论其在复杂环境的应用及环境适应性。报告将以具身智能的进展为终点,展示这种结合多模态感知和行动能力的智能体如何提升人机交互和任务效率。讲者将分享他的研究成果和对未来方向的看法,包括智能体的感知、决策和执行策略。听众将从报告中获得对多模态大模型驱动智能体的系统理解,为相关研究和实践提供宝贵的理论和技术参考。

讲者简介:汤斯亮,浙江大学计算机学院教授、博导,其研究领域为多模态大模型、自然语言处理及大模型等人工智能方向。工作以来在CCF推荐的A/B类会议与期刊上发表论文100余篇,持续担任NeurIPS、ICLR、AAAI、ACL等多个A类会议的领域主席,曾获浙江省科技进步奖一等奖、教育部科技进步一等奖等多个省部级奖项。

 

中国人民大学 陈旭 副教授

陈旭.png

 

报告题目:基于大语言模型的自主智能体

报告摘要:基于大语言模型的自主智能体研究近年来受到了人们的广泛关注,本次报告围绕该领域的基础知识展开,具体介绍如何构建大语言模型驱动下的自主智能体,包括如何刻画智能体,如何设计记忆机制和规划手段,如何让智能体执行动作等。同时报告人也将介绍其开发的基于自主智能体的用户行为模拟智能体。通过该报告,听者可以对大语言模型驱动下的自主智能体这一研究方向及其关键问题有较为系统的了解。

讲者简介:陈旭,目前为中国人民大学高瓴人工智能学院准聘副教授,博士毕业于清华大学,他的研究方向为大语言模型,因果推断,推荐系统等。曾在TheWebConf、NeurIPS、AIJ、KDD、ICLR等著名国际会议/期刊发表论文80余篇,谷歌引用6000余次,多次获得国际会议的最佳论文奖(或提名)。他带领团队撰写了大模型智能体的早期综述《A survey on large language model based autonomous agents》,并构建了基于大模型智能体的用户行为模拟环境RecAgent。同时,他也主持/参与十余项企业合作项目,相关成果在多家企业落地。

 

11 日下午 大模型与社会科学

 浙江大学 吴超 副教授

吴超.png

报告题目:分布式AI和计算社会科学

报告摘要:大模型等人工智能方法已经在各个领域得到越来越的应用,然而集中式的大模型会产生一系列问题,因此在此报告中,将介绍如何通过分布式方法来构建群体智慧,并保证在人工智能 时代的公平性,同时也会讨论如何在计算社会科学中运用这种分布式人工智能,特别是构建一种基于生成式多智能体的社会通用仿真装置。

讲者简介:吴超,浙江大学长聘副教授,人工智能协同创新中心研究员,博士生导师,计算社会科学研究中心主任,伦敦帝国理工学院计算机系荣誉研究员。研究方向为联邦学习和分布式建模、数据隐私保护和数据定价、计算社会科学等。在AAAI、ICCV、KDD等国际会议和期刊上发表论文百余篇,主持包括国家自然科学基金重点类项目在内的多个科研项目,同时也是Galaxy Learning等开源项目的发起者,以及Mo人工智能教育平台的创始人。

 

中国人民大学 张伊妍 讲师

张yiyan.png

报告题目:从“窄数据”到“宽数据”:用户数字足迹分析与社会科学研究方法的结合

报告摘要:长期以来,我们所分析的用户数字足迹“大数据”都只是“长”且“窄”的数据:尽管案例数量庞大,但变量数较少,缺乏对个体的态度、情感、人口统计学背景和其他线上线下行为等变量的考虑,这也削弱了许多预测力良好的模型的解释力。将用户数字足迹与传统社会科学研究方法结合起来是提升大数据研究的可解释性的一个有效途径。本次讲习班将围绕这一主题介绍几种结合方式,并辅以案例讨论不同结合方式的优势与缺点,探讨用户研究目前面临的机遇与挑战。

讲者简介:张伊妍,中国人民大学新闻学院讲师、中国人民大学新时代国际传播研究院研究员、中国人民大学新闻与社会发展研究中心研究员、《国际新闻界》主编助理。博士毕业于美国波士顿大学传播学院新兴媒体系,本科毕业于北京大学新闻与传播学院广告系(国家发展研究院经济学双学位)。主要研究方向为新兴媒介效果、计算传播、国际传播。论文可见于Communication Research, Information, Communication & Society, Mass Communication and Society, Journalism Studies, International Journal of Communication, The Social Science Journal等期刊。