SMP2024 论坛议程 | 议程安排

会议官方
发布于 2024-09-21 / 524 阅读
0

SMP2024 论坛议程 | 议程安排

会议手册下载

论坛主题:SM2024 计算传播学论坛

论坛时间:10月12日 16:00-18:00

论坛简介:以大模型为代表的数据分析技术为传播学的研究带来了新的可能性和研究范式,推动传播学研究从计算时代走向智能时代。计算传播学作为传播学致力于寻找传播学可计算化的基因,以传播网络分析、传播文本挖掘、数据科学等为主要分析工具,大规模地收集并分析人类传播行为数据,挖掘人类传播行为背后的模式和法则,分析模式背后的生成机制与基本原理。本次论坛邀请了复旦大学官璐副教授、中国人民大学张伊妍博士、清华大学新闻学院陈慧敏博士、北京大学汇丰商学院陈灼博士从传播实践中的不同角度,探讨数据技术对传播学研究带来的新视角与新发现。

 

论坛主席:张伦(北京师范大学艺术与传媒学院数字媒体系教授)

 

主席简介北京师范大学艺术与传媒学院数字媒体系教授。入选国家“万人计划”青年拔尖人才,北京师范大学仲英青年学者。主要研究方向为基于数据挖掘方法的新媒体信息传播。于SSCI、SCI以及CSSCI索引期刊发表论文50余篇;合著出版《重构知识:在线知识传播的疆域、结构与机制》(清华大学出版社,2023年)、《计算传播学导论》(北京师范大学出版社,2018年)、《社交网络上的计算传播学》(高等教育出版社, 2015年)等书。承担了国家社科基金一般项目、青年项目、教育部人文社会科学青年项目等多项科研项目。

 

 

报告一:

报告嘉宾:官璐(复旦大学新闻学院副教授)

报告题目:国家形象的色彩维度:对谷歌图书大数据的量化分析

报告摘要: 色彩是形象塑造的重要元素,国家色彩形象的背后不仅受到社会制度层面的规范与影响,更是国家政治、经济、文化多重作用下缔造出的时代产物。然而,色彩维度却较少在以往的国家形象研究中受到关注。研究一基于色彩政治学的理论背景,通过对谷歌图书大数据的量化分析,探讨国家与色彩的二分网络结构特点,剖析不同国家在不同时期呈现出的色彩形象特征与时代变化。研究二基于色彩心理学的理论基础,探讨色彩表征在PAD情感象限中的定位以及色彩情感在过去200年间的变化。

嘉宾简介:官璐,复旦大学新闻学院副教授,硕士生导师,复旦大学全球传播全媒体研究院“计算与智能传播”团队成员,上海市“浦江人才”,上海市“晨光学者”。主要研究方向为数字人文、社交网络挖掘、计算传播等。十余篇论文发表在Information, Communication & Society、Computers in Human Behavior、Journal of Medical Internet Research、Public Relations Review、《新闻大学》、《当代传播》等SSCI、SCI、CSSCI学术期刊上,并在ICA、IAMCR、AEJMC等高水平传播学国际会议上进行宣讲。

 

报告二:

报告嘉宾:张伊妍(中国人民大学新闻学院讲师

张yiyan.png

报告题目:以人为中心的大模型?从用户算法理解到平台规则冲突

报告摘要:随着大模型技术的迅速发展,从以算法为中心到以人为中心的变化也成为重要研究趋势。本次报告将梳理国内外与人的算法理解相关的一系列概念,介绍一个新的概念框架,并比对不同年份、不同语言之间的研究倾向。另外,在人参与活动的不同平台——包括大模型内容生成平台和发布平台上存在不同的社区规则,本报告也将讨论这些规则之间冲突所带来的对于用户态度与行为的潜在影响,为构建能更好地为人服务的大模型提供建议。

嘉宾简介:张伊妍,中国人民大学新闻学院讲师、中国人民大学新时代国际传播研究院研究员、中国人民大学新闻与社会发展研究中心研究员、《国际新闻界》主编助理。博士毕业于美国波士顿大学传播学院新兴媒体系,本科毕业于北京大学新闻与传播学院广告系(国家发展研究院经济学双学位)。主要研究方向为新兴媒介效果、计算传播、国际传播。论文可见于Communication Research, Information, Communication & Society, Mass Communication and Society, Journalism Studies, International Journal of Communication, The Social Science Journal等期刊。

 

报告三:

报告嘉宾:陈慧敏(清华大学新闻与传播学院助理教授)

主席2.png

报告题目:大模型在计算传播中的应用:通用数据分析工具与社会模拟器

报告摘要:近年来,大模型技术不断发展,展现出强大通用能力和类人智能,也为计算传播方法带来了新的可能。本报告将从通用数据分析工具与社会模拟器两个方面介绍大模型在计算传播学中应用的新可能。具体而言,大模型展现出的通用能力使其成为通用数据分析工具,免去繁杂数据标注流程,本报告以国家形象系列研究为例,展示大模型在提取文本和图像等多模态中的主题和情感等多元信息中的作用。进一步,大模型表现出的类人智能使其具备成为社会模拟器的潜力,本报告从群体与个体模拟视角出发,呈现大模型在模拟人类价值、认知、态度与行为方面的潜力与挑战。

嘉宾简介:陈慧敏,清华大学新闻与传播学院助理教授,博士生导师。2020年获清华大学计算机系博士学位,2020年至2022年在清华大学新闻与传播学院从事博士后研究。主要研究方向为智能与计算传播、社会计算,在多个计算机、传播学等国内外知名期刊和会议上发表论文,曾获CAAI-BDSC 社会计算青年学者新星奖,中国计算语言学大会最佳论文奖。担任中文信息学会青年工作委员会委员、社会媒体处理专委会委员、人工智能学会大数据与社会计算委员会委员、中国新闻史学会网络传播委员会理事、Journal of Social Computing期刊青年编委,曾任全国社会媒体处理大会本地主席、讲习班主席、计算语言学大会学生研讨会主席。主持国家自然科学基金青年基金、深度参与多个国家自然科学基金面上项目、社会科学基金重大项目。

 

报告四:

报告嘉宾:陈灼(北京大学汇丰商学院助理教授)

报告题目:Seeing is believing: How China’s visa-free transit policy shapes the presence of China on YouTube?

报告摘要: The social media presence of foreign countries results from complex factors beyond mere media campaigns. Many real-world influences, such as policy changes, can shape the discourse about a country yet remain underexplored. This study focuses on China’s 144-hour visa-free transit policy, which allows international travelers to stay for six days while transiting, and has triggered a significant amount of video content about China on YouTube. By combining a natural experiment design with computational methods, we analyze 2 million comments from approximately 700,000 YouTube videos related to China. We compare how China is presented before and after the policy was implemented. Preliminary analysis reveals that the overall discourse about China becomes more positive following the policy's implementation. Furthermore, we examine the heterogeneous effects among different types of accounts, such as mainstream media outlets (legitimizing voices), political vloggers (project voices), and ordinary accounts (resistance voices).

嘉宾简介:陈灼,北京大学汇丰商学院助理教授,新加坡国立大学传播与新媒体博士。研究领域为新媒体技术的政治与经济影响,包括媒介科技如何影响公共舆论、社会关系、集体协作行为等。研究发表于 Journal of Broadcasting & Electronic Media, Social Media + Society, Telematics & Informatics 等同行评审 SSCI 期刊。曾获国际传播学会 ICA 的 Political Communication 和 Communication and Technology 等分会的最佳论文奖,并担任 10 余本 SSCI 期刊评审人。

论坛主题:SMP2024  计算历史学论坛 - 宋代印记的数字镜像

论坛时间:2024年10月12日下午16:00-18:00

论坛简介:在SMP 2024计算历史学论坛上,我们揭开了一段穿越时空的旅程,聚焦于「宋代印记的数字镜像」。这一主题不仅捕捉了宋代历史的丰富细节,更通过数字化手段,为我们展现了一个全新的历史研究视角。在这里,历史不再是尘封的记忆,而是活跃的、可感知的现实。我们从定性镜像研究的深度洞察出发,探索历史文本如何捕捉和再现历史现实。这些研究深入文本的叙事细节、语言风格和作者的主观解释,通过深度分析少数精选文本,揭示了历史事件、人物行为和社会结构在文本中的构建和理解。它们允许我们洞察文本中的内在逻辑和文化假设,对历史有了更丰富、多维度的感知。而定量镜像研究则展开了宽广的视角,采用数字人文工具对大量历史文本进行分析。它通过计算方法识别文本中的关键词汇、主题分布和情感色彩的模式,揭示了大量历史文本中普遍存在的话题和趋势,以及它们随时间的演变。在本次论坛中,我们有幸聆听了不同领域的专家学者分享他们的洞见。他们利用数字化技术深入研究宋代的历史印记,从成寻日记的数字化解读到《全宋文》墓志铭的亲属网络分析,从《资治通鉴》的知识图谱构建到宋代经济与文化的GIS空间分析,每一项研究都是对宋代历史镜像的一次深刻探索。我们期待与您共同见证这场宋代历史的数字化探索之旅,一起发现宋代印记的数字镜像所蕴含的无限可能。这不仅是对过去的回顾,更是对历史研究方法的一次革新,让我们得以在数字的海洋中航行,探索历史的深度与广度。

论坛主席:战蓓蓓 (湖南大学岳麓书院,副教授)

主席简介:湖南大学岳麓书院海外学术交流中心主任、数字人文中心主任。毕业于西安交通大学,获计算机科学与技术学士学位。于伦敦大学学院获得视觉、图像处理与虚拟环境硕士学位。金斯顿大学计算机视觉博士学位(英国电信联合奖学金)。后转入汉学研究,于伦敦大学亚非学院获得汉学硕士学位及博士学位,在《通报》等海内外期刊发表数篇。

报告一:

报告嘉宾:袁晓如(北京大学智能学院研究员)

报告题目:智能驱动的古代文化数据交互可视分析

报告摘要:大数据时代研究范式的变革影响各个学科,而紧密结合人类智慧与机器强大计算能力的可视化与可视分析在其中发挥重要作用。报告将介绍近期可视化实验室与各人文社科研究者紧密合作,开展的包括古代彩陶花纹图像演变、古籍目录探索、汉籍时空流传等可视分析交叉研究课题。在这其中,我们特别关注通过可视化的方法理解分析宋代的历史数据,例如对宋代人物的交互式探索、宋代书刊的刊刻地图等。这些工作一方面为历史文化领域研究学者提供了新的工具,支持更为高效的探索发现,另一方面也为大众理解领域专门知识提供的途径,为发展新的展陈方式提供思路。

嘉宾简介:袁晓如 北京大学智能学院研究员,大数据分析与应用国家工程实验室常务副主任,机器感知与智能教育部重点实验室副主任。长期致力于可视化与可视分析通用基础方法与领域应用系统的研究;开展与历史人文领域交叉合作,设计构建可视分析系统支持时空流传、内容演化等复杂任务。ChinaVis,IEEE VIS,PacificVis 指导委员会委员,IEEE TVCG 等国内外期刊编委。中国图象图形学学会可视化与可视分析专业委员会主任。

 

报告二:

报告嘉宾:陈佩辉(山东大学哲学与社会发展学院副研究员)

报告题目:人文数据库建设中人文学者何为——以《全宋文》墓志铭亲属信息提取为例

报告摘要:人文学者与信息技术学者在建设数据库过程中虽有分工,但更应该彼此合作。作为研究者和数据库建设参与者的人文学者不仅要承担文献辨析的责任,也应该积极地学习信息技术,承担起技术责任,为数据库建设中技术的改进做出应有贡献。由此才能使信息技术更好地为建设数据库服务,提高数据库建设的效率以及信息的准确性和全面性。

嘉宾简介:陈佩辉,北京大学哲学博士,哈佛大学访问学者,现为山东大学哲学与社会发展学院副研究员,研究方向:儒家政治哲学、宋明理学、数字人文。

 

报告三:

报告嘉宾:左家莉(江西师范大学副教授)

报告题目:历史文本中的知识抽取

报告摘要:

信息抽取可从非结构化的文本中提取结构化信息,是实现历史文本知识化的有效手段。因此,我们基于《资治通鉴》文本展开了信息抽取的研究,涵盖了上下文和外部知识建模、标注规范的影响、大语言模型的应用、模型在不同时期和类型的文本上的迁移能力。在此基础上,我们从历史研究的“四把钥匙”是职官制度、历史地理、年代学和目录学这一思想出发,研究了围绕重大历史事件的历史文本事件数据集的构建,以探索基于“人、时、事、地、物”的历史表示模型。

嘉宾简介:江西师范大学计算机信息工程学院副教授,中国中文信息学会信息检索专委会、计算语言学专委会、社会媒体处理专委会委员、计算历史专业组副组长、中国图象图形学学会可视化与可视分析专委会委员。主要研究方向为自然语言处理、信息检索和数字人文。主持和参与多项国家和省级项目,在相关国际和国内期刊、会议上发表学术论文30余篇。

报告四:

报告嘉宾:张光伟(陕西师范大学历史文化学院讲师)

报告题目:基于混合GIS的宋代文献地理空间可视化---以《参天台五台山记》为例

报告摘要:本研究以北宋时期日本僧人成寻所作的《参天台五台山记》为例,探讨混合GIS技术在宋代文献中地理空间信息的可视化的应用。历史文献中存在大量地名以及地理空间关系的定性描述,但由于存世的宋代地图资料相对缺乏,文献资料中的许多地名的具体位置难以确定。为解决这一问题,本研究提出一种混合式GIS方法,结合大规模文本分析与人工智能技术,利用大模型提取文献中的地理信息,以实现对文献中地理信息的有效可视化。本研究希望借助大模型与创新的GIS技术,提升对宋代文献中地理信息的理解与表达,推动人文学科与地理信息科学的交叉融合。

嘉宾简介:张光伟,陕西师范大学历史文化学院讲师,硕士研究生导师。担任陕西师范大学丝绸之路历史文化虚拟仿真实验教学中心(省级)主任,国际长安学研究院数字长安研发中心主任,全国历史学实验室建设联盟秘书长,国际教育合作协会(GPE)咨询委员会委员。主要从事计算机科学与历史学相结合的工作与研究:(1)基于深度学习的中国古籍自动识别与转录,古地图的自动识别与信息提取;(2)虚拟仿真实验技术在历史研究与教学中的应用,国家一流本科虚拟仿真实验课程“敦煌石窟历史实践教学虚拟仿真实验”技术负责人。发表各类相关研究论文近20篇,参与、主持多项国家级、省部级社科基金与自然科学基金项目。主要开设数字人文与新文科以及国际理解教育相关课程。

 

论坛主题:SMP2024  视频生成大模型专题论坛

论坛时间:2024年10月13日14:00-16:00

论坛简介:视频生成大模型——随着人工智能技术的迅猛发展,生成式视频模型正在改变我们创作和消费视频内容的方式。以Sora为代表的生成式视频技术,利用先进的多模态大模型技术,能够自动生成高质量的视频,正在各个领域中展现出巨大的潜力。本论坛有幸邀请到来自北京大学、中国人民大学的学术界专家以及来自生数科技和智谱AI的产业界专家,共同分享在视频生成大模型方面的最新研究。

 

论坛主席:李崇轩(中国人民大学高瓴人工智能学院准聘副教授)

 

主席简介李崇轩,中国人民大学高瓴人工智能学院准聘副教授、博士生导师,2010-2019年获清华大学学士和博士学位。主要研究机器学习、深度生成模型,代表性工作部署于DALL·E 2、Stable Diffusion、Vidu等生成式大模型。获国际会议ICLR杰出论文奖、吴文俊优秀青年奖、吴文俊人工智能自然科学一等奖、中国计算机学会优秀博士论文等。担任IEEE TPAMI 编委、软件学报编委和ICLR、NeurIPS等会议的领域主席。

 

报告一

报告嘉宾:卢志武(中国人民大学高瓴人工智能学院教授)

 

报告题目:通用扩散视频生成底座VDT及其应用

报告摘要:不同于图像生成,视频生成在内容一致性、长视频生成、计算资源消耗等方面均面临巨大的挑战。但是,视频生成仍然在2024年取得了飞速的发展,涌现出Sora、可灵等优秀模型。本报告首先介绍通用扩散视频生成底座VDT的技术细节,然后介绍基于VDT底座的可控人像视频生成的实践与思考,最后还对视频生成的技术发展进行展望。

嘉宾简介:卢志武博士,中国人民大学高瓴人工智能学院教授,博士生导师。2005年毕业于北京大学数学科学学院信息科学系,获理学硕士学位;2011年毕业于香港城市大学计算机系,获PhD学位。研究方向为机器学习与计算机视觉。设计首个中文通用多模态预训练模型文澜BriVL。发表多模态领域首篇Nature子刊论文。早于OpenAI发布类Sora的视频生成底座VDT。

报告二

报告嘉宾:穆亚东北京大学研究员、长聘副教授

报告题目: 多模态生成式模型:简介与近期进展

报告摘要报告主要介绍讲者所负责的实验室在视觉-语言生成式大模型方面的近期研究进展,包括文本-图像大模型LaVIT以及文本-视频大模型Video-LaVIT等,并结合近期OpenAI Sora来讨论多模态生成式大模型的设计要素。

嘉宾简介穆亚东,北京大学研究员、长聘副教授、博士生导师、博雅青年学者,新闻出版智能媒体技术重点实验室副主任,先后在北京大学获得理学学士和理学博士学位。曾在新加坡国立大学、美国哥伦比亚大学、华为香港诺亚方舟实验室、美国电话电报公司研究院(AT&T Labs)担任研究职位,主要研究领域为计算机视觉和机器人学,入选国家级青年人才计划,在国际主流会议和期刊发表论文100余篇,其中在CVPR等中国计算机学会论文推荐列表A类会议和T-PAMI等IEEE汇刊发表论文超过80篇,申请PCT、美国或中国专利30余项。获得陕西省自然科学一等奖、国际会议SIGIR最佳论文提名奖、北京大学京东方奖教金、杨王院士奖教金等。担任多媒体领域旗舰期刊IEEE Transactions on Multimedia的编委,多次担任人工智能领域顶级会议(如CVPR、ACM Multimedia)的领域主席。近期代表工作包括视觉大模型ECLIP、视觉语言大模型LaVIT系列和基于Koopman控制理论的视觉表征等。

报告三

报告嘉宾:顾晓韬(智谱AI研究员)

报告题目:CogVideoX: 基于Transformer的视频生成扩散模型

报告摘要:CogVideoX是我们近期研发的基于Transformer的视频生成扩散模型。我们提出使用3D变分自编码器(VAE)在空间和时间维度上对视频进行压缩,从而提高计算效率。为提高文本与视频的对齐程度,我们设计使用Expert Adaptive LayerNorm来促进两种模态之间的深度融合。通过采用渐进式训练技术,CogVideoX擅长生成连贯带有明显动作的视频片段。此外,我们开发了一种高效的文本视频数据处理流程,包括多种数据预处理策略和视频描述文本生成方法。这显著提高了CogVideoX的性能,改善了视频生成质量和语义对齐程度。结果显示,CogVideoX在多项自动化指标和人类评估中表现出了先进的性能。

嘉宾简介:顾晓韬,智谱AI研究员。2013-2017 清华大学计算机科学与技术系本科,参与Aminer学术数据挖掘系统开发。2017-2022 UIUC计算机科学系博士,参与Google知识图谱、新闻摘要、大语言模型训练加速等自然语言处理研究项目与系统开发。曾任华为云技术专家,主导大模型研发工作。

报告四

报告嘉宾:鲍凡(生数科技联合创始人兼CTO)

报告题目:U-ViT:多模态大模型的变革与未来

报告摘要:从首个Diffusion Transformer的架构U-ViT出发,介绍了基于该架构一系列多模态大模型的工作以及演进。

嘉宾简介:鲍凡现为生数科技联合创始人兼CTO。2024年获得清华大学计算机系博士学位,师从张钹院士和朱军教授。主要从事多模态大模型和扩散模型的研究,相关领域发表十余篇学术顶会论文,被谷歌学术引用两千余次,其一作论文Analytic-DPM获得世界级学术奖项ICLR 2022杰出论文奖,是该会议首篇由中国大陆单位独立完成的获奖论文,并作为核心技术被应用到OpenAI发布的大规模跨模态生成模型DALL·E 2上。鲍凡提出全球首个Diffusion和Transformer的融合架构U-ViT,并基于此架构提出了大规模多模态生成模型UniDiffuser。最近,鲍凡还带领团队实现国内首个长时长、高一致性、高动态性视频生成大模型Vidu,依然基于U-ViT架构,支持一键生成长达16秒、分辨率高达 1080P 的高清视频内容。Vidu获得包括央视在内的国内外媒体的广泛关注。鲍凡曾获ICLR国际会议杰出论文奖(大陆首次获奖)、MIT TR35中国先锋者等。

论坛主题:SMP2024  情感计算分论坛 - 面向心育的情感计算

论坛时间:2024年10月12日16:00-18:00

论坛简介:面向心育的情感计算——情感计算结合了计算机科学、心理学和认知科学等多个学科,旨在通过计算机技术来识别、理解和模拟人类情感。面向心育的情感计算是在此基础上,在教育心理学领域进行了诸多探索与应用,助力实现因材施教、公平公正、富有温度的智能教育。本论坛有幸邀请到来自华东师范大学、中国人民大学、科大讯飞的专家学者与所有参会者共同分享在线关注与融合心理学的情感对话智能体技术研究和应用、XX等方面的研究。

 

论坛主席:赵妍妍(哈尔滨工业大学 教授)

主席简介赵妍妍,哈尔滨工业大学计算学部教授、博士生导师,加州大学伯克利分校访问学者。目前担任中国中文信息学会情感计算专委会评测组组长、中国中文信息学会社会媒体处理专委会委员、哈工大计算社会科学协同创新中心主任助理,在国内外多个会议如:EMNLP、SMP、CCL等任领域主席和本地主席。主要研究方向:自然语言处理、情感计算、社会计算。近年来主持项目多项,包括国家自然科学面上基金 2 项、青年基金 1 项、教育部人文社科项目 1 项等。参与国家项目多项,包括国家973项目、科技部重点研发项目、国家自然科学基金重大项目、国家自然科学基金重点项目等。此外,作为技术负责人参加多项横向项目,包括与腾讯、华为、搜狗等公司合作的项目。出版专著两部《情感对话机器人》、《社会媒体挖掘》。发表相关领域的学术论文50余篇,其中包括领域重要国际会议ACL、EMNLP、NAACL、Coling等。曾获黑龙江省科技进步一等奖 1 项、黑龙江省科技进步二等奖2 项,中国人工智能学会最佳青年科技成果奖 1 项。

报告一:

报告嘉宾:宋睿华(中国人民大学)

报告题目:情感计算在多模态场景中的隐式应用

报告摘要:随着大模型的兴起,为了满足丰富的多模态场景的需求,情感计算已经渐渐从显式的分类任务,变为如何隐式的影响理解、推理和表达。在这个讲座中,我会介绍如何根据对话推测情感变化,如何让有声小说具有情绪感染力,如何将情感等因素融合于说服式对话。

嘉宾简介:宋睿华博士,国家高层次人才特聘教授,现任中国人民大学高瓴人工智能学院长聘副教授。曾任微软亚洲研究院主管研究员、微软小冰首席科学家。近期研究兴趣为多模态理解、创作和交互。发表学术论文100余篇,申请专利30余项。曾获WWW 2004最佳论文提名奖,AIRS 2012最佳论文奖,和CLWS 2019优秀论文奖,2022年度教育部自然科学一等奖。她的算法完成了人类史上第一本人工智能创作的诗集《阳光失了玻璃窗》。2020-2022年作为学术带头人,发布文澜系列中文多模态对齐大模型,并成功落地快手、OPPO等企业。2023年,参与发布玉兰大语言模型,完成从基础模型到对话模型的自研训练。曾担任SIGIR短文和讲习班主席,ACL的领域主席,EMNLP的资深领域主席,和Information Retrieval Journal的主编。

 

报告二:

报告嘉宾:陈琴(华东师范大学计算机科学与技术学院,青年研究员)

报告题目:融合心理学的情感对话智能体技术研究和应用

报告摘要:大语言模型在很多通用任务上取得了不错的效果,但在心理咨询等垂直应用场景仍然存在着挑战,其倾向被动式响应和通用性建议,对缓解心理问题效果有限。本报告将介绍我们在融合心理学理论的情感对话智能体方面的探索,包括如何使大语言模型遵循完整的心理学理论框架进行心理辅导任务规划、心理困境分析和策略执行,如何设计有效的评测机制等问题,从而去引导智能体通过主动式对话实现精准的心理评估和有效疏导,辅助心理问题早筛,并提供从情感陪伴到心理疗愈不同层次的心理健康支持。

嘉宾简介:陈琴,博士,华东师范大学计算机科学与技术学院青年研究员。现任上海市计算机学会自然语言处理专委会秘书长、中国中文信息学会青年工作委员会委员。主要研究方向为自然语言处理和机器学习,长期从事知识抽取、大语言模型、人机问答和对话等相关研究。目前致力于大模型在教育垂直领域的技术探索,并作为项目主要负责人之一,研发了教育垂直领域大模型 EduChat(https://www.educhat.top/)。在相关领域国际重要会议和期刊如 TKDE、AAAI、IJCAI、SIGIR、EMNLP 等发表论文 40 余篇,以项目/子课题负责人主持国家基金委、科技部、上海市人工智能科技支撑等科研项目多项,常年担任相关学术会议和期刊审稿人。

报告三:

报告嘉宾:常雪亮(科大讯飞)

 报告题目:基于认知大模型的AI心理伙伴对青少年心理健康的提升效果

报告摘要

为了提升青少年心理辅导的覆盖面及有效性,弥补专业心理老师的人力缺口,科大讯飞在星火大模型的基础上,通过10亿+心理健康专业领域知识以及百万个脱敏后的心理辅导对话案例训练,打造了可以7*24小时通过语音、文字、视频等方式直接对青少年进行心理辅导的AI心理伙伴“小星”。目前,AI心理伙伴已经具备多模态情感识别、共情表达、寻因式提问以及个性化心理指导等心理辅导能力。在上海、芜湖、南昌、武汉、济南等地区的学校进行使用,可以将学生个性化心理辅导覆盖率从不足5%提升到74%;可以在不增加心理老师人数的情况下,将心理预警学生的干预闭环率从不足20%提升到80%~99%;纵向追踪数据显示,自责倾向”检出率从 12.2%下降至 3.61%,学习焦虑”检出率从 20.76%下降至 9.21%。

嘉宾简介

常雪亮,北京师范大学心理学博士研究生,现任科大讯飞智慧心育研究院院长,智慧心育产品部总监,资深心理教研专家,中国健康促进与教育协会心理健康教育分会委员,脑科学和数字心身医学专业委员会委员,中央电教馆智慧教育培训专家四川、广西等省份“国培计划”心理健康特聘专家。长期从事青少年心理健康相关研究,带领团队承担科大讯飞在青少年心理健康领域的人工智能技术前瞻布局、技术攻关和成果转化等各项工作,取得多项创新性技术和应用成果。2021年获讯飞之星奖项,2023年荣获讯飞华夏创新奖(讯飞个人最高奖项)。参与认知智能国家重点实验室《大语言模型在学生日常心理陪伴领域中的应用》、安徽省《基于语音语义表情的青少年心理健康评估与预警研究》等国家、省级课题研究;具有《心理辅导方法、装置、设备及存储介质》等8项专利。参编《心理健康》人教社教材等30余本教材及书籍;在《人民教育》、《中国教育报》等期刊发表论文10余篇。

 

论坛主题:SMP2024  计算社会学论坛 - 大模型与社会研究

论坛时间:2024年10月12日下午16:00-18:00

论坛简介:大模型与社会研究——进入21世纪以来,以大数据和人工智能为代表的信息技术革命正在深刻重塑人类社会。海量数据的积累和智能算法模型的发展不仅为传统社会科学研究注入了新的活力,也催生了“计算社会科学”这一崭新的交叉领域。计算社会科学以数据驱动和智能计算为主要特征,借助机器学习、自然语言处理、复杂网络等现代信息技术手段,力图揭示人类社会行为的内在规律,社会科学的不同学科在这一过程中实现了全新的交叉融合。可以预见随着人工智能新范式的不断突破,计算社会科学将进一步推动社会科学的理论创新、方法革新和应用拓展。本次分论坛邀请到清华大学政治学系孟天广教授、中国社会科学院社会学研究所吕鹏研究员、中国社会科学院社会学研究所黄种滨助理研究员、上海交通大学国际与公共事务学院郑思尧助理教授、清华大学政治学系曹迥仪博士生围绕前沿理论、创新方法和应用实践展开深入对话。

 

论坛主席:孟天广(清华大学社会科学学院副院长)

 

主席简介:孟天广,清华大学社会科学学院副院长,政治学系长聘教授、副系主任,兼任清华大学计算社会科学平台执行主任、清华大学数据治理中心执行主任、苏世民书院兼聘教授、清华大学计算社会科学与国家治理实验室副主任。研究领域包括中国政府与政治、信息政治学、计算社会科学。主持国家社科基金重大项目,出版学术著作3部,在《政治学研究》、Comparative Political Studies等国内外知名学术期刊发表多篇论文,获得多项国内外学术奖励和荣誉。

 

 

报告一:

报告嘉宾:吕鹏(中国社会科学院社会学研究所经济与科技社会学研究室主任、研究员)

报告题目:村庄价值观的共同基调与地方风俗——基于万级村庄村规民约文本的大数据分析

报告摘要:村规民约在中国乡村治理中扮演着成风化俗的角色,是推进农村现代化尤其是精神文明建设的重要手段,是日用的共同价值理念的文本呈现。现有研究受限于小样本和传统分析方法,难以全面揭示其内在的多样性。利用计算社会科学倡导的无监督的文本聚类模型和有监督的文本分类模型,对某数字治理平台上覆盖的全国范围内将近1.5万个村庄的村规民约文本进行深入分析,挖掘其中的治理主题、内容分布及其地方性特征。研究为理解村规民约在中国乡村治理中的作用提供了新的视角,也为国家与地方治理规范的互动提供了新的理解。

嘉宾简介:吕鹏,中国社会科学院社会学研究所经济与科技社会学研究室主任、研究员;中国社会科学院大学教授、博士生导师、中国社会科学院大学数字中国研究院执行院长。曾获“国家万人青年拔尖人才”、陆学艺社会发展基金会“社会学优秀成果奖”(2018/2023)等荣誉。曾主持国家社会科学基金重点和青年项目各1项;在《中国社会科学》发表论文3篇、在《社会学研究》发表论文8篇;在顶级国际期刊British Journal of Sociology发表论文1篇;于《政治学研究》《经济研究》《南开管理评论》《学术月刊》等权威期刊发表多篇学术论文。

 

 

报告二:

报告嘉宾:政光景(中国社会科学院社会学研究所助理研究员)

报告题目:农民多领域公共性及其影响机制研究——基于LLM测量的百万级文本数据分析

报告摘要:中国农民的公共性是被学界长期关注的议题。但如何对其进行有效测量,并基于扎实的数据基础开展定量研究是学界共同面对的挑战。本研究基于某农村治理平台上的120多万条农民发帖数据,通过多类非监督主题发现中国农民主要存在治理、经济、生活三方面的表达类型。基于这三种类型的表达,本研究通过大语言模型对农民在三个不同领域上的公共性进行了测量。并在此基础上分析影响农民在这三个领域中公共性受个体和集体特征的影响机制。为探究中国农民公共性问题提供了的理论框架和经验证据。

嘉宾简介:政光景,中国社会科学院社会学研究所助理研究员,中山大学社会学博士,研究方向为计算社会学、数字与智能社会、道德社会学,对计算社会学实证研究和智能社会理论研究感兴趣。有国税局工作经历、全国性调查组织经验,在《社会发展研究》、《江海学刊》等刊物发表文章多篇,研究被《人大复印资料》、《新华文摘》等多次转载。

 

 

报告三:

报告嘉宾:黄种滨(中国社会科学院社会学所助理研究员)

报告题目:生成式人工智能与中国国家形象建构——基于拉美国家的线下实验研究

报告摘要:愈来愈多的人使用诸如GPT等人工智能以搜索感兴趣的信息,亦或是浏览由AI生成的图片或文本等相关信息。然而,生成式人工智能由于所使用的训练数据与方法存在差异,其本身对于某些议题持有特定价值观点。那么,生成式人工智能是否以及如何影响人们对于特定议题的态度?对此,本文以中国国家形象为例,在拉美国家开展了一项超过250人的线下实验,通过构建GPT来源国家与智能程度的2*2研究设计,尝试探究人工智能是否以及如何影响外国人对于中国国家形象的认知态度。研究发现,通过使用生成式人工智能获取中国相关信息,人们对于中国国家印象显著提升。其中,高智能版本的gpt影响人们认知态度的干预效应更强;未发现不同国家gpt版本的干预效应存在显著差异。进一步分析发现,信息可信度与信息便捷度是影响人们态度的重要中介机制,而信息详细度与信息多样性未发现显著关联。

嘉宾简介:黄种滨,中国社会科学院社会学所助理研究员。主要研究方向为福利社会学,政治传播,计算社会科学。目前已在《新闻与传播研究》《探索与争鸣》《公共管理学报》《经济社会体制比较》,Journal of Political Science等CSSCI 和 SSCI 期刊发表论文多篇。曾获国际传播协会ICA最佳论文,中国传播学大会最佳论文等奖励。

 

 

报告四:

报告嘉宾:郑思尧(上海交通大学国际与公共事务学院助理教授)

报告题目:计算社会科学范式新演进:大语言模型与社会科学研究

报告摘要:大数据和人工智能的发展为社会科学研究开辟了新的可能空间,其中大语言模型的崛起尤其引人注目。大语言模型经历了从统计语言模型到神经网络、预训练模型的演进,在自然语言处理领域取得了突破性进展。对于社会科学研究而言,大模型一方面可以作为测量工具,提高测量的效率、精度和信度,拓宽可测量数据的范畴;另一方面可以辅助因果推断和社会预测,通过模拟反事实、辅助实验设计、识别因果方向等方式为因果分析提供新思路,并通过模拟个体和群体互动、发展检验社会行为理论来提升对社会现象的预测能力。更为重要的是,大模型能够赋能社会科学研究的全流程,包括研究问题的形成与凝练、数据的采集与预处理、数据分析与建模、结果阐释与成果转化诸环节,推动社会科学研究范式发生系统性变革。尽管大模型在社会科学研究中的应用尚处于起步阶段,但其引领的智能化、精细化、交叉化的发展趋势不可逆转。未来社会科学研究者应以开放心态拥抱大模型智能革命,在人机协同中推动认知迭代与理念升级,深化对社会现实的理解和解释。

嘉宾简介:郑思尧,上海交通大学国际与公共事务学院助理教授,研究领域包括中国政府与政治、数字治理与信息政治、计算政治学,论文见诸Jounal of Contemporary China、《政治学研究》、《公共行政评论》、《公共管理与政策评论》、《经济社会体制比较》等期刊。

 

论坛主题:SMP2024  AI Open期刊分论坛

论坛时间:2024年10月13日16:00-18:00

论坛简介:AI Open 期刊分论坛——AI Open由清华大学计算机系唐杰教授2020年创办,科爱(科学出版社和爱思唯尔合资公司)运营,目标是打造一本国际化的英文开放获取期刊。期刊已经被Scopus、Ei Compendex、ESCI/Web of Science 收录。2024年6月发布的Citescore为45,在Scopus人工智能领域排名第5,2025年会有影响因子。AI Open的优势包括文章在6个月内快速出版,发表的文章在ScienceDirect永久免费获取,2025年底前对高质量的文章免收APC。本论坛有幸邀请到了来自清华大学、浙江大学、北京邮电大学、合肥工业大学、南华大学等国内高校的专家学者汇报在AI Open上发表的前沿研究。

 

论坛主席:吴乐(合肥工业大学 教授)

主席简介:吴乐,合肥工业大学计算机与信息学院教授,博士生导师,入选了国家级青年人才计划。主要研究领域包括个性化推荐、可信用户建模、因果推断应用研究等。近五年在知名国际期刊及国际会议发表论文五十余篇。主持科技部新一代人工智能国家科技重大专项、国自然重点基金项目等国家级、省部级及应用合作项目数十项。入选了全球华人AI学者榜单、中国科协青年人才托举工程、微软亚洲研究院铸星学者访问计划等, 获得了吴文俊人工智能优秀青年奖、中国人工智能学会优秀博士论文奖等。吴乐博士担任了AI Open、IEEE Trans. on Big Data等期刊副主编。

 

钱付兰(安徽大学 副教授)

 

主席简介:钱付兰,安徽大学计算机科学与技术学院副教授,硕士生导师,现任中文信息学会社会媒体处理专委会委员、中国人工智能学会粒计算与知识发现专委会委员、教育部研究生教育评估检测专家等。主要研究方向:推荐系统、对抗机器学习,大模型垂直领域应用及其安全风险发现等。主持参与国家级、省部级相关项目10余项,此外作为技术负责人参与多项横向项目及产学研项目。相关研究成果已在TITS、TOIS、TBD、TCSS等国际知名期刊上发表。

 

开场: AI Open期刊介绍

张娟,科爱出版人,负责计算机期刊的管理和运营,熟悉期刊出版流程、同行评议等期刊工作。

 

报告二:


报告嘉宾:杨成(北京邮电大学,副教授)

报告题目:Adaptive negative representations for graph contrastive learning

报告摘要:Graph contrastive learning (GCL) has emerged as a promising paradigm for learning graph representations. Recently, the idea of hard negatives is introduced to GCL, which can provide more challenging self-supervised objectives and alleviate over-fitting issues. In this paper, we aim to offer a more flexible solution to affect the hardness of negatives by directly manipulating the representations of negatives. We first design a negative representation generator (NRG) which (1) employs real graphs as prototypes to perturb, and (2) introduces parameterized perturbations through the feed-forward computation of the graph encoder to match the biases. Then we design a generation loss to train the parameters in NRG and adaptively generate negative representations for more challenging contrastive objectives. Experiments on eight benchmark datasets show that our proposed framework ANGCL significant relative improvement over the best baseline.

嘉宾简介:杨成,北京邮电大学副教授,长期从事数据挖掘和自然语言处理相关方向的研究,发表相关领域CCF A类论文40余篇,谷歌学术被引1万余次,相关成果获2020年教育部自然科学奖一等奖(排名第四)等省部级奖励。曾获中文信息学会优秀博士论文奖,先后入选百度发布的首届“AI华人青年学者百强” 榜单、第九届中国科协“青年人才托举工程”。

 

报告三:

报告嘉宾:张琨(合肥工业大学计算机与信息学院,副教授)

报告题目:融合因果推断的去偏语义理解表示与推理应用

报告摘要:数据驱动的语言模型已经在很多任务上取得了优异的效果,然而数据中存在的固有偏差(虚假关联)信息会被语言模型错误利用,甚至在推理过程中被放大,从而带来模型泛化能力弱,鲁棒性低等问题,制约了语言模型在实际场景中的应用效果。本报告将介绍我们在融合因果推断进行去偏语义理解表示与推理应用方面的探索和尝试,包括如何在表示学习过程中引入因果推断技术、如何利用因果推断消除数据中虚假关联对模型的负面影响、如何利用观测数据实现对语言模型去偏学习效果的有效评估等问题,同时还讨论了大语言模型是否具备了因果推理能力以及如何利用因果推断技术提升大语言模型的推理能力。

嘉宾简介:张琨,博士,合肥工业大学计算机与信息学院副教授,中国中文信息学会青年工作委员会委员。主要研究方向为语义理解与表示、大模型无偏应用和对齐学习,长期从事多模态语义理解、去偏表示学习、基于文本的推荐系统等相关研究。在相关领域国际重要期刊或会议如IEEE TNNLS, TKDE, SIGIR, KDD, ACL, AAAI等发表论文30余篇,获得了CCF推荐A类学术会议KDD'2018最佳学生论文奖;以项目/子课题负责人主持国家基金委、科技部等科研项目多项,入选2021微软铸星学者计划。常年担任相关学术会议和期刊审稿人。

 

报告四:

报告嘉宾:刘永彬(南华大学,副教授)

 

报告题目:百里才:面向医疗领域的检索增强生成框架

报告摘要:为了解决现有开源大型语言模型在医疗领域中的知识局限性和“幻觉”问题。我们提出一个Bailicai框架,Bailicai框架包含四个核心模块:医疗知识注入、自我知识边界识别、DAG式任务分解和RAG模块,分别负责评估查询是否需要外部知识支持、将复杂任务分解为层次化的DAG结构子任务,并通过检索增强生成过程。在医疗知识注入阶段,框架还通过人为添加“Hard Negatives”(无关或虚假信息)来提高模型在利用检索知识时的鲁棒性。通过实验和消融分析,验证了Bailicai框架的有效性,结果显示该框架在多个医疗基准测试中的表现优于现有模型与技术,显著减少了“幻觉”问题,并在处理复杂医疗问题时展现出更高的准确性与效率。

嘉宾简介:刘永彬,南华大学副教授,担任中国中文信息学会社会媒体处理专委会委员,中国中文信息学会-语言与知识计算专委会委员;Data Intelligence(MIT出版社,中科院三区)编委,Big Data Mining and Analytics(清华大学出版社,中科院一区)青年编委;多个CCF推荐国际会议PC(ACL,WWW,EMNLP,COLING,NAACL,CIKM);CCKS 2021-2024大会出版主席。主持和参与国家级项目10余项,发表相关领域论文50余篇。

 

报告五:

报告嘉宾:赵桓幜(清华大学博士后研究员)

报告题目:面向文本属性图少样本节点分类任务的预训练和提示框架

报告摘要:文本属性图(TAG)是现实世界广泛存在的图形结构数据,每个节点都与对应的原始文本相关联。对于TAG,传统的少样本节点分类方法对经过预处理的节点特征进行训练,不考虑原始文本。其性能在很大程度上取决于特征预处理方法。我们提出一个为TAG上的少样本节点分类任务而设计的框架,包括预训练和提示。P2TAG首先在具有自监督损失的TAG上预训练语言模型(LM)和图神经网络(GNN)。为了充分利用语言模型的能力,将掩码语言模型应用于我们的框架。在设计提示时,提出混合图结构和文本信息的提示方法。

嘉宾简介:赵桓幜,清华大学博士后研究员。主要研究方向为图表示学习,长期从事图预训练、社交网络分析、推荐系统等相关研究。

 

报告六:

报告嘉宾:柴子炜(浙江大学计算机科学与技术学院,博士生)

报告题目:基于多智能体技术的多领域专家模型融合与应用

报告摘要:本报告介绍了一种名为"专家令牌路由"的统一通用框架,旨在实现多个专家大语言模型的无缝集成。该框架将专家模型表示为特殊令牌,使主控模型能够灵活调用各专家模型。这种方法不仅能从现有数据中学习专家知识,还支持动态扩展新的专家模型。框架对用户隐藏了复杂的协作过程,提供类似单一模型的交互体验。在多个专业领域的测试中,该框架表现优异,展示了构建通用智能系统的有效性和稳定性。这一研究为多领域专家模型的融合与应用提供了新思路,有望推动大语言模型在更广泛专业领域中的应用和发展。

嘉宾简介:柴子炜是浙江大学(ZJU)的博士四年级学生,同时也是浙江大学DCD实验室AINet研究组的成员。他的研究兴趣包括代码大语言模型以及多智能体协作。

论坛主题:SMP2024  数据挖掘分论坛 - 大模型驱动的图计算

论坛时间:2024年10月13 日14:00-16:00

论坛简介:大模型驱动的图计算——图计算是一种处理图结构数据的计算方法,广泛应用于社交网络分析、推荐系统、生物信息学等领域。而大模型驱动的图计算则是在此基础上,引入了深度学习、自然语言处理等领域的大型预训练模型,以提高图数据处理的效率和准确性。本论坛有幸邀请到来自北京邮电大学、 北京大学、 香港大学、香港科技大学(广州)的专家学者与所有参会者共同探讨大模型赋能图模型探索、新颖的生成图语言模型GOFA、针对图数据的LLMs、大模型显式解决图算法问题等方面的最新研究。

 

论坛主席:杨洋(浙江大学 副教授)

主席1.png

主席简介:浙江大学计算机科学与技术学院副教授、博导、人工智能系主任,国家优青项目获得者。博士毕业于清华大学计算机系,曾访问美国康奈尔大学,与图灵奖得主John Hopcroft教授合作。主要从事面向大规模图数据及时间序列数据的人工智能研究,发表国际顶级学术期刊/会议论文70余篇,获人工智能顶会AAAI 2023杰出论文奖。担任国际期刊IEEE Transactions on Big Data编委、中国中文信息学会社会媒体处理专委会常委以及KDD、WWW、AAAI等国际学术会议程序委员会委员。

 

报告一:

报告嘉宾:石川(北京邮电大学 教授)

报告题目:探索大模型赋能图模型

报告摘要:近年来,将神经网络应用到图数据,形成了图机器学习(以图神经网络为代表)的研究热潮。图机器学习不仅成为人工智能的热点技术方向,而且广泛应用在电商、生物医药等众多领域。随着以ChatGPT为代表的大模型表现出通用人工智能的潜力,也改变了很多领域(如自然语言处理,计算机视觉)的研究范式,同样也对图机器学习产生了重要影响。大模型的关键技术和语言生成理解能力可能有助于解决图模型面临的表达能力受限和结构知识难迁移等难题。本报告将介绍大模型赋能图模型的可能途径,并汇报我们在该方向的初步探索。

嘉宾简介:石川 北京邮电大学计算机学院教授、教育部长江学者特聘教授。主要研究方向: 数据挖掘、机器学习、人工智能和大数据分析。近5年以第一作者或通讯作者在CCF A类期刊和会议发表论文60余篇,中英文专著六部,连续入选爱思唯尔高被引学者;授权发明专利30余项,相关研究成果应用于阿里、蚂蚁、腾讯、华为、美团等公司。研究成果获得电子学会科技进步一等奖和北京市自然科学二等奖等奖项。

 

报告二:

报告嘉宾:张牧涵(北京大学 助理教授)

报告题目:GOFA:一种联合图语言建模的通用生成模型

报告摘要:基础模型,如大型语言模型(LLMs)或大型视觉模型(LVMs),已成为各自领域中最强大的工具之一。然而,与文本和图像数据不同,图数据没有明确定义的结构,这对开发图基础模型(GFM)提出了巨大挑战。例如,目前尝试设计通用图模型的方法要么是将图数据转换为语言格式以进行基于LLM的预测,要么是仍然使用LLM作为辅助来训练图神经网络(GNN)模型。前者可以处理无限任务,而后者则更好地捕获图结构——然而,尚无现有工作能够同时实现两者。在本文中,我们确定了GFM的三个关键理想属性:自监督预训练、任务流动性和图意识。为了满足这些属性,我们将传统的语言建模扩展到图域,并提出了一种新颖的生成图语言模型GOFA来解决问题。该模型将随机初始化的GNN层交错到冻结的预训练LLM中,使语义和结构建模能力有机结合。GOFA在新提出的图级下一个词预测、问答和结构任务上进行预训练,以获得上述GFM属性。预训练模型进一步在下游任务上进行微调,以获得解决问题的能力。微调模型在各种下游任务上进行了评估,展示了在零样本场景中解决结构和上下文问题的强大能力。

嘉宾简介:张牧涵博士,北京大学人工智能研究院助理教授、院长助理,国家优青(海外)项目获得者,北京大学博雅青年学者,北京大学2023级通用人工智能实验班班主任。2015年本科毕业于上海交通大学IEEE试点班,2019年于美国圣路易斯华盛顿大学4年获得计算机科学博士学位,2019-2021年期间曾担任Facebook AI(现Meta AI)研究科学家。主要研究方向为图机器学习和大模型推理。获AMiner评选的2022及2023年AI 2000人工智能最具影响力学者提名。代表作为图神经网络做链路预测的经典算法SEAL(被引用超过2000次),图神经网络用于图分类的早期算法DGCNN(被引用超过1500次),以及图神经网络做多节点预测的Labeling Trick理论(被引用超过200次)。主讲北大《人工智能引论》和《机器学习》课程。

 

报告三:

报告嘉宾:黄超(香港大学 助理教授)

报告题目:针对图数据的LLMs

报告摘要:图数据结构在现实生活中扮演着重要角色,能够生动地描绘实体间的复杂联系和结构依赖性。近年来,图模型的泛化能力备受关注。我们不禁想象,如果能够充分利用大型语言模型(LLMs)来应对这些挑战,会有怎样的可能性? 这正是我们研究的着眼点——开发专门针对图数据的LLMs。我们的策略是设计能够有效编码和推理图结构的LLMs,以把握节点和边之间的复杂关系。通过将语言模型的范式应用于图数据背景,我们旨在深化对图结构的理解,从而实现更强大和可推广的图分析,以解决现实世界中关于数据关系学习的挑战问题。

嘉宾简介:黄超是香港大学计算机科学系和数据科学研究院的助理教授和博士导师。他的研究兴趣包括大型语言模型(LLM)、图学习、推荐系统和时空数据挖掘。他在这些领域的研究论文获得了广泛的认可,被认为是WWW 2023、SIGIR 2023、SIGIR 2022和KDD 2019等会议上最具影响力的论文之一。此外,他的研究成果还入围了WWW 2023、WSDM 2022和WWW 2019等会议的最佳论文奖提名。黄超的学术贡献使他获得了WAIC世界人工智能大会"璀璨明星"称号, 以及"2024年理论计算机和信息科学前沿科学奖"。

 

报告四:

报告嘉宾:李佳(香港科技大学(广州)  助理教授)

报告题目:大模型显式解决图算法问题

报告摘要:本工作提出了GraphWiz,一个专为解决多种图论问题而设计的开源语言大模型。GraphWiz利用一个名为GraphInstruct的数据集,能够为每一个图算法问题生成清晰的推理路径,具有极强的可解释性。而且它在多种图任务上展现出了超越GPT-4的性能。论文深入探讨了训练数据量与模型性能之间的关系,提出了如何优化模型训练及防止过拟合的见解。研究成果表明,特别是在DPO增强后的GraphWiz,在多种图问题任务中的准确性和适应性都有了显著提升,标志着大型语言模型在解决图论问题上的巨大潜力。

嘉宾简介:李佳,香港科技大学(广州) 数据科学与分析学域 助理教授。博士毕业于香港中文大学。他在工业界有多年的数据挖掘工作经历,曾供职于Google和腾讯,获得腾讯2015年度技术突破金奖。其研究目前主要为图数据的大模型,异常检测,图神经网络以及基于图数据的药物发现和医疗健康。他在人工智能与数据挖掘领域顶级会议与期刊发表四十余篇CCF-A论文,如Nature Communications, NeurIPS, SIGKDD, ICML, TPAMI等。他的工作获得2023年数据挖掘顶会SIGKDD Best Research Paper Award,是中国大陆首次获得该荣誉。

 

论坛主题:SMP2024 智能教育分论坛-智能模型助力数字化教育

论坛时间:2024年10月12日14:00-16:00

 

论坛主席:江爱文(教授,澳大利亚国立大学访问研究员

主席简介:江爱文,博士,教授,澳大利亚国立大学访问研究员,现任江西师范大学数字产业学院执行院长。主持完成国家自然科学基金项目3项,江西省自然科学基金3项以及多项重点研发计划项目,发表CCF推荐SCI期刊/学术会议等论文60余篇,主要研究方向为多模态智能信息处理与理解,包括视觉故事/描述生成等,指导学生参加“挑战杯”等重要课外学术科技竞赛获省部级二等奖以上奖励20余次。作为主要完成人,获2018年度江西省科学技术进步奖三等奖1项,2021年第十七批江西省教学成果奖(本科层次)一等奖1项。

 

论坛主席:马杰(西安交通大学电子与信息学部助理教授)

主席简介:马杰,新加坡国立大学联合培养博士,西安交通大学电子与信息学部助理教授,隶属于智能网络与网络安全教育部重点实验室,研究方向为多模态数据挖掘与内容理解、自然语言处理,尤其侧重于教科书问答、大模型在知识图谱上的推理、鲁棒多模态问答。担任CIPS、CCF、CAAI等多个学会的专委会执行委员、IEEE知识工程标准化委员会委员,入选陕西省科协青年人才托举计划,主持国家自然科学基金青年项目、中国移动等国家、企业项目多项。在IEEE TPAMI、IJCV、ICML等高水平国际期刊与会议上发表论文20篇,担任IEEE TIP、TNNLS等国际期刊的审稿人,NeurIPS、ICLR等国际会议的程序委员会委员。主力研发的知识森林AR交互系统获得第二十一届中国国际高新技术成果交易会“优秀产品奖”;指导学生获得第八届“互联网+”大学生创新创业大赛国赛金奖,并获得“优秀创新创业导师”称号。

 

报告一:

报告嘉宾:田媛(华中师范大学教授)

报告题目:基于混合课堂的认知投入多模态量化模型和提升策略

报告摘要:混合课堂是教育心理学和信息技术有机结合产生的全新教学模式,具有形式多样、过程复杂的特点。其中学生的认知投入水平是影响学习效果的关键因素,采取学科交叉视角、依托多模态数据并结合信息化手段对认知投入进行科学量化是实现对其衡量的有效方式,也是实现混合式教学效果提升的重要前提。本报告将基于混合课堂的多阶段、跨学习情境特点,结合心理学行为、认知和真实情境实验等多维度研究方法,揭示混合课堂的认知过程,探索验证相关提升策略的有效性。

嘉宾简介:田媛,华中师范大学心理学院教授,博士生导师,青少年网络心理与行为教育部重点实验室研究员,中国心理学会网络心理专委会委员,中国心理学会咨询注册系统督导师,“微助教”创始人,霍英东教育基金会高等院校青年教师奖获得者,第六届荆楚好老师。研究领域集中于社会性与人格发展、青少年网络心理与行为、网络学习与效果评测,主持两项F0701国家自然科学基金。

 

报告二:

报告嘉宾:于济凡(清华大学助理研究员)

报告题目:大模型赋能的多智能体全AI守护课堂

报告摘要:以ChatGPT为代表的生成式人工智能对教育领域产生了巨大冲击,在为教育创新提供了重大机遇的同时,也受到不同层次的技术与改革挑战,本报告介绍了一个以大语言模型为基底,包含教师、助教、同学等多个智能体的,以AI辅助学生全学习过程的高临场感可配置学习课堂,支持教师的智能化备课上课行为、学生的高水平个性化学习,实现“一人一课堂”的教学过程的“无人驾驶”。

嘉宾简介:于济凡,清华大学教育研究院助理研究员,清华大学水木学者,毕业于清华大学计算机系知识工程实验室,研究领域关注教育人工智能,尤其是大模型驱动的多智能体以及认知评测等课题,在国际会议和期刊上发表30余篇论文,曾获ACL最佳演示论文奖,EMNLP杰出论文奖以及CIKM最佳资源论文提名。

 

 

报告三:

报告嘉宾:宋凌云(西北工业大学 副教授)

报告题目:面向智慧教育的多模态融合与推理

报告摘要:近年来深度学习技术极大提升了计算机自动理解图像、文本、语音等各模态数据的能力。然而,教育领域数据具有视觉特征稀疏、图文关系复杂、学科间数据分布差异大等特点,限制了智慧教育技术的发展和应用。本报告以智慧教育应用中的多模态认知诊断、情绪分析、智能答疑等任务为例,介绍了如何进行教育领域中图、文等不同模态数据的融合与推理的技术。

嘉宾简介:宋凌云,博士毕业于西安交通大学,美国加州大学UCSB访问学者。现为西北工业大学计算机学院副教授,在“大数据管理与存储”工业与信息化部重点实验室。在CCF多媒体技术专委会、CCF信息系统专委会、CCF数据库专委会、CSIG视觉大数据等多个专委会担任执行委员。在CCF A/B类期刊、会议或者中科院1区等著名期刊发表高水平论文40余篇,申请国家级发明专利10余项和软件著作权多项。主持和参与了十余项国家自然科学基金青年、面上和重点项目,科技部重点研发项目课题的执行负责人。担任TIP,TPAMI,TMM, TNNLS等期刊的审稿人,以及ICLR、NeurIPS、ACM MM、AAAI、ACL等顶会的程序委员会委员。担任CCF B类期刊《Frontiers of Computer Science》的青年编委,研究领域为跨模态数据的理解与推理,遥感图像分析、深度神经网络等,所研究技术在智慧城市建设的多个领域有应用,例如智慧教育、智慧金融和智慧农业等。

 

 

报告四:

报告嘉宾:黄振亚(中国科学技术大学 副教授)

报告题目:认知经验启发的大模型推理与智能教育应用

报告摘要:以大模型为代表的生成式人工智能技术为智能教育发展带来了重要机遇。尽管当前大模型技术面向通用场景已经展现出强大的自然语言理解和生成能力,但其在教育领域的直接应用仍存在知识性错误、逻辑性不足等问题,与人类智慧仍有较大差距。本报告将人类的教育认知学习过程与大模型结合,改进大模型推理技术,赋能面向数学教学的智能答疑研究,并分享团队在智能教育应用方面的典型案例。

嘉宾简介:黄振亚,博士,中国科学技术大学计算机科学与技术学院副教授。CCF人工智能与模式识别专委会执行委员。主要研究方向为数据挖掘与人工智能、知识计算与认知推理,智能教育技术与应用等。在相关领域高水平学术期刊(如TKDE、TOIS、计算机学报等)和国际重要学术会议(如KDD、SIGIR、AAAI等)上发表论文50余篇,代表性论文入选ESI高被引论文。获吴文俊人工智能科技进步一等奖,安徽省自然科学二等奖,中国科学院院长奖等,入选2021全球人工智能华人新星百强榜单。担任 IEEE TKDE、 ACM TOIS 等学术期刊审稿人,以及 KDD、NeurIPS、 AAAI、ICML等多个国际会议的程序委员会(高级)委员。

 

论坛主题:SMP2024 特高水平综合期刊论文作者交流专场

论坛时间:2024年10月12日14:00-17:00

论坛简介:在当今快速发展的科研环境下,特高水平学术论文是衡量科研人员水平的重要标准。为了进一步提升我国科研人员的学术素养,推动学术研究的深入发展,SMP2024特别举办关于特高水平综合期刊论文作者交流专场,本次论坛的发言者均为在Nature、Science、PNAS等国际知名期刊发表过论文的杰出学者,他们将在论坛上分享自己的宝贵经验,为参会者提供宝贵的学术资源。我们诚挚邀请各位学者、专家踊跃报名参加,共同探讨学术论文写作、选题与投稿的奥秘,为我国科研事业的繁荣发展贡献力量。期待与您在论坛现场相聚,共享这场学术盛宴!

论坛主席:吴晔(北京师范大学)

主席介绍:吴晔,北京师范大学新闻传播学院教授、北京师范大学计算传播学研究中心主任,全国广播电视与网络视听行业青年创新人才,北京市社会科学基金青年学术带头人,长期从事计算传播学的相关研究。研究成果发表在PNAS、PRE等国际期刊,以参与作者身份在Science上发表学术论文1篇。

报告嘉宾:吕欣(国防科技大学)

报告题目:网络科学研究选题:以应急管理为例

报告摘要:本报告将围绕如何将网络科学应用于管理实践问题,通过结合大数据技术构建大规模社会系统(如人口移动、社交媒体、电话通信)的网络模型,开展自然灾害影响评估与救援、传染病传播风险计算与预测、社会治理政策效果评价等方面的理论和应用研究。

嘉宾简介:吕欣,国防科技大学系统工程学院首席专家/副院长,教授,博士生导师,“对抗性复杂系统智能决策”创新研究群体负责人。主持科技委XX项目、国家自然科学基金、国防基础科研计划等。长期在大数据、复杂网络、应急管理等领域开展前沿研究,相关成果被MIT 综合技术评论列为“全球十大突破性技术”,研究成果发表在Nature(2篇)、PNAS(2篇)、Nature Microbiology、Nature Communications(2篇)、Physic Reports、National Science Review、The Innovation(2篇)等顶级期刊上,得到人民日报、新华社、解放军报(2017, 2020)、科技日报(2020,2021、2022)、BBC(2011,2014,2015,2020)、纽约时报(2011,2020)等高度评价。获世界移动大奖(GLOMO Award),湖南省高等教育教学成果特等奖,国家级教学成果二等奖,深圳市科技进步一等奖,教育部科技进步二等奖,中国仿真学会自然科学一等奖,军队科技进步二等奖。

报告嘉宾:杜占玮(香港大学)

报告题目:计算传染病学的选题与投稿经验分享 

报告摘要:在计算传染病学领域,选择研究主题时应关注热点问题和自身专长。在本讲座中,我将介绍如何进行充分调研后选择合适的方法进行数据处理和分析。同时,我会分享如何在投稿时选择有影响力的期刊、遵循投稿规范、准备稿件材料,以及提高稿件接受率的经验,确保研究成果得到认可和传播。

嘉宾简介:杜占玮博士,现任香港大学公共卫生学院研究助理教授(副研究员、博士生导师),耶鲁大学传染病建模和分析中心和德州大学奥斯汀分校流行病决策科学中心高级研究顾问,深圳市疾病预防控制中心咨询专家,2023年斯坦福大学全球前2%顶尖科学家。从事数据驱动的复杂系统数学建模研究,针对流感、新冠病毒感染、埃博拉等多种传染病的传播动力学进行数学建模,对疾病干预策略进行经济评估。近5年来,以第一作者在The Lancet、Nature Medicine、 Nature Communication、PNAS、The Lancet Public Health等国际权威期刊发表论文50余篇,以参与作者身份在Science、PNAS、The Lancet Global Health、Nature Communications等国际权威期刊发表论文150余篇,获得授权专利7项。在2021年和2023年两度荣获香港大学医学院研究成果奖,2023年作为香港优秀大学教师代表参加在人民大会堂举行的国庆活动,相关研究成果被人民日报、纽约时报和华盛顿邮报报道100余次。

报告嘉宾:胡延庆,南方科技大学

报告题目:人类的群体行为与传播动力学

报告摘要:从有语言开始,信息传播便广泛地存在人类社会活动中。几乎所有的人类群体行为都和信息传播密切相关。理解人类传播信息的基本规律,对理解我们个体本性和社会群体行为的涌现至关重要。本报告将基于数亿人口实际信息传 播行为数据,揭示人群信息传播现象中的基本规律。将阐明流行的社交媒体与理论物理中的渗流相变之间关系,以及相变理论在大规模在线社网络中的一些典型应用。

嘉宾简介:胡延庆,南方科技大学统计与数据科学系,复杂流动及软物质中心,副教授\研究员,博士生导师。2011年毕业于北京师范大学系统科学学院,获得系统理论方向理学博士学位。获得北京市优秀博士论文奖、广东省特支科技创新青年拔尖人才、广东省杰出青年基金等奖励与项目。2011-2013年纽约城市大学Levich Institute 博士后。近几年主要从事大数据、复杂网络、图神经网络等方面的研究。发表论文 70 余篇,包括 Nature Medicine,Nature Physics,Nature Human Behaviour, PNAS,Nature Communications,PRL,PRX等杂志。

报告嘉宾:高见(香港大学)

报告题目:计算社会科学与科学学选题讨论

报告摘要:近年来,大规模数据的积累、人工智能技术的飞跃和新研究方向的涌现,共同推动着社会科学领域向着定量化方向发展。本报告将简要介绍计算社会经济学和科学创新方面的研究和选题,希望与大家一起探讨自然科学和社会科学研究的互动与融合。具体内容将涵盖人工智能促进科学研究、科学与政策互动关系、定性和定量方法相结合等。

嘉宾简介:高见博士,现任香港大学社会科学学院社会工作及社会行政系助理教授,曾任美国西北大学凯洛格商学院博士后研究员和研究助理教授,电子科技大学与麻省理工学院联合培养博士。致力于开展计算社会科学、科学与创新、复杂系统等跨学科交叉研究,以大规模数据分析和人工智能技术为主要工具,定量化地揭示复杂社会经济系统的结构和运行规律,为深入理解科学创新和社会发展提供新视角。研究成果发表在Science、Physics Reports、Nature Human Behaviour、Nature Communications等期刊;被Nature News、Science Magazine、Scientific American、Forbes、中国日报等媒体广泛报道。

 

评测论坛

主席:

北京邮电大学 杨成 副教授

北京交通大学 万怀宇 教授

个人简介:万怀宇,北京交通大学计算机科学与技术学院教授、博士生导师,现任计算机科学与工程系系主任。中国中文信息学会(CIPS)社会媒体处理专委会常务委员。中国计算机学会(CCF)杰出会员、大模型论坛执行委员、智慧交通分会执行委员,国际期刊《Data Intelligence》编委。主要研究方向为时空数据挖掘与知识图谱推理。发表学术论文80余篇,Google Scholar引用5500余次。入选斯坦福大学2022全球前2%顶尖科学家和爱思唯尔2023中国高被引学者名单。曾获中国计算机学会科技进步二等奖(主持)、中国人工智能学会吴文俊人工智能科技进步一等奖、中国航空运输协会民航科技二等奖等奖励。

 

 

流程安排:

  1. 竞赛整体情况介绍(5分钟) 主持人杨成

  2. 竞赛颁奖仪式 (10分钟)主持人杨成

  3. 评测技术报告 主持人杨成

    1. 评测技术报告1:(SMP 2024竞赛季军方案,25分钟)

    2. 评测技术报告2:(SMP 2024竞赛亚军方案,25分钟)

    3. 评测技术报告3:(SMP 2024竞赛冠军方案,25分钟)

  4. 学术报告 主持人万怀宇

报告题目:基于大语言模型的智能图分析技术 (30分钟)

报告摘要:让大语言模型(LLM)具备处理图数据的能力是迈向更高级通用智能的重要一步。然而,目前LLM在图分析上的基准测试要求模型直接基于描述图拓扑结构的提示进行推理,因此仅限于处理节点数量较少的小图。相比之下,人类专家通常会编写程序来解决任务,从而能够轻松处理不同规模的图。在本次报告中,我们将介绍包含三大类图任务的测试基准GraphPro,该基准期望LLM通过编程解决问题,而不是直接对原始输入进行推理。我们的研究结果表明,当前最好的LLM仅能达到36%的准确率。为了解决这一差距,我们进一步构建了LLM4Graph数据集,其中包括六个常用的图计算库文档和自动生成的代码,通过检索增强生成/参数微调的方式能够有效提升现有闭源/开源LLM。


报告人简介:杨成,北京邮电大学副教授,长期从事数据挖掘和自然语言处理相关方向的研究,发表相关领域CCF A类论文40余篇,谷歌学术被引1万余次,相关成果获2020年教育部自然科学奖一等奖(排名第四)等省部级奖励。曾获中文信息学会优秀博士论文奖,先后入选百度发布的首届“AI华人青年学者百强” 榜单、第九届中国科协“青年人才托举工程”,连续入选斯坦福大学发布的全球前2%顶尖科学家榜单。