榜样的力量——2022年中国科学院院长特别奖获得者:曹江峡

  • 发布者: 刘冬
  • 日期:2023-04-18
  • 2135

【个人简介】 

        曹江峡,2018级直博生,指导教师为王斌老师,协助指导老师为柳厅文老师。在学期间主要研究方向包括图数据挖掘、自然语言处理,关注跨域推荐问题,积极参与实验室多项重点项目的申报和推进。以第一作者身份在SIGIR、ICDE、WSDM、ACL等CCF-A/B会议上发表论文7篇(含共同一作2篇)。

【导师介绍】

 

        指导教师王斌,小米集团AI实验室主任,小米集团NLP首席科学家,在信息检索与自然语言处理方向有20多年的研究经历,培养近百名博士、硕士,获得国家科技进步二等奖1项,省部级科技进步奖3项,发表学术论文200余篇,翻译《信息检索导论》、《大数据:互联网大规模数据挖掘与分布式处理》、《机器学习实战》等经典著作。

         协助指导教师柳厅文,中科院信息工程研究所研究员,博士生导师。长期从事知识图谱及其在内容安全应用研究,研究兴趣包括知识图谱、自然语言处理、网络公害治理、开源情报分析等。是国家重点研发计划青年科学家,中科院青年创新促进会会员。近3年来在WWW、ACL、SIGIR等国际期刊和会议上发表CCF-A/B类论文30余篇,获得省部级科技进步奖1项。

【主要科研学习经历】

        2021年3月,以第一作者身份在WSDM发表长文一篇,该论文从互信息最大化角度考虑二部图的异质性,建模了局部信息和全图信息的相关性。

        2021年9月,以第一作者身份在ECML/PKDD发表长文一篇,该论文使用点过程模型进行动态二部图的交互预测,分别利用动态图的拓扑、时序结构来拟合点过程框架下的静态、动态强度,刻画节点对之间的不同粒度的依赖关系。

        2021年12月,以共同一作身份在ICDM发表长文一篇,该论文保留了霍克斯过程原本的可解释性结构,并利用解耦表示学习思想同时建模多个霍克斯过程,增强了该类模型的时序表达能力和可解释性能力。

        2022年5月,以第一作者身份在ICDE发表长文一篇,该论文首次将信息瓶颈思想引入用户冷启动跨域推荐场景,从理论上推导出了一种领域共享信息学习框架,保证冷启动用户在预测时得到无偏的结果。

        2022年5月,以共同一作身份在ACL发表长文一篇,该论文设计了一种极为高效的插件形式的方法,向中文字级别的预训练语言模型融入词级别信息,在6个不同任务的10个标准数据集上均取得了稳定提升。

        2022年7月,以第一作者身份在SIGIR发表短文一篇,该论文考虑了一个全新任务,商品重叠场景下的多市场的跨域推荐,并通过挖掘市场内、市场间的商品相似度取得了最优的结果。

        2022年7月,以第一作者身份在SIGIR发表长文一篇,该论文首次将解耦表示学习思想引入跨域推荐场景,从信息论角度出发,证明并提出了针对于该场景下的领域共有、特有信息的解耦学习范式。

【经验分享】

        回顾科研学习这几年,属实是好事多磨。

        刚回所时,我一直很迷茫。做什么?怎么做?我都不知道。但我也知道,必须要行动起来,不怕试错!在导师和师兄师姐的耐心指导下,我跌跌撞撞地投出了第一篇文章,期待着录用通知。现实是残酷的,面对接踵而来的一次次拒稿,我很受打击,身心俱疲。那段时间甚至有过七投七拒,我对外调侃自己是“改投自动机”,而内心则满是遗憾和自我怀疑。所以在收到最终的录用通知时,我并没有想象中兴奋,取而代之的是如释重负的复杂心情。

        在这段低谷期,是导师和周围的伙伴推着我前进,让我振作起来。他们多次帮我改论文改到凌晨四点,贴心地准备了“论文不中险”让我“发家致富”。我一直很庆幸自己能在柳老师的组里,在这里我得到了无限的包容和肯定。我也时常怀念与他们讨论新想法、新技术的组会,还有那些不醉不归的深夜,这些时刻总是让我重新燃起对未来的期许。

        在这里,我愿意分享一些感悟,希望能对师弟师妹们有所启发:1)在开始一份工作的时候,反复回答一个问题:这份工作为什么要做?是不是换一个人也能想到?2)了解的技术面要广,及时发现新技术在主攻方向上的潜力。3)理解主攻方向的特有挑战以及相关工作的背后动机,提炼出领域的核心问题,这往往正是一份好的科研工作的价值所在。

        经历了漫长的黑夜,黎明最终刺破了笼罩在我身上的阴霾,低谷过后的连续中稿让我意识到,科研路上,欲速则不达,只需坚持,只需花费时间完成自身的蛰伏沉淀,付出终有回报。