姓名:李涓子
职称:教授
教育背景
工学学士 (计算机科学与技术), 山西大学, 中国, 1986;
工学硕士 (计算机科学与技术), 山西大学, 中国, 1989;
工学博士 (计算机科学与技术), 清华大学, 中国, 2000.
社会兼职
清华大学计算机科学与技术系软件研究所:党支部书记
中国中文信息学会:专委会主任
清华大学人工智能研究院:知识智能中心主任
下一次搜索联合研究中心:执行主任
研究领域
知识图谱、新闻与社会网络挖掘
研究概况
我于2000年在清华大学获得博士学位,2001年博士后出站后留校工作至今。我的科研工作特点是融合语义Web、文本与社会网络挖掘技术,研究基于语义的内容管理关键技术,并应用于包括新闻、研究者社会网络和Web服务在内的多个领域。主要工作包括:
1. 基于语义的内容管理关键技术。在本体映射研究中,提出基于贝叶斯决策的多策略本体映射模型,解决了多种映射策略的融合问题;提出动态选择的多策略本体映射模型,解决了针对不同本体映射任务,动态选择映射策略的问题,并进一步提高了映射精度。研究成果发表在SIGMOD、Journal of Web Semantics(JoWS)和TKDE等国际重要学术期刊和会议上 。据Google Scholar统计,发表在JoWS上的论文被引用73次。在语义标注研究中,针对标注对象所具有的不同特点,研究不同的语义标注方法,提出基于规则、分类模型和序列模型的条件随机场的三类语义标注方法。这些标注方法已经成功应用于研究者个人信息、会议信息和公司信息的语义标注中,取得了良好的应用效果。上述研究工作得到国家自然科学基金和973项目的支持。
2. 新闻与社会网络挖掘。在新闻挖掘中,提出基于索引树和命名实体的话题发现和跟踪模型、基于话题的新闻分析模型,研究成果发表在SIGIR 2007,并在SIGKDD 2009上做demo演示;在社会网络挖掘研究中,提出面向专家的研究者社会网络搜索模型,并对专家发现、研究兴趣发现和会议挖掘等问题进行了深入研究。
3. 新闻领域XML数据处理应用研究。我是国家标准 “中文新闻信息标识语言(CNML)”(GB/T20092-2006)的第四起草人,并作为项目负责人,承担了CNML标准管理系统的研制任务。目前,该软件部署在新华社文字编辑系统、图片编辑系统、信息部多媒体编辑系统、多媒体数据库、视音频编辑系统、产品生成系统等重要业务系统中,全面满足了技术建设和日常运维的需求。该项目获得“2009年王选新闻科学技术进步二等奖”。
研究课题
国家重点研发计划:融合大数据与人类常识的开放域多语言知识图谱构建(2018-2021)
国家重点基础研究发展计划(973计划):融合三元空间的中文语言知识与世界知识获取和组织(2014-2018)
国家自然科学基金项目:面向大规模多源数据的人物画像和定位分析关键技术(2018-2021)
国家自然科学基金项目:大规模知识关联和文本语义计算方法及应用验证(2016-2020)
国家自然科学基金项目:多语言多模态知识图谱关键技术研究及其应用(2017-2019)
国家自然科学基金项目: 大规模动态本体映射模型研究 (2010-2012)
奖励与荣誉
2017年北京市科技进步一等奖
2013年人工智能学会科技创新一等奖
2013年电子学会自然科学二等奖
2011年王选新闻科学技术进步奖一等奖