请输入关键词...

代表性科研成果及奖励(社会计算)

发布时间:2024-10-24浏览次数:21

代表性科研成果


成果1:LTP语言技术分析平台

链接:https://ltp.ai/index.html

图:


简介(200字):语言技术平台(LTP)提供包括中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注等丰富、 高效、精准的自然语言处理技术。目前基于多任务学习框架进行统一学习,使得全部六项任务可以共享语义信息,达到了知识迁移的效果。既有效提升了系统的运行效率,又极大缩小了模型的占用空间。语言技术平台曾获得“黑龙江省科技进步一等奖”。

 

成果2:“丝路”多语言机器翻译平台

链接



简介(200字):针对中文到斯拉夫语系(俄语、乌克兰语、马其顿语、波兰语、捷克语、斯洛文尼亚语、克罗地亚语、保加利亚语、斯洛伐克语等)翻译过程中存在的翻译质量不稳定、领域适应性差等问题,提出了一套基于底座预训练语言模型、语言聚类训练策略、多语言优化目标、模型架构等四个维度的综合解决方案。通过充分分析斯拉夫语言的内在语言特性及翻译语料的统计特征,提出了多目标自蒸馏策略,解决了多语言数据不均衡带来的收敛不一致性问题;发明了帕累托互蒸馏训练算法,突破了多语言帕累托优化困境;实现了基于梯度冲突的自适应参数分配策略,有效缓解了多语言参数冲突问题。项目成果在新闻、政治、医学、日常、科技、旅游等领域的翻译质量上超过了讯飞、百度翻译等商业系统,达到了全国第一的水平。项目依托于鹏城国家实验室,受到了国家自然科学基金面上项目和黑龙江省重点研发项目的支持。相关成果已发表在ACL、EMNLP、COLING人工智能顶级学术会议。

  

成果3:面向航天科普的大语言模型

链接

简介(200字):面向人民群众对航天科普的热情与需求和航天科普工作对交互形式创新的希冀,提出了基于大语言模型的航天科普问答技术,发明了基于混合粒度查询检索的模型外部领域知识融合方法,实现了支持多轮对话交互的航天科普大语言模型助手,设计了面向文档效用理解的两阶段检索重排流程,扩宽了人民群众获取航天科普知识的路径,增强了群众对我国航天成就的理解与认识,完成了自然语言前沿技术落地到航天科普领域的实践。

  

成果4:面向肝胆胰疾病的人机融合会诊平台

链接

简介(200字):针对我国肝胆胰疾病医疗资源分布不均、部分疑难疾病诊断准确率低的问题,研究类人多轮协商的智能体动态自组织机理和面向诊疗决策生成的人机多方辩论机制,构建多类型、多模态医学知识库,搭建医生、患者和智能体多方的辩论谈判会诊平台及示范应用,通过多智能体决策融合与人机决策协同的辩论技术,代替仅依赖于医生或机器的单一决策策略,基于人机决策融合,实现在肝胆胰相关疾病的疾病诊断的同时输出决策依据,并可提高疑难疾病诊断的准确率,该系统可作为医生辅助决策支持推广至医疗欠发达地区,作为提升区域医疗质量的有效手段。

  

成果5:本草-开源医学大语言模型

链接

简介(200字):针对生物医学领域语言模型训练预料有限导致的大规模语言模型的效果有限的问题,我们提出了一种基于医学知识增强的大型语言模型指令微调方法,一种让通用大模型适配行业并改造成行业大模型的方法。我们首先汇集包含医学知识图谱、知识库等的医学知识,通过自指导的方法进行数据集构建,最后通过指令微调让大语言模型学习相关知识。该方法相比基于医患对话的训练方法显著地提升了回复效果,相关开源仓库在GitHub平台获得超过4200个star,是受关注度最高的中文医学开源大模型。

    

成果6:儿童情感陪伴助手“巧板”

链接

简介(200字):针对青少年成长过程中普遍面临的被忽视和缺乏陪伴问题,研制了智能情感陪伴助手“巧板”系统。该系统基于先进的大语言模型,融合了儿童心理学理论、持续学习技术、可控模型融合技术、角色化代理技术和检索增强技术,具备共情陪伴、情绪疏导、角色化陪伴和中华优秀文化熏陶四大核心功能。“巧板”有效解决了青少年儿童情感支持缺乏的问题,实现了缓解孤独感、守护心理健康和提供个性化沉浸式对话体验的目标,并可以通过引经据典的方式教育孩子,传递中华传统文化。

  

成果7:“活字”通用对话大模型

链接

简介(200字):针对自然语言处理领域中的中文语言理解与生成、跨领域知识整合及智能交互的复杂挑战问题,研制了“活字”通用对话大模型,结合了增量预训练技术,实现了强大的自然语言理解和生成性能,以及卓越的中英文知识问答、数学推理、以及代码生成能力;结合了指令微调和基于人类反馈的强化学习技术,提升了模型指令遵循能力和安全性;采用稀疏混合专家架构,有效提升了计算效率和文本处理速度。

  

成果8:活字-日新

链接

简介(200字):针对现有大语言模型常见的幻觉问题,基于自主研发的的大语言模型检索增强框架和哈尔滨工业大学社会计算与信息检索研究中心研发的活字大语言模型,研发了活字-日新。通过检索多种外源知识并通过拒绝采样和奖励模型打分,赋予了活字检索并利用外源知识的能力,使活字在事实性和时效性问题上的表现有了稳定的提升。实现了基于检索增强的中英文多轮对话。

  

成果9:大词林

链接

简介(200字):《大词林》是一个开放域命名实体知识库自动构建系统,系统从Web搜索结果、在线百科和命名实体字面等多个信息源挖掘命名实体的类别,并从Apriori关联项、后缀上位词、分类层次化和词汇分布表示等多个角度学习获取类别之间的层次化关系。《大词林》以《同义词词林(扩展版)》为骨架,不断添加命名实体及其层次化类别信息,自动构建开放域命名实体知识库。

 

成果10:事理图谱

链接

简介(200字):首创性地提出事理图谱(Eventic Graph, EG)的概念,构建了以事件和事理为核心,事理逻辑关系为边的知识库,解决了现有知识图谱体系性缺失问题,开创了事理图谱的研究方向,填补了知识图谱在事理逻辑知识方面的空白。结构上,事理图谱是一个有向有环图,节点表示事件,有向边表示事件之间的顺承、因果、条件和上下位等逻辑关系。举办了全国首届事理图谱研讨会,2022年,事理图谱作为专业术语被中国计算机学会认证并对外发布。相关成果获得SemEval 2020国际语义评测“检测反事实陈述”任务第一名。

  

成果11:事理知识增强的事件预测

链接

简介(200字): 针对人工智能的事件预测中的事件背景知识不全、事件间逻辑关系缺失,推理路径不透明等问题,提出了事理知识增强的事件预测技术,开发了条件马尔可夫逻辑网络,通过事理图谱来补充事件背景知识,补全事件间的发展链条,实现了高性能的事件推理,并通过还原事件之间的演化关系,实现了深度学习模型的自解释,使得推理可靠且可信。相关成果获得2019年The Story Clozen Test国际评测第一名。

  

成果12:社交媒体智能体态势感知系统

链接

简介(200字):网络社交媒体平台作为思想文化的集散地和社会舆论的放大器,在社会舆情的形成、传播中扮演着重要角色。针对当前社交平台上舆论事件态势发展的碎片化、快速化等特点和社交智能体在舆论传播中扮演越来越重要角色的问题,本研究团队研制了一套舆论事件感知与智能体传播分析系统,挖掘了网络舆情事件发展中热门舆论的传播脉络,呈现了舆论事件中的热门讨论社区,实现了对社交平台智能体的挖掘分析,进一步地计算分析社交智能体集群在舆论事件发展传播过程的具体作用和影响贡献。

  

成果13:社交媒体智能体发帖演练系统

链接

简介(200字):针对复杂网络媒体和突发事件的自主论辩问题,设计了社交媒体智能体发帖演练系统,用于面向突发事件时多智能体自主决策社交交互行为参与事件的讨论,以及社交媒体智能体管理平台,用于维护真实社交账号并与发帖演练联通进行真实场景下的发帖。给定一个话题和参与发帖演练的智能体数量,发帖演练系统可以围绕指定话题生成多智能体的发帖策略及发帖内容,预览发帖效果,同时,社交媒体智能体管理平台通过web平台实现智能体的策略修改与行为管理,将模拟结果发布到真实场景下的社交媒体平台中,实现多智能体协同合作,用于面向突发事件时智能化引导正向舆论。

  

成果14:基于具身智能的展厅讲解机器人

链接

简介(200字):为解放展厅人类讲解员的重复劳动,开发了一款能够自动导览、人机协同半自动导览的展厅讲解机器人。该成果以轮式机器人为载体,实现了一种能够准确判断说话人语音开始与结束的持续录音技术,突破了麦克风录音的时间窗口限制,构建了一个基于大模型提示词技术的人机交互框架,覆盖了展厅场景下的所有用户指令与提问,设计了一种基于父子文档的检索增强技术,提高了检索机器人知识库中的命中率。该攻关课题已立项为哈工大-中移动的重点项目。

  

学术任职

国内外学会任职:

刘挺 中国中文信息学会副理事长

张伟男 中国计算机学会(CCF)理事、术语审定工作委员会执委、CCF哈尔滨分部秘书长

张伟男 中国人工智能学会教育工作委员会副秘书长

张伟男 中国中文信息学会社交媒体处理专委会社交机器人专业组组长

张伟男 黑龙江省计算机学会(HLJCF)学术工作委员会秘书长

秦 兵:中国中文信息学会常务理事/情感计算专委会主任/语言与知识计算专委会副主任

车万翔:中国中文信息学会计算语言学专业委员会副主任兼秘书长

丁 效:中文信息学会社会媒体处理专委会秘书长/常务委员

冯骁骋:中国中文信息学会青年工作委员会副主任/大模型与生成专委会副秘书长

  

国内外期刊/会议任职:

车万翔 ACL 2025 PC Chair

张伟男 ACL 2025 Dialogue and Interactive Systems资深领域主席

张伟男JCR一区SCI期刊《Frontiers of Computer Science》青年预备编委

 

奖励

奖励名称

等级

获奖时间

授予机构

获奖人员

黑龙江省科学技术奖/科技进步奖

一等奖

2024

黑龙江省人民政府

刘挺,秦兵,刘铭,丁效,王士进,张海军,车万翔,伍大勇,赵妍妍,张伟男,冯骁骋

吴文俊人工智能科学技术奖/科技进步奖

二等奖

2020

中国人工智能学会

张伟男,刘挺,陈志刚,秦兵,王栋,车万翔,刘洋,刘权,赵妍妍,梅林海

黑龙江省科学技术奖/科技进步奖

二等奖

2019

黑龙江省人民政府

秦兵、刘挺、赵妍妍、徐睿峰、车万翔、唐都钰、冯骁骋、丁效、袁建华

黑龙江省科学技术奖/科技进步奖

一等奖

2016

黑龙江省人民政府

刘挺、车万翔、胡郁、秦兵、陈毅恒、胡国平、张宇、赵妍妍、马汉君、张伟男、刘一佳

国家科技进步奖

二等奖

2015

中华人民共和国国务院

王海峰,吴华,宗成庆,刘挺,刘洋,姜晓红,刘群,马艳军,胡晓光,何中军

钱伟长中文信息处理科学技术奖

一等奖

2010

中国中文信息学会

刘挺第一完成人