我们是来是华东师范大学的 CubeNLP 团队,致力于研究自然语言处理和机器学习/深度学习相关的理论。目前的主要研究方向为:信息抽取,自然语言阅读理解,对话生成,知识图谱,实体对齐等。
2024/12
面对未被满足的需求,产学研协同创新填补市场空白、引领产业发展,已成为一种有效机制。针对中国手机企业出海过程中遇到的小语种难题,上海传英公司联合华东师范大学开发了适用于当地小语种的知识问答与对话系统。在此基础上开发的首款非洲定制智能手机实现销售收入逾17亿元,并入选“2023年度最受非洲消费者喜爱品牌”,被称为“非洲手机之王”,已进入非洲、南亚、中东、拉美等70多个国家和地区。
华东师范大学自然语言理解CubeNLP实验室联合中国语言文学系构建了一个高中议论文语义解析数据集,并依托NLPCC 2024向公众提供高质量的数据资源和评测平台。此次评测将有力推动研究者和教师对高中议论文进行深入且精细的语义解析,助力学生在论辩能力与写作素养方面上的提升,为中文教育事业的创新发展注入新活力。
今年我们借助NLPCC 2024的平台,组织了NLPCC 2024-第二届中小学作文语篇逻辑评测与融合任务。与去年相比,今年的评测任务不仅扩展到了影响语篇连贯性的多个单一维度的综合研究,而且还探索了这些因素之间的关系。具体而言,我们新增了作文逻辑错误检测、主题连贯性建模和语篇连贯性评语生成等环节,旨在提供一个高质量的语篇连贯性评估数据资源和评测平台,共同推动中文作文语篇逻辑连贯性研究领域进行更深入的探索和发展。
今年我们继续依托CCL 2024,组织了CCL 2024-第二届中小学作文流畅性评价评测任务。与去年相比,为进一步全面地对作文的流畅程度进行评估,本次评测任务新增作文流畅性评级任务,并在训练集中新增1200条句子,以方便参赛队伍进行更深入的研究,共同推进中文母语作文流畅性智能批改的发展。
今年,我们依托CCL 2024,组织了CCL 2024 中小学作文修辞识别与理解评测任务,包括“中小学作文修辞形式类型识别”、“中小学作文修辞内容类型识别”和“中小学作文修辞成分抽取”三个赛道,为中小学作文修辞理解提供更多依据。
2024/3
陈心豪投稿论文《From Coarse to Fine: A Distillation Method for Fine-Grained Emotion-Causal Span Pair Extraction in Conversation》被 AAAI 2024 接收,提出了一种使用教师模型学习预测话语之间的因果连接词,然后指导学生模型识别细粒度的情感标签和因果范围,而蒸馏方法在RECCON和FG-RECCON数据集上实现了最先进的性能。
2023/10
伍洪意投稿论文《A Multi-Task Dataset for Assessing Discourse Coherence in Chinese Essays: Structure, Theme, and Logic Analysis》被 EMNLP 2023 接收,本文的贡献包括CELCC的开发、进一步研究的基线的建立,以及论证连贯性对话语关系识别和自动论文评分的影响。
2023/10
刘曙投稿论文《CCC: Chinese Commercial Contracts Dataset for Documents Layout Understanding》被 NLPCC 2023 接收,提出了一个面向中文金融合同布局理解的数据集。
2023/7
伍洪意投稿论文《Connective Prediction for Implicit Discourse Relation Recognition via Knowledge Distillation》被 ACL 2023 接收,一种新颖的知识蒸馏关联预测(CP-KD)方法来指导大规模预训练语言模型(PLM)挖掘关联词和话语关系之间的潜在相关性,这对IDRR很有意义.
2023/7
蔡丽投稿论文《An Effective and Efficient Time-aware Entity Alignment Framework via Two-aspect Three-view Label Propagation》被 IJCAI 2023 接收,提出了一个有效且高效的非神经EA框架,即LightTEA,该框架由四个基本组件组成:两方面三视图标签传播、具有时间约束的稀疏相似性、Sinkhorn运算符和时间迭代学习。
2022/10
周浩投稿论文《Prompt-based Connective Prediction Method for Fine-grained Implicit Discourse Relation Recognition》被 EMNLP 2022 (Findings)接收,提出了一种新的基于Prompt的连接词预测方法,指导大规模预训练模型使用与语篇关系相关的知识,并利用连接词和语篇关系之间的强相关性来帮助模型识别隐含的语篇关系。
2022/10
毛鑫投稿论文《LightEA: A Scalable, Robust, and Interpretable Entity Alignment Framework via Three-view Label Propagation》被 EMNLP 2022 接收,对经典的标签传播算法进行了改造,使其能够有效地运行在KGS上,并提出了一种无神经网络的EA框架LightEA。
2022/09
蔡丽投稿论文《A Simple Temporal Information Matching Mechanism for Entity Alignment Between Temporal Knowledge Graphs.》被 COLING 2022接收,提出了一种简单的图神经网络(GNN)模型,并结合时间信息匹配机制,以更少的时间和更少的参数获得了更好的性能。
2022/09
由华东师范大学计算机学院 与 传音控股 联合组建的科研团队 Cube 在2022年全国知识图谱与语义计算大会(CCKS2022) 教科书示意图问答 竞赛中 ,同时荣获二等奖和创新技术奖。
2022/09
由兰曼老师指导,华东师范大学计算机学院与传音公司共同组成的ECNU+TRANSSION队伍参加了全国知识图谱与语义计算大会CCKS2022任务5 “跨语言知识图谱问答评测任务”;本次竞赛中双方人员紧密合作,结合项目经验给出了在跨语言知识图谱上构建问答系统的解决方案,取得了准确率为82.33的好成绩,从119 支参赛队伍中脱颖而出,取得了优胜奖的成绩。
毛鑫投稿论文《An Effective and Efficient Entity Alignment Decoding Algorithm via Third-Order Tensor Isomorphism》被 ACL 2022 接收。该文将三阶张量分解引入到实体对齐任务上,通过数学定义将实体对齐任务领入到更高级别的抽像。
2021/10/15
张甜甜投稿论文《Target-dependent Event Detection: A New Task to Event Extraction from News》被 2021 IEEE International Conference on Big Data 接收。该文创新性地提出目标依赖的事件抽取,使事件抽取任务能给下游的应用带来更多的价值。
2021/09/3
由计算机学院自然语言处理(NLP)团队的兰曼老师指导,郑雨轩等研究生组成的竞赛团队,获得58同城第二届AI算法大赛三等奖。
2021/08/25
毛鑫投稿论文《From Alignment to Assignment: Frustratingly Simple Unsupervised Entity Alignment》被 EMNLP 接收。在基于GNN方法的同构假设下,该文成功地将跨语言的EA问题转化为分配问题,并提出了一个简单有效,不需要神经网络的无监督实体对齐方法(SEU)。大量的实验表明,这一无监督方法在所有的公共数据集上甚至胜过先进的有监督方法,并且具有很高的效率、可解释性和稳定性。
2021/08/14
刘申投稿论文《A Dual-Attention Neural Network for Pun Location and Using Pun-Gloss Pairs for Interpretation》被 NLPCC 成功接收,该文主要解决两个问题:如何高效的解决双关语中的双关词的定位问题,和解决双关词的解释问题。
2021/08/08
毛鑫投稿论文《Are Negative Samples Necessary in Entity Alignment? An Approach with High Performance, Scalability and Robustness》被 CIKM 接收,模型凭借出色的性能,又一次取得了 SOTA 的效果,更好的扩展性和鲁棒性也是该论文的一大亮点。
2021/05/30
由计算机学院自然语言处理(NLP)团队的兰曼和杨燕老师指导,李德健、张甜甜、张亚东、刘申、谭振东五位研究生组成的竞赛团队,获得2021语言与智能技术竞赛:多形态信息抽取任务三等奖。
2021/05/25
由计算机学院自然语言处理(NLP)团队的兰曼和杨燕老师指导,张骏、许伟杰、孙宇翔、顾铭、陈妍五位研究生组成的竞赛团队,通过出色的模型设计和工程实现,获得第八届CCF大数据与计算智能大赛二等奖。
2020/12/11
12月11日,由浦发银行和百度智能云主办、电子商务与电子支付国家工程实验室战略合作的2020“智荟杯”浦发百度高校极客挑战赛落下帷幕。本次大赛面向定向邀请的高校在校学生,共15支高校参赛队进入线下比赛,决出优胜。在计算机科学与技术学院自然语言理解团队的兰曼老师指导下,由李德健、赵尚卿、张甜甜三位研究生组成的算法赛参赛团队经过激烈的比拼,喜获本次大赛三等奖。
2020
京东多模态智能对话 三等奖