【讲座时间】2021年3月30日(星期二)15:00
【讲座地点】工程坊404
【讲座内容介绍】
在大数据时代,数据的样本数量、特征维度和类别数量都在急剧增加,且样本类别间通常存在着层次结构.如何对层次结构数据进行特征选择具有重要意义.近年来已有相关特征选择算法提出.然而,现有算法未充分利用类别的层次结构信息, 且忽略了不同类节点具有共有与固有属性的特点. 据此, 可以利用基于标签关联性的分层分类共有与固有特征选择算法,该算法利用递归正则化对层次结构的每个内部节点选择对应的固有特征, 并充分利用层次结构分析标签关联性, 进而利用正则化惩罚项学习各子树的共有特征. 该模型不仅能处理树结构层次化数据, 也能直接处理更为复杂常见的有向无环图结构的层次化数据. 在 6 个树结构数据集和 4 个有向无环图结构数据集的实验结果验证了该算法的有效性。
【专家简介】
林耀进,闽南师范大学计算机学院院长、教授。1980年10月出生。合肥工业大学博士,天津大学博士后。曾获福建省优秀教师、福建省青年五四奖章、福建省高校新世纪优秀人才、福建省高校杰出青年科研人才等称号。中国人工智能学会粒计算与知识发现专委会委员,福建省人工智能学会副理事长。主要从事大数据知识发现与机器学习的研究,在该领域主持国家自然科学基金2项,参与国家自然科学基金4项,主持省级重大教改项目一项;先后发表论文60多篇,其中被SCI收录30多篇。获福建省科协自然科学优秀论文二等奖1次、福建省教学成果奖二等奖1次。近三年主讲《数据挖掘》、《数据库原理及应用》等本科课程,发表教改论文数篇,教学过程中指导学生参加多种科技及大学生创新创业项目与竞赛,并多次获奖。
【近三年的5篇代表性论文】
[1]林耀进,白盛兴,赵红,李绍滋,胡清华.基于标签关联性的分层分类共有与固有特征选择.软件学报,2021,已录用.
[2]Yaojin Lin, Qinghua Hu, Jinghua Liu, Xingquan Zhu, Xindong Wu: MULFE: Multi-label learning via label-specific feature space ensemble. ACM Transactions on Knowledge Discovery from Data, 2021, Accepted.
[3]Yaojin Lin, Qinghua Hu, Jinghua Liu, Jinjin Li, Xindong Wu: Streaming Feature Selection for Multilabel Learning Based on Fuzzy Mutual Information. IEEE Transactions on Fuzzy Systems 25(6): 1491-1507(2017)
[4]Jinghua Liu, Yaojin Lin, Yuwen Li, Wei Weng, Shunxiang Wu: Online multi-label streaming feature selection based on neighborhood rough set. Pattern Recognition 84: 273-287 (2018)
[5]Changzhong Wang, Yali Qi, Mingwen Shao, Qinghua Hu, Degang Chen, Yuhua Qian, Yaojin Lin: A Fitting Model for Feature Selection With Fuzzy Rough Sets. IEEE Transactions on Fuzzy Systems 25(4): 741-753 (2017) [2]