2021年4月15日下午3点,我院在文科楼8楼学术厅召开了语言学系列学术讲座,主题为:自然语言处理与文本挖掘。主讲人为华南师范大学郝天永教授,主持人为李元科副教授。郝教授现任华南师范大学计算机学院教授、博士生导师,现任国家标准化管理委员会TC62委员会副秘书长、中国中文信息学会医疗健康与生物信息处理专委会副主任、中国计算机学会自然语言处理专委会委员、粤港澳大湾区教育发展高等研究院区域教育治理大数据中心主任等。主要研究方向包括自然语言处理、智能问答、机器学习、医学数据挖掘。
郝天永教授
在讲座中,郝天永教授聚焦自然语言处理和文本挖掘两大核心概念,从语料库语言学的角度出发诠释计算机领域的一些方法和技术。郝教授首先对核心概念进行梳理,指出自然语言处理等同于计算机语言学。它是融合语言学和计算机科学的交叉学科,其以处理、分析和理解语言对象为目标。而文本挖掘即文本数据挖掘,是数据挖掘的一种类型。它通过一些自然语言处理工具把非结构化的文本结构化以便进一步分析。另外,郝教授对“数据挖掘”和“数据分析”进行概念区分,并展示了数据挖掘的整个流程、主要步骤、数据挖掘的模型类型以及文本挖掘方法。郝教授也分享了该领域的一些核心学术会议网站资源。其次,郝教授对语言技术领域的研究现状进行了简要的综述,并进一步介绍了信息提取、情感分析、机器翻译这三个研究领域的状况。接着,郝教授生动而具体地阐述自然语言处理领域的一些具体研究任务,如指代消解、词义消歧、自动问答等。随后,郝教授从方法论的角度呈现自然语言处理的工作流程、学习方式,并分享一些自然语言处理工具。最后,郝教授进行工具应用的案例实操展示。
师生认真聆听
在本次讲座的结尾部分,郝教授分享了自己团队所做的英语词汇简化、医学教育领域的可达性分析等方面的创新实验研究,为老师和同学们打开了研究新思路。在最后的互动环节,在场师生踊跃发言,郝教授都耐心地进行解惑答疑。
在座师生踊跃提问
本次郝天永教授的讲座为在场的老师和同学们展示了如何进行自然语言处理与文本挖掘,激发了新的思考,讲座的最后主持人李元科副教授再次致辞感谢郝教授为师生们带来本次精彩的分享,讲座在大家的热烈掌声中圆满结束。
作者/通讯员:林晓曼 | 来源:44118太阳成城集团(中国)有限公司研究生会 | 编辑: 胡艳琪