当前位置:

首页 > 新闻公告 >

新闻公告

“语言智能大讲堂”举行“机器学习:从线性到非线性”讲座第四讲

2023-05-26

2023年5月25日上午,四川外国语大学语言智能学院(通识教育学院)、语言脑科学中心和川外学坛联合举办的“语言智能大讲堂”在博文楼401报告厅成功举行。此次学术报告的主题为“机器学习:从线性到非线性”,由重庆大学大数据与软件学院陈静博士主讲。原语言智能学院全体教师、硕博士研究生参加了此次活动。

 

 

在讲座第一部分,陈博士首先短暂地回顾了卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Network, RNN)、长短期记忆神经网络(LongShort-TeamMemory,LSTM)的基础知识。在此基础上,他介绍了双向循环神经网络(BiRNN)及其应用。BiRNN结合了两个循环神经网络,一个网络从前往后处理输入序列,另一个从后往前处理输入序列,这种结构可以捕捉输入序列中前后两个方向的信息,从而提高模型的性能。BiRNN可用于构建语言模型、生成LINUX内核代码以及作词/诗机等。随后陈博士对循环神经网络作了一个简单总结,RNN的优点在于引入记忆和图灵完备,缺点是长程问题和并行能力等方面。另外,陈老师还简单介绍了基于注意力机制的Transformer机器翻译模型。

 

 

在讲座第二部分中,陈博士将话题转向自注意力机制与外部记忆。陈博士首先引入注意力机制这个概念,即过对每一特征层进行全局池化,再到全连接层中找出特征之间的联系,最后得到权重划分。接着,陈博士重点讲解了软性注意力机制(soft attention mechanism)模型,该模型通过计算注意力分布α,再根据α来计算输入信息的加权平均。其中,打分函数的计算可使用加性模型、点积模型、缩放点积模型和双线性模型。最后,陈博士补充介绍了注意力机制的变体:硬性注意力(hard attention)和键值对注意力(key-value pair attention)。

陈静博士的机器学习与深度学习讲座生动形象,他灵活的将理论与实际应用相结合,为老师同学们更好理解并运用这些技术提供了新思路。在后续讲座中,陈博士将继续讲授注意力机制与外部记忆相关的算法和模型。

 

语言智能学院(通识教育学院)

语言脑科学研究中心

川外学坛

2023年5月27日

  • 地址

    四川外国语大学语言脑科学研究中心
  • 电话

    023-65388629
  • 邮箱

    LBRC2017@163.com

© 2019 . All rights reserved. 京ICP备16023589号 四川外国语大学语言脑科学研究中心  版权所有技术支持:网站建设