专业系统
基于云计算成长学习系统
· 2018-11-04 · 玖佰我们在日常生活中经常使用自然语言对话系统,比如苹果Siri。现在的对话系统多数只能做单轮对话,可以帮助用户完成一些简单的任务,如问天气,查股票(如果做多轮对话,也是在单...
详细信息
我们在日常生活中经常使用自然语言对话系统,比如苹果Siri。现在的对话系统多数只能做单轮对话,可以帮助用户完成一些简单的任务,如问天气,查股票(如果做多轮对话,也是在单轮对话的基础上加一些简单处理)。实现这些自然语言对话系统的基本技术可以分为两大类,基于规则的和基于数据的。你也许想知道对话系统的基本原理是怎样的?特别是如何用数据驱动的方式构建一个对话系统?
脉冲神经网络中的神经元不会在每个循环都放电,而是必须在放电之前逐渐积累电压。通常情况下,为在深度学习任务上达到所需的精确度,脉冲神经网络不得不经过多个循环以得到平均结果。这实际上减慢了诸如图像识别或语言处理任务的整体计算速度。
我们可以把自然语言对话分成单轮对话和多轮对话进行研究。单轮对话是基础,也应该是研究的第一个重点。单轮对话可以是基于规则的,或基于数据的。基于数据的方法又可以分成基于检索的方式和基于生成的方式。下面作一简单介绍。
深度学习技术应用于互联网产品,可大大增强用户体验,进一步吸引更多用户,以及由此产生更多的反馈,让我们能够大量收集数据,高效地使用这些数据使得我们有机会训练高度复杂的模型来处理更具挑战的人工智能任务。聚阵系统支持超大规模并行深度学习优化(数据的分布、模型的分布),支持CPU/GPU混合计算、对不同类型数据(如文本、图像、声音等)的优化、丰富灵活的网络类型(如卷积神经网络、递归神经网络等)、各类主流多机优化算法(如SGD, ASGD, LBFGS等)。
随着深度学习在物体识别、自然语言处理领域的应用不断取得突破,未来的深度学习不仅会像人一样去听、去读、去看、去感知,更将会不断地在更大的规模上处理海量的数据;新的计算平台也将会不断涌现(我们相信会有更多为深度学习进行优化的硬件);新的深度学习算法赋予模型更多的意识和主动性,与增强学习的结合,让深度学习将不仅能够识别,而且能够获取高层的知识、进行推理、对外界产生反馈。并行分布式深度学习平台则将贯通数据、硬件、算法,不断推进人工智能的实践。
脉冲神经网络中的神经元不会在每个循环都放电,而是必须在放电之前逐渐积累电压。通常情况下,为在深度学习任务上达到所需的精确度,脉冲神经网络不得不经过多个循环以得到平均结果。这实际上减慢了诸如图像识别或语言处理任务的整体计算速度。
我们可以把自然语言对话分成单轮对话和多轮对话进行研究。单轮对话是基础,也应该是研究的第一个重点。单轮对话可以是基于规则的,或基于数据的。基于数据的方法又可以分成基于检索的方式和基于生成的方式。下面作一简单介绍。
图1 基于检索的对话系统
大量的单轮对话数据存储在索引里,每一个实例包括一个信息和一个回复。用户输入一个信息,检索模块从索引中检索相对相关的信息和回复,并将最适合的回复返给用户,形成一轮对话。而检索系统本身是通过机器学习构建的。
图2是基于生成的单轮对话系统
学习模块利用大量对话数据构建生成模块。当用户给定一个信息时,生成模块针对该信息自动生成一个回复。深度学习技术应用于互联网产品,可大大增强用户体验,进一步吸引更多用户,以及由此产生更多的反馈,让我们能够大量收集数据,高效地使用这些数据使得我们有机会训练高度复杂的模型来处理更具挑战的人工智能任务。聚阵系统支持超大规模并行深度学习优化(数据的分布、模型的分布),支持CPU/GPU混合计算、对不同类型数据(如文本、图像、声音等)的优化、丰富灵活的网络类型(如卷积神经网络、递归神经网络等)、各类主流多机优化算法(如SGD, ASGD, LBFGS等)。
随着深度学习在物体识别、自然语言处理领域的应用不断取得突破,未来的深度学习不仅会像人一样去听、去读、去看、去感知,更将会不断地在更大的规模上处理海量的数据;新的计算平台也将会不断涌现(我们相信会有更多为深度学习进行优化的硬件);新的深度学习算法赋予模型更多的意识和主动性,与增强学习的结合,让深度学习将不仅能够识别,而且能够获取高层的知识、进行推理、对外界产生反馈。并行分布式深度学习平台则将贯通数据、硬件、算法,不断推进人工智能的实践。