算法|中国科学院院士张钹演讲:人工智能产业治理与创新发展( 三 )
介绍一些比较简单的工作 , 在训练的时候 , 把对抗样本进行训练 , 告诉计算机 , 这个样本尽管在某些局部特征上跟鸟是一样的 , 但不是鸟 , 我们就用这个对抗样本训练 。
告诉计算机这个知识 , 就是说这个是对抗样本 , 你不可以把它识别为“真的样本” 。 我们可以看到 , 这个加上去是肯定有效的 , 但我们也可以看到这种办法只是治标 , 也就是你告诉他这种对抗样本不是真样本 , 他只对这种对抗样本有识别能力 , 对抗样本换成另外一种形式它就不行了 。
我们正在这方面做的工作 , 清华大学团队瑞莱智慧的很大一部分工作属于这种性质 。 比如我们做的贝叶斯深度学习 , 把贝叶斯的一些相关的知识 , 相关的先验知识、后验约束等等加上去 , 这个做了肯定效果是更好 。 但我们清楚地知道 , 这个办法本身只是治标 。
现在 , 全世界主要的工作沿着这个方向做 , 可以充分发挥深度学习的某些优势 。 因为深度学习它的优势就是可以利用各种各样数学工具 , 在连续空间里面处理的时候很容易用上各种各样数学工具来做处理 。 比如说 , 我们现在做的珠算平台里面很多算法 , 比传统深度学习算法 , 无论在可解释性、鲁棒性上面都有提高 。
但是 , 应该看到这条路也是很艰巨的 。
只能够针对一个特定条件下的特定工具找出一些办法 , 不是彻底解决问题 。
但这条路也必须要走 , 因为对于计算机来做这件事情相对来讲 , 有很多优势 , 就是刚才讲的用连续向量进行处理的话 , 很多数学工具可以用上 , 计算机可以发挥很大的作用 , 但这种方法还是有很长的路要走 。
一个根本解决问题的方法是把这两个空间打通 , 换句话讲 , 人类在图像识别的时候 , 并没有把图像分割来看 。 换句话讲 , 我们告诉计算机这是一个马的图像 , 但计算机并不知道马在哪儿 , 根本也不知道何处有马 , 也就是说“识别马”和“马的图像的分割” , 这两步应该同时做 。
我们现在并没有同时做这个事情 , 不认识马 , 分割马也很困难 。 当我们做图像分割的时候 , 可以把各个部分分割出来 。
“计算机根本不知道马究竟在什么地方?”这个问题怎么来解决 。
回到一个我们现在用的模型的问题 , 我们现在用的人工神经网络 , 跟大脑的神经网络就是视神经网络差别太大了 。 我们缺少了好多东西 , 如果简单前向神经网络只有前向来连接 , 人类大脑里面其他机制没有用上 , 反馈连接、横向连接、注意机制、多模态、记忆等等没有用上 。
没有用上这个缺少什么?缺少一个最大的问题 , 知识和模型 。
人类看马的图像 , 一下子知道马在什么地方 , 为什么?因为认识马 。
我们通过什么手段认识马?是通过无监督学习 , 我们小的时候非常重要的任务就是做无监督学习 , 无监督学习的内容就是要建立你周围常见物体的模型 , 所以 , 实际我们两岁以前有了狗和猫的模型 。 人类认识了猫和狗 , 通过举一反三很容易建立起来马的模型 。 换句话讲 , 我们之所以能够识别马 , 就是因为早已认识马 , 人类的大脑里面留有马的模型 。
现在问题是 , 这个模型在计算机里面怎么建立?
怎么通过无监督的方法进行学习?
这方面我们做了初步工作 , 这也是我们博士生做的工作 , 是主流的方法 。 想办法通过学习 , 把编码在那儿 , 所有马的模型建立在隐变量里面 , 学习了很多马的模型 , 采样隐变量 。 所以 , 实际上这个模型是通过无监督学习或者预训练来建立的 , 目前大家也做了很多工作 。
相关经验推荐
- 算法|兰天马 IT哪个行业的前景比较好?
- 算法|运动健身用什么蓝牙耳机合适,达人亲测的健身用蓝牙耳机
- 三星手机|卷积神经网络,是一种特定类型的ANN,通常基于具有多个算法来分析数据
- 算法|2021年度四大热门产品
- 算法|永华张彬分析:人工智能生成艺术预计将成为NFT领域的下一个趋势
- 算法|人工智能,深度学习,是不是继生化环材之后的第五天坑?
- 软件|国产APP的体积已经超越大型手游APP,里面到底加入了多少大数据算法程序?
- 算法|如何屏蔽 iPhone 日历中的骚扰信息,这个办法亲测可行
- 算法|飞利浦推出新款 Fidelio TWS 和 ANC 耳机
- 算法|教、学、管、考场景下均有AI
