算法|中国科学院院士张钹演讲:人工智能产业治理与创新发展( 二 )
计算机提取这张图片的局部特征 , 来马跟其他动物区别开来 , 换句话讲计算机不是提取马本身的语义特征 , 而是提取这张图里(不仅仅是马)所有的底层特征 , 跟其他动物进行比较 , 计算机是用底层特征对动物加以区别 。
所以 , 从原理上来看 , 存在根本性的问题 , 这种处理方法的局限性表现在:处理图像 , 是放在特征向量空间中来处理 , 放在连续数据空间里面进行技术处理 , 进行分类 。
计算机这个分类根本跟“认知”完全不是一码事 。 换句话说 , 计算机不是去“认识”这个马 , 而是用分类的方法把马和其他动物区分开来 。
这个算法本身就是不安全的 , 就是容易受攻击的 , 我们如何克服?
这是我们提出来第三代人工智能的动机 。
发展第三代人工智能包含三个方面的内容:
一个方面的内容是最主要的 , 我们要建立一个可解释的鲁棒人工智能理论 , 人工智能发展至今 , 所以走过非常曲折的道路 , 进展比较缓慢 , 根本的原因就是它没有一个坚实的理论基础 , 这个跟信息科技的发展完全不同 , 信息科技的发展的初期所有理论都建立起来了 , 所以信息科技发展非常顺利 , 一路高速发展 , 因为三大理论 , 图灵机计算理论、通信理论、维纳控制论 , 一个在1936年 , 两个在1948年建立的 , 人工智能缺少这个理论 。
我们必须要建立一个人工智能的理论 , 这是第三代人工智能一个任务 , 这样才有可能开发出来安全可信、可靠、可扩展的人工智能技术 , 这样才有可能推动人工智能的进一步发展 。
如何把知识驱动和数据驱动结合起来 , 充分发挥知识、数据、算法和算力四要素的作用?
为什么把知识放在前头?因为知识对人工智能来讲它的重要性大于数据的重要性 。
我们提出来的“三空间的混合模型” , 意思就是说我们把对语义的处理 , 就是原来符号、知识的处理 , 原来知识处理是离散的符号空间里面来做的 , 这是第一代人工智能做的事情 。
第二代人工智能是把数据放在连续向量空间里面来处理 , 所以 , 这两个空间是相互隔离的 , 没有办法在连续空间里面处理到语义 。
换句话 , 我们没有办法认识在连续空间里的语义 , 比如 , 计算机处理图像 , 是没办法“认出”马 。
如何做这个事情?
我们利用这个模型 , 把这两个离散空间的模型跟连续空间的模型打通 , 打通这个基本是两种方法:
一种方法是把所有处理的都放在一个连续空间里 , 作为向量进行处理 。 这个我们叫做范式一 。
我们看怎么做 , 这是一个博士生做的工作 。
为什么在连续向量空间中间用数据驱动的方法没有办法认识到这个问题的语义 。
计算机怎么区别鸟?不是用鸟的外形 , 来区别鸟跟其他动物的不同 , 只是从中间提取了最明显的特征 , 就是鸟的头部里头有一点发白的这部分 , 用非常局部的特征来区分鸟跟其他的物体 。
这个就产生一个问题了 , 这样的方法是非常容易受到攻击的 。
怎么克服这个问题?
关键的问题是必须要把它加上知识 , 它为什么找不到 , 或者把别的物体看成是鸟 , 因为它根本不认识鸟 , 毫无鸟有关的知识 。
我们现在一种办法做的比较多的 , 包括瑞莱智慧团队做的工作 , 是在原来数据驱动基础上面把相关的知识放到向量空间来处理 , 现在全世界最主流的工作也是这么来做的 。
原来的深度学习方法 , 刚才说过是不安全的 , 很容易受到攻击的 。
如何克服这一点?
我们的办法就是尽可能通过各种各样的途径加上知识 , 这个知识我们也想办法用概率或者向量的方法表达出来 , 这样可以跟原来算法结合起来 。
相关经验推荐
- 算法|兰天马 IT哪个行业的前景比较好?
- 算法|运动健身用什么蓝牙耳机合适,达人亲测的健身用蓝牙耳机
- 三星手机|卷积神经网络,是一种特定类型的ANN,通常基于具有多个算法来分析数据
- 算法|2021年度四大热门产品
- 算法|永华张彬分析:人工智能生成艺术预计将成为NFT领域的下一个趋势
- 算法|人工智能,深度学习,是不是继生化环材之后的第五天坑?
- 软件|国产APP的体积已经超越大型手游APP,里面到底加入了多少大数据算法程序?
- 算法|如何屏蔽 iPhone 日历中的骚扰信息,这个办法亲测可行
- 算法|飞利浦推出新款 Fidelio TWS 和 ANC 耳机
- 算法|教、学、管、考场景下均有AI
