CCAI2017人工智能大会总结

前言

想要快速了解一个行业的现状和瓶颈,最快的方式就是找这个方面的顶尖大咖,听听他们的分享。CCAI人工智能大会正好给我们了解人工智能提供了这样一个平台和入口。

L3的挑战与量产说开

什么是L3? L3是汽车自动驾驶的等级,其等级可简单的描述为

等级 自动化程度
L0 warning only
L1 hands on
L2 hands off
L3 eyes off
L4 mind off

目前大部分的汽车包括tesla只能达到L2的等级,而L3 是社会对自动驾驶的底线,但是现在的L3更多的是一些演示车和示范车

L3的挑战与量产

通过我对李德毅院士分享的理解,L3离大规模的量产还有一段的距离主要有两个原因:

第一个是量产之后如果有存在设计上的缺陷,目前的做法只能是全部召回,不像是软件一样可以通过发补丁包的形式,悄无声息的把所存在的问题给修复掉,这里的成本和代价太大了。

第二个是,对一般人来说cloud computing云计算一定听过很多,但是edge computing却听说的不多,而这也是L3必须面对的问题。什么意思?因为汽车在不确定的环境下行驶,人工驾驶常常会遇到偶发的大雾,大雪等天气,也可能出现地陷,积水等的路面,再说的荒唐点,假如一个十字路口的红绿灯坏了,怎么办,是开是停?假如两辆L3在同时只能有一辆车通过的小巷里遇到,它们又该怎么配合着开出小巷?等等这些情况假如要投入到实际的运用中,都是必须要解决的。

小数据问题的解决手段

任何模型都会遇到数据数量不足的问题,正如L3自动驾驶过程中来到一个红绿灯坏了的十字路口,那么怎么样才能弥补小数据的不足呢?听完整个论坛的分享,我大致归纳出以下2种方式

第一种众包的方式:

正如微软研究员周登勇所说“我们可以通过众包在短时间内以极为低廉的价格获取大量的标记数据”,但是我们需要解决2个问题来解决获得的数据的质量:

第一个是数据标记员质量可能良莠不齐,有的标记员可能会缺乏相关领域的知识。关于这个问题,我们采用一个叫“objective measurement principle”的方式,去客观的衡量每一个数据标记员的水平。

第二个是需要一个有效的奖励机制来激励标记员提高工作质量。而这个公式需要满足两个条件”truthful” ,”no free lunch”。所以我们采用了一个”double-or-nothing”的机制,从最终的结果看效果还是非常明显的。

CCAI2017_Problem

其中C是回答正确的数量,W是回答错误的数量,K是一个预定的常量,比如1,而T是一个信心值比如0.5。

看一个具体的例子![/images/CCAI2017_Problem2.jpg)

第二种深度学习的迁移模型:

深度学习和迁移模型的结合,这个方式有点触类旁通的感觉,而触类旁通的关键是要找出相比较的两者不变量。
目前在这方面的研究成果有:语音识别迁移模型运用到各地的方言识别;通过pivot关键字实现跨领域的舆情分析。

四大主题论坛

人工智能青年论坛

关于人工智能在健康医疗领域的应用

犀牛科技的创始人陈一昕,讲了它遇到的几个问题:
如何处理健康时序数据 。
如何在手机上装载深度学习模型:通过一种矩阵压缩的方式,进行数据压缩。
如何判断慢性病传播规律:通过已有的社交网络数据,你的父母亲戚(来自中国联通),采用链路预测技术实现。

关于人机对话技术

人机对话挑战性的科学问题包括:语义性,逻辑性,一致性,交互性。
分别对应:“内容质量”,“个性,身份,人格”,“主动对话”,“情感感知和表达”。
很多时候,和机器人聊天只能够回答一些问题,却不能和你攀谈下去,聊了一会儿就可以发现对方是机器人了,
怎么办?什么原因?机器人需要有身份和个性的嵌入,这其实是一个交互范式的转变。那么如何做到它,可能的方式有两种一个是基于检索,一个是生成技术。

人-机的智能融合

人工智能和人类是一种合作的关系,不存在人替代机器人,或者机器人替代人的情况。浙江大学计算机学院教授潘纲提出了一个”群体智能:松耦合的人-机智能融合”的概念。正如一款流行的蛋白质折叠游戏”Flod it”的slogan-“Solve Puzzles for Science” ,正如CMU设计的reCAPTCHA系统,将一些OCR软件无法识别的文字扫描向人类求助一样…… 成功案例:央视《挑战不可能》已经实现通过人意念来控制大鼠
CCAI2017_Impossible
这里面的关键问题:生物神经信号的稳定实时获取;神经信号的解码与编码;人脑在回路的计算体系结构;脑机互适应学习

基于人工智能的人机交互

阿里巴巴人工智能实验研究员王刚博士讲了人机交互方式的变迁(DOS,桌面pc,物理按键手机,触摸屏手机),其实是越来越往人的本能方式去发展的,阿里巴巴研发出的天猫精灵也是朝着这个方向去的。背后的技术:自然语言对话技术,强化学习

人工智能科学与艺术论坛

该论坛是清一色的6位女性,她们的分享更多的偏感性,总结下来主要有三方面

第一个是回答了人工智能的艺术创作是否会超过人类。给出的答案是这个是不可能的,因为alphago能战胜人类,是因为在围棋上是有胜负的判定规则的,而在艺术上更多的是个人的喜好,不同的人对一个艺术品的评价是不一样的,即使是同一个人,在不同的情绪下,做出的判断也具有很大的差异性

第二个是回答了假如有便捷的人工智能工具代替老师来教孩子上一些艺术相关的课程,比如钢琴或者吉他,是否会尝试。给出的答案是不会,主要基于两方面考虑,一个是机器教学不能给孩子带来很好的人与人之间的交流和沟通,可能会不利于孩子的成长,另一个是目前市面上的一些人工智能教学工具普遍都比较贵,花费上没有优势。

第三个列举了一些有意思的人工智能与艺术结合的产品:智慧钢琴find,化学圣诞树,液态金属电子电路……等等

语言智能应用论坛

(1)由一个鸡兔同笼的问题,引发的语言智能的讨论?需要关联的知识怎么区分,这个问题有一个隐含的条件,或者说是生活常识”鸡有两条腿,兔子有四条腿”,计算机理解处理问题的时候,如何得知这个背后的条件?
(2)阿里巴巴的蚂蚁云客服的实际应用
(3)要保持语言智能的热度,需要商业化成功来保障,而且需要分工合作:学术研究+平台企业+行业落地企业

智能金融论坛

请的分别是学术界和工业界的代表人物。

金融博弈下的价值学习

在多代理环境下的博弈与学习主要考虑的是对抗性学习(GAN网络,反钓鱼反垃圾邮件)和博弈学习(纳什均衡策略和重复的囚徒困境)。它的未来价值主要体现在市场(竞争性均衡,诚实机制)和应用(搜索广告,折扣设计)两方面。

举例:贝叶斯拍卖,通过学习价值分布,虚拟报价,确定赢家,计算费用等流程行程最优拍卖。

自增强学习

首先是AI的一个短暂历史。90年代的控制论,对已知系统的反馈机制,比如我们发射的卫星,通过远程
控制卫星的运行轨迹,达到人为的检测的目的。然后是2010之前的机器学习时代,它是从大规模的样本中寻找事物之间的静态映射关系,比如脸部的器官识别。接着是2010年以后的增强学习,通过复杂的动态的环境中体验和处理些问题得到的反馈,不断的更新AI算法,比如我们熟知的alphago。

那么开发自增强学习的核心技术又分哪几个步骤呢?

第一步,是状态的将维+特征工程
第二步,是深度学习+增强学习的反馈机制,策略网络+价值网络,这个阶段其实就是模拟人脑的总结归纳能力,第三步,基于非同步大规模并行计算的快速算法,第四步,实时数据收集和在线模拟实验。

个性化推荐和智能分配

个性化推荐的难点:尝试推新和已有经验之间的平衡,新闻的快速更新,非常有限的信息反馈。

个性化推荐的解决方案: Contextual Multi-Armed Bandit算法。

智能分配和定价有几类问题:多个人分享一个物品(拼车),每个人对每个物品有不同的效用函数(人车距离),人和人之间有匹配程度不同(起始地点临近)

分配定价的重要考量:社会总效用(NP-hard问题),公平,稳定。

金融机构从移动时代到智能时代

fdt的创始人的分享

市场挑战:对用户的深入理解(交易用户的用户画像),对产品的穿透力理解(不可以只根据净值来理解一个基金),用户和产品之间的关系(不仅仅是ui的交互上的联系),用户和用户的关系(两个账号是不是同时操作一个资产,这是监管最看重的一个问题),产品和产品之间的拓扑关系;