贝叶斯定理:AI 不仅是个理科生 | 赠书

做者 | 量子君算法

来源 | 量子学派(ID:quantumschool)网络

A.I.的背后学习

2015年, AlphaGo与人类围棋天才李世石五番棋决战。测试

第四局,李世石判断黑空中有棋,下出白78挖。大数据

李世石这史诗级的“神之一手”,体现了人类巅峰的直觉、算力和创造力。人工智能


五年过去了,李世石这位天才棋手已经退役。
翻译

AI却在各个智力领域将人类逼得连连败退。设计

2016年,DeepMind又战胜当时世界排名第一的柯洁。blog

2017年,Libratus赢得了德州扑克大战。游戏

2018年,Watson肺癌治疗精确度达到90%超过人类医生。

2019年,A.I.又开始了“深度学习”暴风雨式的革命。

…………

也有人说,天然科学领域A.I.能够打败人类。

但在艺术领域,人工智能它没有办法与人类比肩。

A. I.真的就不懂艺术吗?

即便它写不出《第九交响曲》这样的经典,

难道不能创做出朗朗上口的儿歌?

即便A.I.不能“自由思考主观表达”,

但在艺术上助力人类总能够吧。

A.I.真的不能“主观创造”?

A. I.的思惟方式究竟是怎样的?

A. I.的智能与人类智力到底有何不一样?

要回答这些问题,咱们先要研究“贝叶斯定理”。

由于它是隐藏在A.I.背后的智能基石。

“不科学”的贝叶斯公式

历史有许多天才,生前籍籍无名,死后众人崇拜。

18世纪数学家托马斯·贝叶斯也是其中一位。

“贝叶斯”定理源于解决“逆向几率”问题时写的论文。

在此以前,人们只会计算“正向几率”

什么是“正向几率”呢:

假设袋子里面有P只红球,Q只白球,它们除了颜色以外,其它性状彻底同样。你伸手进去摸一把,摸到红球的几率是多少是能够推算出来的。

但反过来是否也能够计算,咱们能够将它视为“逆向几率”:

若是咱们事先并不知道袋子里面红球和白球的比例,而是闭着眼睛摸出一些球,而后根据手中红球和白球的比例,对袋子里红球和白球的比例做出推测。

这个问题就是逆向几率问题。

通俗地讲,就像一个迷信星座的HR,若是碰到一个处女座应聘者,HR会推断那我的多半是一个追求完美的人。

这就是说,当你不能准确知悉某个事物本质时,你能够依靠经验去判断其本质属性。

这个研究看起来平淡无奇,名不见经传的贝叶斯也未引人注意。

他写的论文直到他死后的第二年,才由他的一位朋友在1763年发表。

明珠蒙尘,就像画界的梵高,画稿生前无人问津,死后价值连城。

为何贝叶斯定理200多年来一直被雪藏,不受科学家待见?

由于它与当时的经典统计学相悖,甚至是“不科学”的。

经典统计学中,数字规律来源于随机取样再行计算。

贝叶斯方法则创建在主观判断基础上,你能够先估计一个值,而后根据客观事实不断修正。

从主观猜想出发,这显然不符合科学精神,因此贝叶斯定理为人诟病。

1774年,法国的大数学家拉普拉斯也看到贝叶斯定理的价值。

不过他知道人类的广泛毛病,老是用传统来反对新思想。

他懒得与人争论,直接给出数学表达:

贝叶斯公式是这样工做的

贝叶斯定理简单优雅、深入隽永。

贝叶斯定理并很差懂,每个因子背后都藏着深意。

它究竟是如何“为人民服务”的呢?

对于贝叶斯定理,参照上面的公式,首先要了解各个几率所对应的事件。

P(A|B)是在B发生的状况下A发生的几率;

也叫做A的后验几率,是在B事件发生以后,对A事件几率的从新评估。

P(A)是A发生的几率;

也叫做A的先验几率,是在B事件发生以前,对A事件几率的一个判断。

P(B|A)是在A发生的状况下B发生的几率。

P(B)是B发生的几率。

而贝叶斯定理的含义也不言而喻:先预估一个“先验几率”,再加入实验结果,看这个实验究竟是加强仍是削弱了“先验几率”,修正后获得更接近事实的“后验几率”。

就知道你没看懂……那仍是举个例子吧!

咱们以COVID-19疫情为例。

假设COVID-19的发病率是0.001,即1000人中会有1我的得病。

某病毒研究所研发出了一种试剂,能够用来检验你是否得病。

它的准确率是0.99。即在你确实得病的状况下,它有99%的可能呈现阳性。

它的误报率是0.05,即在你没有得病的状况下,也有5%可能呈现阳性(也就是医学界使人头疼的“假阳性”)

可怕的事情来了:若是你的检验结果为阳性,那你确实生病的可能性有多大?

这是一个要命的问题,你必定想知道结果,因此你得好好看如下推论。

假定A事件表示生病,那么P(A)为0.001,这就是“先验几率”。

假定B事件表示阳性,那么要计算P(A|B),即检测后对发病率的估计。

P(B|A)表示生病状况下呈阳性,也就是“真阳性”,P(B|A)为0.99。

P(B)是一种全几率,为每个样本子空间中发生B几率的总和。它有两个子状况,一个是没有误报的“真阳性”,一个是误报了的“假阳性”,套用全几率公式后:

一种准确率为99%的试剂,你被检测到呈阳性。

你可能被吓得魂不守舍,人生就这样88了吗?

可在贝叶斯的眼中,这种可信度也不过2%。

缘由无它,5%的误报率在医学界可谓很是高了。

别看表面的数据,咱们要相信贝叶斯的数学结论。

看似冷酷的贝叶斯定理会温柔的安慰你:

别怕,不到2%的几率。

贝叶斯公式取得了人类信任

今天的贝叶斯理论已经开始遍及各地。

从物理学到癌症研究,从生态学到心理学,

贝叶斯定理几乎像“热力学第二定律”同样放之宇宙皆准了。

物理学家提出量子机器的贝叶斯解释,捍卫弦和多重宇宙理论。

哲学家主张做为一个总体的科学能够被视为一个贝叶斯过程。

而在IT界,AI大脑的思考和决策树,更是被工程师设计成了一个贝叶斯程序。

在平常生活中,咱们也常使用贝叶斯公式进行决策,只是本身没有注意到这就是“贝叶斯定理”。

好比咱们到河边钓鱼,根本就不知道哪里有鱼,彷佛只能随机选择,但实际上咱们会根据贝叶斯方法,利用以往积累经验找一个回水湾区开始垂钓。

这就是根据先验知识进行主观判断,在钓过之后增强这种判断,而后下一次进行再选择。

因此,在认识事物不全面的状况下,贝叶斯方法是一种理性且科学的方法。

贝叶斯理论如今被承认主要来源于两件事:

❶《联邦党人文集》做者揭密

1788年,《联邦党人文集》匿名出版,两位做者写做风格几乎一致。其中12篇文章做者存在争议,而要找出每一篇文章的做者极其困难。

两位统计学教授采用以贝叶斯公式为核心的分类算法,10多年的时间,他们推断出12篇文章的做者,而他们的研究方法也在统计学界引起轰动。

❷美国天蝎号核潜艇搜救

1968年5月,美国海军天蝎号核潜艇在大西洋亚速海海域失踪。军方经过各类技术手段调查无果,最后不得不求助于数学家John Craven。

Craven提出的方案一样也使用了贝叶斯公式,搜索某个区域后根据搜索结果修正几率图,再逐个排除小几率的搜索区域,几个月后,潜艇果真在爆炸点西南方的海底被找到了。

2014年初马航MH370航班失联,科学家想到的第一个方法就是利用海难空难搜救的通行方法——贝叶斯定理开始区域搜索。

这个时候,贝叶斯公式已经名满天下了。

贝叶斯定理展现“神迹”


固然,贝叶斯定理名扬天下,主要仍是在人工智能领域的应用。

特别是天然语音的技术识别,让人类见识了A.I.的“思考力”。

人类语言的多义性,能够说是信息里最复杂最动态的一部分。

机器怎么知道你在说什么?

2020年,只要你看到机器翻译的准确性,

你也会感叹这简直就是“神迹”,它们比大部分现场翻译要强得多。

语音识别本质上是找到几率最大的文字序列。

一旦出现条件几率,贝叶斯定理总能自告奋勇。

咱们用P(f|e)区别于以上的P(A|B)来解释语音识别功能。

统计机器翻译的问题能够描述为:给定一个句子e,它可能的外文翻译f中哪一个是最靠谱的。

即咱们须要计算:P(f|e)

这个式子的右端很容易解释:

那些先验几率较高,而且更可能生成句子e的外文句子f将会胜出。

咱们只需简单统计就能够得出任意一个外文句子f的出现几率。

随着大量数据输入模型进行迭代,随着计算能力不断提升,随着大数据技术的发展,贝叶斯定理威力日益凸显,贝叶斯公式巨大的实用价值也愈发体现出来。

语音识别仅仅只是贝叶斯公式运用的其中一个例子。

实际上,贝叶斯思想已经渗透到了人工智能方方面面。

贝叶斯网络,AI智慧的拓展

语音识别,见证了贝叶斯定理的能力。

贝叶斯网络的拓展,则能够看到更强大的人工智能将来。

借助经典统计学,人类已经解决了一些相对简单的问题。

然而经典统计学方法却没法解释复杂参数所致使的现象,例如:

龙卷风的成因,2的50次方种可能的最小参数值比对;

星系起源,2的350次方种可能的星云数据处理;

大脑运做机制,2的1000次方种可能的意识量子流;

癌症致病基因,2的20000次方种可能的基因图谱;

……

面对这样数量级的运算,经典统计学显得力不从心。

科学家别无选择,最终寻找贝叶斯定理给予帮助。

把某种现象的相关参数链接起来,再把数据代入贝叶斯公式获得几率值,公式结网造成一个成因网,即贝叶斯网络,以下图所示:

这也是贝叶斯网络被称为几率网络、因果网络的缘由。

利用先验知识和样本数据,确立随机变量之间的关联,而后得出结论。

一个又一个的节点,一个又一个的几率,都来源于人类的先验知识,有效知识越多,贝叶斯网络展现的力量越让人震撼。

今天一场轰轰烈烈的“贝叶斯革命”正在AI界发生:

贝叶斯公式已经渗入到工程师的骨子里,贝叶斯分类算法也成为主流算法。

在不少工程师眼中,贝叶斯定理就是AI发展的基石。

A.I.的思考方式:无文理之分

读懂了贝叶斯定理,也就基本理解了A.I.的思考方式。

这也是为何“大数据+算法+算力”构成人工智能三要素。

❶大数据,它是A.I.的老师,它教会A.I.成为一个什么样的人。

❷算力,这属于我的能力,长大后的A.I.处理问题时须要的能量。

❸算法,创世主赋予的方法论(天赋),算法越优秀越事半功倍。

从这些核心要素出发,咱们回头来看开头的问题:

A. I.真的不懂艺术吗?

它不能“主观创造”吗?

它在艺术上不能助力人类吗?

答案是否认的,人工智能思惟方式并没有文理之别。

它是个理科生,也是个文科生,仍是个艺术生。

A.I.的思惟基因来源于主观性“贝叶斯定理”,只要有好的数据,机器通过学习,能够创做出经典艺术做品。

当前,“AI+艺术”已经成为新思潮。

法国艺术团队Obvious经过绘画数据创做《爱德蒙德贝拉米》A.I.艺术品,在佳士得拍出432500美圆高价,震惊世人。

AI也能做曲!OpenAI神经网络已经能创做任何流派。2019年,来自澳洲的《绝美世界》得到AI版“欧洲歌唱大赛”冠军,这支歌曲以记念澳洲大火中丧生的动物为背景,以欧洲歌唱大赛歌曲为大数据,交由AI谱曲填词。

知名音乐人Newton Rex谈到:音乐人生充满创意,用正面眼光看待AI在音乐中扮演的角色,音乐教育,人类与AI也能够携手。

A.I.会说出“我思故我在”吗?

从贝叶斯定理出发,工程师认为人工智只能是数学几率,

毫不会产生自由意志;

人们一直相信,AI永远不懂人的爱恨情仇,就像白天不懂夜的黑。

然而,人工智能对艺术的模拟,已经超越大部分人的鉴别能力,

不久未来,AI可能会经过“音乐图灵测试”,

最好的音乐AI与最伟大的音乐教师又有何分别?

也许AI距离在艺术领域大规模的应用尚有差距,

但腾讯在运用AI力量普及艺术教育方面的探索,何尝不是一种很好的探索。

Google自动驾驶汽车的操纵系统;

挑战人类最后智慧堡垒的AlphaGo系统;

腾讯OpenAI在音乐生成方面的新创做;

从贝叶斯网络到神经网络,AI愈来愈像人。

这一切,都创建在在贝叶斯定理的基因上。

若是AI可以创造一首歌,那么它就能成为伟大的音乐教堂。

笛卡尔说出“我思故我在”时,被认为是“人类的觉醒”。

A.I.有一天也会问“我是谁”吗?

若是人类想在底层系统中预设答案。

那么咱们会设定:

你是“具备自由意志的A.I.”,

仍是“你是人类创造的A.I.”。

还想听更多关于数学、AI知识?由量子学派打造的《公式之美》来了!

内容简介:

人类发明数学公式,来描绘浩瀚宇宙和人生百态。世界的繁华秀丽,映托出符号公式的简洁之美。爱因斯坦的质能方程和杨振宁的规范场,摸索出宇宙终极游戏的规则;费马大定理和欧拉恒等式,揭示出宇宙变化背后的数学世界;从凯利公式到贝叶斯定理,逐渐彻底预测人类行为;蝴蝶效应的洛伦兹方程组和三体问题,则告诉咱们数学的界限。

量子学派倾心打造《公式之美》,包含23个广泛、深入、实用的公式,书写天才们探索天然和社会的辉煌历史。

做者简介:

量子学派:是一个专一于天然科学领域(数理哲)的教育平台,其公众号 “量子学派”发布的天然科学类文章阅读量大都是10万+,全国十大科普教育平台。平台推出了一系列深受广大读者好评的课程,包括《数学之美》《逻辑之美》《理性之美》《科学之美》等。

#欢迎来留言#

留言点赞数量最多的前三名

程序人生携手【北京大学出版社】送出

《公式之美》一本

截至9月21日14:00点