极客时间已完结课程限时免费阅读

06 数学基础 | 明日黄花迹难寻:形式逻辑

06 数学基础 | 明日黄花迹难寻:形式逻辑-极客时间

06 数学基础 | 明日黄花迹难寻:形式逻辑

讲述:王天一

时长13:03大小5.97M

1956 年召开的达特茅斯会议宣告了人工智能的诞生。在人工智能的襁褓期,各位奠基者们,包括约翰·麦卡锡、赫伯特·西蒙、马文·明斯基等未来的图灵奖得主,他们的愿景是让“具备抽象思考能力的程序解释合成的物质如何能够拥有人类的心智”。
通俗地说,理想的人工智能应该具备抽象意义上的学习、推理与归纳能力,其通用性将远远强于解决国际象棋或是围棋这些具体问题的算法。
要实现这样的人工智能,不可或缺的基础是形式逻辑。人工智能的早期研究者认为人类认知和思维的基本单元是符号,而认知过程就是对符号的逻辑运算,这样一来,人类抽象的逻辑思维就可以通过计算机中逻辑门的运算模拟,进而实现机械化的人类认知。
反过来,形式逻辑也是智能行为的描述方式,任何能够将某些物理模式或符号转化成其他模式或符号的系统都有可能产生智能的行为,也就是人工智能。
人工智能能够模拟智能行为的基础是具有知识,但知识本身也是抽象的概念,需要用计算机能够理解的方式表示出来。
在人工智能中,常用的知识表示方法包括数据结构和处理算法。数据结构用于静态存储待解决的问题、问题的中间解答、问题的最终解答以及解答中涉及的知识;处理算法则用于在已有问题和知识之间进行动态交互,两者共同构成完整的知识表示体系
在人工智能的研究中,用形式逻辑实现知识表示是一种普遍的方法。形式逻辑可谓包罗万象,其最简单的实例就是由古希腊哲学家亚里士多德提出并流传至今的三段论,它由两个前提和一个结论构成:
科学是不断发展的;
人工智能是科学;
所以,人工智能是不断发展的。
亚里士多德的贡献不仅在于证明了人工智能的不断发展,更在于确定了在大前提和小前提的基础上推导出一个结论的形式化过程,这个过程完全摆脱了内容的限制。由此诞生的符号推理给数理逻辑的研究带来了深远的影响
在人工智能中应用的主要是一阶谓词逻辑。谓词逻辑是最基本的逻辑系统,也是形式逻辑的根本部分。谓词逻辑的一个特例是命题逻辑。在命题逻辑中,命题是逻辑处理的基本单位,只能对其真伪做出判断。
但命题这种表示法的局限性在于无法把其描述对象的结构及逻辑特征反映出来,也不能体现出不同事物的共同特征。假如单独给定命题“老李是小李的父亲”,在没有上下文时就无法确定老李和小李之间的关系,这个命题的真伪也就没有意义。
为了扩展形式逻辑的表示能力,在命题逻辑的基础上又诞生了谓词逻辑。谓词逻辑将命题拆分为个体词、谓词和量词,三者的意义如下:
个体词是可以独立存在的具体或抽象的描述对象,比如前文例子中的“老李”和“小李”;
谓词用于描述个体词的属性与相互关系,比如前文例子中的“是... 的父亲”;
量词用于描述个体词的数量关系,包括全称量词 和存在量词
以上三种元素可以共同构成命题。不同的命题之间则可以用逻辑联结词建立联系,由简单命题形成复合命题。按照优先级由高到低排列,逻辑联结词包括以下五种。
否定():复合命题 表示否定命题 P 的真值的命题,即“非 P” 。
合取():复合命题 表示命题 P 和命题 Q 的合取,即“P 且 Q”。
析取():复合命题 表示命题 P 或命题 Q 的析取,即“P 或 Q”。
蕴涵():复合命题 表示命题 P 是命题 Q 的条件,即“如果 P,那么 Q”。
等价():复合命题 表示命题 P 和命题 Q 相互蕴涵,即“如果 P,那么 Q 且如果 Q,那么 P”。
在谓词逻辑中出现的不只有常量符号,变量符号也是合法的,同时还可以出现函数符号。变量和函数的引入拓展了谓词逻辑的表示范围,也提升了其普适性。谓词逻辑既可以用于表示事物的概念、状态、属性等事实性知识,也可以用于表示事物间具有确定因果关系的规则性知识
事实性知识通常使用析取与合取符号连接起来的谓词公式表示,规则性知识则通常使用由蕴涵符号连接起来的谓词公式来表示。在一般意义上,使用谓词逻辑进行知识表示的步骤如下:
定义谓词及个体,确定每个谓词及每个个体的确切含义;
根据所要表达的事物或概念,为每个谓词中的变量赋以特定的值;
根据所要表达的知识的语义,用适当的逻辑联结词将各个谓词连接起来。
经过以上步骤的处理后,抽象意义上的知识就能够转化为计算机可以识别并处理的数据结构。
例如,如果要使用谓词逻辑对“所有自然数都是大于零的整数”进行知识表示,首先要将所有关系定义为相应的谓词。谓词 N(x) 表示 x 是自然数,P(x) 表示 x 大于零,I(x) 表示 x 是整数,再将这些谓词按照语义进行连接就可以得到谓词公式:
使用形式逻辑进行知识表示只是手段,其目的是让人工智能在知识的基础上实现自动化的推理、归纳与演绎,以得到新结论与新知识。就现阶段而言,人类智能与人工智能的主要区别就体现在推理能力上。
人类的判断方式绝非一头扎进浩如烟海的数据中学习,而是基于少量数据的特征进行归纳与推理,以得出的一般性规律作为判断的基础。在数字图像中稍微添加一点干扰就可以让神经网络将海龟误认为步枪,这点伎俩却不能欺骗具有思考能力的人类,其原因也在于此。
人工智能实现自动推理的基础是产生式系统。产生式系统以产生式的规则描述符号串来替代运算,把推理和行为的过程用产生式规则表示,其机制类似人类的认知过程,因而被早年间大多数专家系统所使用。
产生式规则通常用于表示事物之间的因果关系,其基本形式为 。它既可以用来表示在前提 P 下得到结论 Q,也可以表示在条件 P 下实施动作 Q。这里的 P 称为规则前件,它既可以是简单条件,也可以是由多个简单条件通过联结词形成的复合条件;Q 则称为规则后件。
当一组产生式规则相互配合、协同作用时,一个产生式规则生成的结论就可以为另一个产生式规则作为已知的前提或条件使用,以进一步解决更加复杂的问题,这样的系统就是产生式系统。
一般说来,产生式系统包括规则库、事实库和推理机三个基本部分
规则库是专家系统的核心与基础,存储着以产生式形式表示的规则集合,其中规则的完整性、准确性和合理性都将对系统性能产生直接的影响。
事实库存储的是输入事实、中间结果与最终结果,当规则库中的某条产生式的前提可与事实库中的某些已知事实匹配时,该产生式就被激活,其结论也就可以作为已知事实存储在事实库中。
推理机则是用于控制和协调规则库与事实库运行的程序,包括了推理方式和控制策略。
具体而言,推理的方式可以分为三种:正向推理、反向推理和双向推理
正向推理采用的是自底向上的方式,即从已知事实出发,通过在规则库中不断选择匹配的规则前件,得到匹配规则的后件,进而推演出目标结论。
反向推理采用的是自顶向下的方式,即从目标假设出发,通过不断用规则库中规则的后件与已知事实匹配,选择出匹配的规则前件,进而回溯已知事实。
双向推理则是综合利用正向推理和反向推理,使推理从自顶向下和自底向上两个方向进行,直到在某个中间点汇合,这种方式具有更高的效率。
自动推理虽然在数学定理的证明上显示出强大的能力,可解决日常生活中的问题时却远远谈不上智能,其原因在于常识的缺失。对于人类而言,常识的建立是通过社会化的成长过程实现的。
可计算机没办法像人类一样在成长中达成理解,因而常识这一智能的先决条件只能以形式化的方式被灌输到硬盘与内存之中。这要求将一般成年人的知识和信念进行显式的表达,并加以灵活的组织和运用。
可几乎尽人皆知的是,对常识性知识的表达和组织存在着难以想象的困难。从“张三捡起足球”和“张三在运动场上”这两个命题推断出“足球在运动场上”对人工智能来说就已经不可想象,更不用说道德观世界观这些复杂概念。
没有对常识和信念的清晰表达,人工智能就必然陷入混乱的泥沼而无法自拔,获得通用性和适应性较强的智能行为也只能是痴人说梦。
谈论人工智能中的形式逻辑,最终的不可回避的本质问题在于哥德尔不完备性定理
1900 年,德国数学家大卫·希尔伯特在巴黎国际数学家代表大会上提出了 20 世纪 23 个最重要的数学问题,其中的第二问题便是算术公理系统的无矛盾性。
1931 年,奥地利数学家库尔特·哥德尔对这个问题给出了否定的答案,即第一不完备性定理
通过这个定理,哥德尔证明了公理化系统的阿喀琉斯之踵在于对自指的无能为力,下面的语句就是个典型的自指语句:
首先,这个数学命题所讨论的对象不是别的,恰恰是它自己。“本数学命题”就是对整个命题的指代。其次,该命题给出了一个逻辑判断,即这条命题是不可以被证明的。
哥德尔证明了这个命题既不能被证实也不能被证伪,无情戳破了数学公理化系统同时具备一致性和完备性的黄粱一梦。
不完备性定理对人工智能的影响在于对“认知的本质是计算”这一理论基础的理解。从“认知即计算”的角度出发,基于计算机的人工智能如果想要达到近似人类的思维能力,也必须建立起“自我”的概念,这就无疑会导致自指的出现,也将成为不完备性定理的活靶子。
如果计算机能在运算中制造出一个代表自身的符号,那么哥德尔制造悖论的方式就可以在计算机中造出不可证实也不可证伪的飘渺幻境。
在哥德尔不完备性定理的阴影下,基于图灵可计算概念的“认知可计算主义”研究纲领已经显示出其极大的局限。今天,依靠人工神经网络逐渐崛起的连接主义学派大放异彩,与此同时,以形式逻辑为依据的符号主义学派则已经走向没落。
但抛开学术路径的不同,人类智能与人工智能的本质区别到底在哪里,也许这才是不完备性定理留给我们的最大谜团。
今天我和你分享了人工智能必备的形式逻辑基础,以及采用形式逻辑进行自动推理的基本原理,其要点如下:
如果将认知过程定义为对符号的逻辑运算,人工智能的基础就是形式逻辑;
谓词逻辑是知识表示的主要方法;
基于谓词逻辑系统可以实现具有自动推理能力的人工智能;
不完备性定理向“认知的本质是计算”这一人工智能的基本理念提出挑战。
虽然问题多多,但符号主义的思路依然是更接近于人类认知的思路。对形式逻辑的处理能否成为未来依赖小数据学习的人工智能的核心技术呢?
欢迎发表你的观点。
分享给需要的人,Ta购买本课程,你将得18
生成海报并分享

赞 5

提建议

上一篇
05 数学基础 | 万物皆数,信息亦然:信息论
下一篇
(课外辅导)数学基础 | 拓展阅读参考书
unpreview
 写留言

精选留言(13)

  • 听天由己
    2018-01-06
    感谢老师对形式逻辑详尽的解读,今天的核心就是对人类智能与人工智能的讨论,内容还是很烧脑。认知这个词在人类和机器领域有不同的作用,我对这句话印象深刻“认知的本质是计算”,其中有太多的解释与门道了,不可一概而论。 看完了专栏数学基础的部分,有几点想法和老师交流下: 1)专栏的定位是通俗易懂的人工智能基础课,这一方面老师做得很出色,每一块知识都十分详尽,可对于初学者还是有些难以理解,特别是每篇文章都是不同的数学知识,理解和学习起来有一定难度,是否可以在解释概念与术语时添加更多贴近生活的类比? 2)每篇文章结构很完整,增加序号用来概括每一部分的内容会更好,三千字以上的文章在屏读时代可以尽量减少读者的阅读压力; 3)每一部分的数学基础在最后其实可以增加更多趣味性材料或是补充资料可供学习,如果课后的思考问题结合数学知识的生活应用就更好了,这样留言与互动会更丰富,仅从专业问题回答上,我们可能真的不知道如何表达了。 以上,仅供参考。感谢各位的付出。
    展开

    作者回复: 谢谢你的建议,你所提到的一些问题正是计划中下一步的改进方向。 之前和专栏编辑聊天时还提到:对复杂的问题摆一大堆公式很容易,但深入浅出地解释思想就要难得多了。 每篇文章我都尽可能地少用公式,也会举一些贴近生活的实例。但数学毕竟是高度抽象的学科,想要完全做成讲故事的形式难度非常高,而且如果例子举的不当还可能产生误解,所以更加通俗的讲法也还在摸索之中。我想这可能也是理工类学科难以登上《百家讲坛》这类节目的原因吧。 每篇文章后面的问题其实都是开放的,大部分也是我自己思考的问题。问题的初衷是希望能从超技术的角度看待人工智能这个现象,或者人工智能解决问题的思路所带来的启发。在问题的设计上可能需要下更多功夫。 序号的话,其实文末的要点就相当于四个序号了。对于文章内容而言,三千字有时并不算多,加序号就难免将文章切割的太过琐碎。 最后感谢你的认真阅读,也希望和我分享更多的意见建议。

    21
  • eagle
    2018-06-16
    小学教材都已经改了,0也是自然数了

    作者回复: 看来我没能与时俱进……

    7
  • Geek_7389a6
    2020-04-01
    貌似懂了一点人工智能和人类智能的区别,目前看来,人工智能会取代人类智能应该是个伪命题
    2
  • SapereAude
    2019-12-12
    也就是说大学的离散数学是从哲学的逻辑学分支衍生出来的?人的底层逻辑很大程度可以用哲学来抽象?

    作者回复: 前半句没错,后半句涉及自由意志问题,就很难回答了。

    2
  • wolfog
    2018-01-16
    小白一枚,没有使用场景或者当前的人工智能在什么地方用到这些东西,总感觉这些概念或者知识点距自己好遥远。看了三遍甚至也做了笔记可以还是一片混沌。天一老师能否加上使用场景或者案例,这样可能理解起来更容易。

    作者回复: 像线性代数和概率论这些基础数学在人工智能中实际上是无处不在的,数理逻辑目前基本不使用了。在后面介绍具体的机器学习算法时,会尽可能结合实际的问题来介绍。但由于专栏定位是基础课,主要内容还是落在算法的原理上。而真正来自生活的实际案例通常会综合使用多种复杂的方法,要完全说透也不是很容易。

    2
  • djfhchdh
    2020-11-11
    看来人工智能和人类智能的本质区别在于“自我”。仔细想想还挺有哲理的,千百年来,人类对于“自我”的思考一直就没有停止过。。。。。解决不了“自我”的问题 ,人工智能永远也达不到人类智能的水平
    1
  • 上善若水
    2019-10-30
    任何问题本质都是数学问题

    作者回复: 对,但不一定都是形式逻辑的问题,很多真实的复杂问题都是概率性的,不好用形式化描述

    1
  • (^O^☆♪靈夢
    2018-12-11
    我最近读了一本《计算机程序的构造与解释》,里面使用的lisp方言据说就是有符号逻辑的思想蕴含在里面。按照作者的意思,构建一个lisp知识库可以通过eval+apply的方法,是否和这一章有不谋而合之处呢?
    1
  • caocao
    2018-04-02
    在 周志华 老师的《机器学习》中 陆教授的序中谈到 有不少声音 趋向于 形式逻辑 和 符号 结合起来,因为人的 知识或者认知 可以用符号更好的表示,机器学习 又要以 形式逻辑 为基础,所以结合二者的优势,会更理想,可能多了一次从符号 到形式的 翻译过程。 老师 在 对于二者的结合有没有更好的想法,期待老师的分享

    作者回复: 这是趋势,但具体怎么实现,是个非常复杂的问题。

    1
  • qiang.li
    2017-12-23
    形式逻辑的处理应该会成为未来依赖小数据学习的人工智能的核心技术呢,数据达到一定规模就会出现奇怪问题吧!这篇文章确实写得好!

    作者回复: 数据未必会出问题,但人类使用的可不是基于超大规模数据的监督学习这种效率低下的学习方式,而是利用从特殊到一半的推理过程

    1
  • 王美苏
    2022-10-09 来自广东
    一个公理系统称为自洽(或称相容、一致性),如果它没有矛盾,也就是说没有从公理同时导出一个命题及其否定的能力。若一个公理不是一个从系统的其它公理可以导出的定理,则这个公理被称为独立的。若一个系统每个公理都是独立的,公理系统称为独立的。独立性不是一个系统的必要需求,自洽性却是必要的。 一个公理系统称为完备的,若每个命题都可以导出或其否定可以导出。
  • 上善若水
    2019-10-30
    关键不同命题要有关联性
  • 秦龙君
    2017-12-29
    学习了。