极客时间已完结课程限时免费阅读

结束语|送你一张通往未来“通用人工智能”时代的船票

结束语|送你一张通往未来“通用人工智能”时代的船票-AI大模型之美-极客时间
下载APP

结束语|送你一张通往未来“通用人工智能”时代的船票

讲述:徐文浩

时长09:03大小8.26M

你好,我是徐文浩。
课程到这里,终于要结束了。在去年年底和极客时间定下要写这门课程的时候,我并没有想到 AI 会在过去几个月里掀起怎样一阵滔天巨浪。忽然之间,似乎 AIGC 和大语言模型变成了一个人人都可以参与讨论的话题。连我年近七十的父母昨天晚上也来问我怎么才能用上 ChatGPT,让我一时都有些恍惚。上一次,人人都关心的技术产品,大概还是需要排队才能买到的 iPhone。

虽然谈不上完美,但是它真的有用

尽管这不是我第一次在极客时间上写课程了,而且这一次的内容也比前两次要短一些。但是写一个 30 讲、十几万字课程的过程还是非常煎熬的,特别是这一次有了更多和之前不一样的挑战。
因为 AI 大模型领域每天都在发生新的变化,在整个课程写作的过程中,突发情况层出不穷。比如,因为开源项目的版本升级很频繁,甚至很多升级是不向前兼容的,导致我很多提前写完的稿子不得不二次回炉返工。我早早就写完了第 11 讲,里面介绍了如何使用 llama-index 来分片索引文章,并且让 ChatGPT 能够根据上下文来更准确地回答问题。但是,就在实际连载要发表的前几天,llama-index 就进行了大规模地大升级,所有的 API 接口都发生了变化。所以那几天,我不得不停下来重新修订了一遍对应的内容和代码,避免上线的时候你没法运行成功。
另外,准备演示代码和对应的数据花费的时间也远比预想的要多得多。这个课程几乎每一节课,都有对应的一系列示例代码,其中很多代码都需要拿数据来做演示。为了方便你理解,我还是希望尽可能找到中文的数据案例来做演示。但是因为考虑到数据安全的因素,也没法拿真实商业场景下的数据进行演示。所以不得不想出各种办法,寻找网络上的公开数据、已经过了版权时效的数据,乃至让 ChatGPT 为我们构造数据。最终,也还是避免不了在部分例子里面用英文数据来演示。
更让人有些遗憾的是,随着课程的更新,有很多有趣的项目也慢慢露出了水面,但是时间安排上已经来不及对这些内容进行覆盖了。特别是在大语言模型领域,有很多有趣的项目在过去一两个月特别火爆。比如,有人开发了 AutoGPTBabyAGI 这样的自主智能体(Autonomous Agent)的项目。只要你设定一个目标,提供一系列的工具给 AI,它就能自动自发地制定计划、执行计划,朝着目标迈进。这也让我们真的感觉到摸到了通用人工智能的边。
斯坦福的AI小镇,AI应用开发需要你发挥自己的想象力
之后,斯坦福大学也发表了 Generative Agents 的论文,让我们看到了一个像素风的“西部世界”。让 AI 能够在一个虚拟世界里互相交朋友、开派对。但是当这些项目出现的时候,我们的课程也已经进行到了语音和视觉的部分,没时间再回头重新设计前面大语言模型的应用部分了。前两天,通过 So-Vits-SVC 算法实现的 AI 孙燕姿,更是在国内大火了一把,而这时我们的课程内容其实基本已经完结了。
最近在B站大火的AI复刻孙燕姿的声音到其他歌手的歌里面去
所以说,我们这个课程里有太多有趣而且值得一说的东西没有覆盖到了。不过,和 ChatGPT 一样,虽然并不完美,但是我还是相信它非常有用。在课程的更新过程中,其实就有不少朋友找过来询问各种场景下是否可以通过 AI 来解决问题。而很多时候,我也只需要把课程的一些章节转发给他,就解决了大部分问题。
就像我前面说的,此时此刻的 AI 并不能解决所有的问题,但是已经在很多领域创造了极大的生产力了。这个课程也只是能够带你入门 AI 应用开发,但是这些知识也已经有足够的信息可以帮助你开发出有价值的应用了。

一切才刚刚开始,但是 AI 的时代之船已经起航

如果回头去看一看日历,你就会发现其实 ChatGPT 发布不过才半年,而让所有人大吃一惊的 GPT-4 才不到两个月。包括视觉类型的 Stable Diffusion 模型,其实也才诞生不到 9 个月。但是在喧嚣的互联网世界里,总会给我们带来一种幻觉,就是这一轮的 AI 浪潮已经发生很长时间了。
事实上,AI 对于我们生活真正的渗透才刚刚开始。大部分普通人,现在也还只是简单用了一下 ChatGPT 类的应用,或者只是在各种短视频平台里看到了各种 AI 画画和基于 AI 画画生成的视频而已。
但其实不知不觉间,AI 的时代之船已经在水面之下默默起航了。我在周围已经看到有不少人把这一轮的 AI 技术实际运用在自己的产品乃至于工作中了。有些是使用大语言模型和多模态的视觉基础模型,去优化现有业务的搜索、商品推荐和客服。有些则开发了新的生产力工具,让业务团队可以通过自然语言描述需求,由 AI 自动转化成 SQL 语句生成报表。还有更多的人,则是利用 ChatGPT 帮助自己组织语言、撰写代码、学习知识。
在国内,目前国产大语言模型仍然在努力追赶 OpenAI,所以应用层面尚未爆发。在海外,已经有越来越多的 AI 应用迎来了爆发式的增长。大量原本因为成本结构难以满足的需求,通过当前 AI 强大的能力已经可以满足了。比如,就有人做了一个应用,叫做 DoNotPay。针对高昂的律师费用,提供了“AI 律师”。让 AI 律师给你撰写各类法律文书,比如申诉停车罚单、进行保险索赔等等。
即使在最初的看热闹的情绪过去之后,DoNotPay仍然有百万级别的月度访问量
如果你去一些海外的 AI 应用聚合网站,已经能够看到成千上万的 AI 应用,并且每天都有新的应用冒出来。无论是文本、音频,还是视频,电商、搜索,还是社交媒体,方方面面都覆盖到了。
futurepedia.io 里现在有54个类目下,2518个不同的AI应用
而且,不光是应用层,开源世界里的进展也是一日千里。在 Meta 开源出了自己的大语言模型 LLaMA 之后,越来越多的模型直接被开源了出来。并且从一开始的语言模型和视觉生成模型,扩展到更多的领域。比如前两天,OpenAI 就开源了自己的三维建模的生成式模型 Shap-E。
这里要特别说一下 Meta,虽然 Lecun 老师一边嘴上说着 ChatGPT 没什么大不了的,一边自家的研究团队又不断地放出重磅炸弹。从 LLaMA 到 Segment Anything,从 Segment Anything 到 DINOv2,再到昨天放出的 ImageBind,可谓是好好地展示了一把技术实力,而且所有这些项目全部都是开源的。而整个开源社区也借着这股东风,实现了 Vicuna 等一系列表现不错的“开源 ChatGPT”。
不知道是谁说的,“我们总是高估一年的变化,低估十年的变化”。不过这一次,我周围的技术人,没有谁低估 AI 带来的改变。我不知道这是否是工业革命的开始,但对我来说这是过去 20 年最让人兴奋的变化,远远超出了第一次看到 iPhone 的时候。而且,这一切才刚刚开始,前面还有太多太多的可能性正在等着我们。无论是医疗、法律、编程这样需要生产力的领域,还是视频、游戏这些给人带来欢乐的领域,都有着巨大的使用新一代 AI 技术的空间。但同样地,想要把一小段 Demo 代码变成一个有商业价值的应用,也有巨大的技术挑战需要我们去面对。

面对 AI,少些空想,多去动手

那如何以更好的姿态去面对未来的这些 AI 技术挑战呢?这就需要我们尽早地通过代码,把从课程中学到的知识落地到具体的实践中,高效地把 AI 使用起来。
因为这个课程不是一个理论课程,只是教你一些大语言模型里用到的数学公式,也不是一个 ChatGPT 的使用手册,只告诉你几条可以使用的提示语。这是一门针对工程师的 AI 入门课程,让你可以立刻快速动手把 AI 用起来,自己动手创造一些东西,才是一个工程师天生的宿命。而 AI 在这一次,恰恰又极大地放大了工程师的能力。
可能原本你只会写后端代码,没办法独立开发一个完整的应用。但是现在,你可以通过 ChatGPT 帮助你完成前端应用的开发。也可能,原先你想要写一些能够利用 AI 算法的应用,但是之前可能并不熟悉机器学习。那么现在,你完全可以利用 ChatGPT 的“智能”来完成这样的工作,而不需要单独训练一个机器学习模型。
事实上,在第 12 讲里,我为你演示了一遍通过 ChatGPT 开发新应用的过程。即使你完全不懂某一门编程语言,也完全能够在 ChatGPT 的帮助下完成一个小应用的开发。
当然,这门课程不是你的终点,而是你的起点。无论是你想要做应用开发,还是想要深入研究大模型,做出能媲美乃至超越 GPT-4 的大模型。开源世界和互联网上都有无穷无尽的高质量的教程、资料可以供你参考,有非常多的东西,值得你去学习。
不过,作为一个工程师或者产品经理,千万不要揣着袖子,和大家空谈“AI 对世界带来的变化”。或者只是满足于不断学习新的 AI 知识,最后知道得太多,行动得太少。而是应该尽快卷起袖子,动手做出有价值的产品,让这个世界变得更好。
最后,希望你把这门课程当作你通往“通用人工智能”时代的一张船票,借助它去开启你的航程,同时我也希望和你一起去经历未来十年 AI 给世界带来的惊涛骇浪。
课程结束的今天,希望你可以花几分钟填一下结课问卷,非常期待听到你的声音。

AI技术的快速发展正在改变我们的生活和工作方式。本文作者分享了他在极客时间上写AI课程的经历,以及AI技术在各个领域的应用和开源社区的进展。作者指出,AI技术已经在许多领域创造了巨大的生产力,展示了AI技术的迅猛发展和广泛应用,以及开源社区的活跃和创新。文章强调了通过实践将AI知识落地的重要性,鼓励工程师和产品经理们尽早动手做出有价值的产品,让世界变得更好。作者希望读者将这门课程视为通往“通用人工智能”时代的一张船票,借助它开启未来的航程。文章展望了AI技术的未来可能性,同时提醒读者不要满足于学习新的AI知识,而是要尽快行动,让世界变得更好。

分享给需要的人,Ta购买本课程,你将得20
生成海报并分享
2023-05-15

赞 18

提建议

上一篇
27|从Midjourney开始,探索AI产品的用户体验
下一篇
01|重新出发,让我们学会和AI说话
unpreview
 写留言

全部留言(22)

  • 最新
  • 精选
  • piboye
    2023-05-16 来自广东
    老师,想请教一个东西,我看国内文章分享深度学习的资料都比较喜欢谈数据推导,我想知道是不是要入行深度学习,是不是一定要搞明白数据推导过程?

    作者回复: 个人观点,不一定对,仅供参考。 从实战应用角度,不一定需要。从面试找工作角度,有时候不得不需要。 我比较赞同最近吴恩达老师和李飞飞老师访谈里面的一个观点,就是AI或者说深度学习已经越来越可以和每个人的工作结合到一起了。利用开源模型,或者调用开源代码训练一个属于自己的模型,并不需要数学推导过程。 我自己曾经也花过不少时间看数学公式推导,做过很多练习题。但是的确现在也记不太住了。有用吗?多少有点用,更容易理解原理。特别有用么?我不是做研究发表论文,只是做工程,好像也没多大用。 是否一定要搞明白,取决于你的目标是什么。有精力有能力搞明白,没有坏处。精力有限,目标不是走学术发表论文,不搞明白或者搞个大概明白也没关系。

    共 2 条评论
    2
  • neohope
    2023-05-15 来自上海
    还在坐等AutoGPT,课程就结束了,意犹未尽,感谢文浩老师。 希望ChatGPT+AutoGPT+各种AI+各种非AI工具的组合,能让大家早日迎来新的互联网入口,开启一个新的智能时代。

    作者回复: 加油!这个课程只是个开始,还有太多好玩的东西值得大家去研究和尝试。

    2
  • 水木
    2023-05-16 来自广西
    已学完本专栏所有课程并取得结课证书!

    编辑回复: 真棒👍

    1
  • peter
    2023-05-15 来自北京
    感谢老师的精彩讲解!!! 前面我曾经问了用某个声音唱歌的问题,结束语中提到了“AI孙燕姿”,老师能简单介绍一下是怎么做出来的吗?比如:1 用chatGPT能否做出来?2 如果chatGPT不能,那是否有哪个工具能够做出来?

    作者回复: https://github.com/svc-develop-team/so-vits-svc 一个开源项目,之前其实关注的人不多,被“AI孙燕姿”带火了

  • Santiago
    2023-05-15 来自山西
    学完打卡

    作者回复: 👍

  • Penguin Shi
    2023-08-15 来自广东
    特别好的一门课。我已经四刷了。因为在目前我能碰到的学习课程来看,这是最符合我们这些小白上手的。无论是从广度还是深度。从最开始什么都不懂,懵的。跟着老师的代码,拓展资料,去学去运行,因为一些库的升级,有些代码报错,我去研究LLAMA-INDEX或者langchain官方文档的时候,都是更深入的学习。死磕课程四遍之后,我基本能掌握大模型里面常用的工具的基本用法。后续我还会再学习一遍。我发现,每学一遍,都有不同的收获。真心感谢老师的课程和付出。谢谢。
    展开
    2
  • Realm
    2023-05-17 来自浙江
    感谢老师的辛苦付出,学到很多,多学多练,将知识转成生产力。
    1
  • 方梁
    2024-02-19 来自北京
    学完打卡。
  • Geek_f9f09f
    2023-10-23 来自北京
    感谢老师
  • Geek_5b3cb6
    2023-09-14 来自上海
    完结散花