18|流式生成与模型微调,打造极致的对话体验
18|流式生成与模型微调,打造极致的对话体验
讲述:徐文浩
时长11:57大小10.92M
如何进行模型微调?
来一个擅长写“历史英雄人物和奥特曼一起打怪兽”的 AI
模型微调的成本考量
增量训练,不断优化模型
流式生成
小结
思考题
推荐阅读
利用流式生成和模型微调来打造极致的对话体验是本文的核心内容。作者首先介绍了利用Embedding向量索引和查询索引来解决问题的方法,然后详细讨论了OpenAI提供的模型微调功能。通过提供丰富的垂直领域数据来微调模型,使其擅长特定领域的知识和对话风格。微调后的模型不仅具有微调数据的相关知识,还保留了基础模型的大部分知识和能力。文章还展示了如何利用Python代码和OpenAI工具来准备微调所需的数据,并通过命令行工具进行微调模型的操作。此外,还介绍了微调模型的成本考量和增量训练的方法,以及如何在已经微调了的模型上根据新数据做进一步微调,不断优化模型。通过本文,读者可以了解如何利用现有工具和技术,打造符合特定需求的对话体验,为相关领域的应用提供了有力支持。
赞 26
提建议
全部留言(22)
- 最新
- 精选
- 金2023-04-18 来自广东只要能加载微调后的模型,是不是就可以不用openai了?
作者回复: 这一讲的微调后的模型还是在OpenAI的云端的。基于开源模型自己用GPU微调,才能不使用openai。
共 2 条评论6 - weiwei2023-04-20 来自浙江徐老师,我们AI部门主要做 “异常数据检测”业务。就是离线把金融的异常数据捕获出来。 之前这块是用规则引擎+人工审核来做的,人力成本挺大。 这块业务,理论上能用fine tunning模型来做吗?
作者回复: 这个有专门的策略和算法啊,可以看看 anomaly detector 类型的策略和算法。 可以看看kaggle比赛里面大家的解决方案找找思路? https://www.kaggle.com/ealaxi/paysim1
2 - Oli张帆2023-04-18 来自北京从成本的角度看,微调是不是更适合用来做意图分析的分类任务?我这样想的理由是,因为分类任务相对简单可以用比较便宜的模型来微调,第二,训练好之后,每次调用不必发大量context的提示,这样消耗的token会少很多。请老师指正。
作者回复: 我个人主观的感觉是,更适合垂直领域的应用。比如你有大量的法律类的文书、金融类的文书等等,单独微调一个模型给自己用。 能够承受相对高成本,并且有大量垂直语料的应用看起来比较合适。 只是意图分析,我觉得不太需要微调语言生成模型,自己训练一个分类模型就好了。
2 - 朱朱2023-05-16 来自浙江老师,请教下,微调之后的模型在 openai 的云端会存在多久,我直接用您微调后的模型,提示无法找到了
作者回复: 微调后的模型,不删除一直会在云端。但是每个人的模型是隔离的呀,你肯定是调用不了我微调的模型的。你需要自己微调一个才能调用。
共 3 条评论1 - 蔡雪钧2023-05-08 来自北京如果用 A,B,C三个垂直领域的数据做模型微调,那么微调后的模型是同时增强了A,B,C三块的能力么?比如把数理化的题喂给大模型,后面大模型是不是数理化整体都会变强?
作者回复: 是的,但是也有overfit过拟合导致其他方面能力变弱的风险。
1 - 一叶2023-04-17 来自中国台湾老师,问下,Langchain的流式生成似乎不支持迭代的显示方式,好像是通过callback来实现,但是这样在开发web的时候似乎就没办法做成应用了
作者回复: Callback一样可以啊。你在前端和后端建立一个Websocket,然后后端拿到Callback之后往前端Push消息就可以了。
共 2 条评论1 - stg6092023-04-19 来自浙江stop到底是怎么发挥作用的?一遇到stop的字符就停止生成了?如果我们喂给它的csv数据中就有很多. 会怎么样?
作者回复: 一遇到就停止生成 你可以试一下,那样的话,预处理过程生成的 stop word 会变
- 莱森2023-04-18 来自四川可以请教一下老师如果用了链式调用,怎么样才能更好地实现流式生成呢?
作者回复: 可以参看官方文档关于 Stream Response的支持 https://python.langchain.com/en/latest/modules/models/chat/examples/streaming.html
- Warren2023-04-17 来自广东在这一讲生成数据的时候,我们一条条去生成故事特别慢,而且每个组合的故事都要生成三条,特别消耗 Token。你想想这部分的代码,如何根据之前学到的内容优化一下呢? 是不是可以把completion接口的n设为3,一次返回3个故事,可以减少提交的token?
作者回复: 这是一种方式,还有更多的办法。
- zhihai.tu2023-04-17 来自上海能不能联动tts,把故事实时播报出来。
作者回复: 当然可以啊,后面20讲会讲解如何接入TTS