一、背景
多年前看钢铁侠电影的时候, 印象很深的,是钢铁侠的智能虚拟管家,名叫贾维斯,能独立思考,会处理各种事务,钢铁侠的机甲开发创新以及方舟反应炉的换代都离不开它的帮助。那不久之后,siri、微软小冰等一众智能问答机器人面市,到现在的GPT,虽然GPT现在已经非常逆天了,但感觉离真正的私人智能管家,还差点意思,个人认为主要在几个方面:
- GPT属于【通用私人助手】,不能方便地接入私人信息和资料,比如:个人笔记、文档、服务器资源等,不做到真正的【定制化私人助手】
- GPT属于【纸上谈兵】,只会【说】,不会【做】,比如:只能回答问题、写代码,却苦于没有代码执行的载体(服务器),不能执行代码、执行脚本,并做一些自动化的工作等
那么,我们有没有可能基于大模型来打造一个既会【说】、又会【做】的【定制化私人助手】呢?
答案是可以的
二、DevOps我知道,但GPTOps 是啥
DevOps概念深入人心,使得开发过程敏捷、高效、自动化、让团队各个角色都可以从中受益,如果可以基于大模型,利用一系列技术手段, 实现一个智能私人助手:拥有十八般武艺、解决各种问题,实现各种自动化,那么离脱碳入硅(文章见 2017-02-25 脱碳入硅) 、奔向火星的人类理想就又再进了一步,我愿意称之为GPTOps。
三、可以做哪些事情?
初步实现了一版,基础的问答就不赘述了,挑几个【实干】的例子给大家看看
- 私人服务器管理
- 查询硬盘大小(纯查询)
- 查询内存占比情况(查询+计算占比)
- 拉取rabbitmq的docker镜像并启动(shell命令执行)
- 成功启动效果
- 整个操作系统都可以在自然语言的交互形式下,进行操作
- 查询硬盘大小(纯查询)
- 写代码并执行
- 读一读这个政府工作报告(http://www.tzb.sz.gov.cn/xwzx/gzdt/content/post_794540.html),根据里面的信息,告诉深圳市长是谁(爬虫+信息提取)
- 报告原文
- 读一读这个政府工作报告(http://www.tzb.sz.gov.cn/xwzx/gzdt/content/post_794540.html),根据里面的信息,告诉深圳市长是谁(爬虫+信息提取)
- 更多场景(待大家头脑风暴)……
四、不够方便?那就放到手机上
- 结合手机的自动化软件,实现实时语音提问,返回的结果,可以以语音播报、文字、或者发邮箱等等形式呈现
- 以上的所有问题,都可以通过手机语音提问的形式,来进行交互,举个例子如下
- 问题:服务器内存占比
- 回答:服务器内存使用率为35.27%
- 问题:服务器内存占比
五、使用的技术栈
- open-interpreter
- GPT4
- IOS系统快捷指令自动化套件
六、总结
- 有了open-interpreter,基本解决了光说不做的问题,可以让助手自动写代码,并执行返回结果,我相信这个里面大有可为,技术能力在这了,缺的就是创意,希望大家多多头脑风暴,搞点有意思的东西来玩,没准还能孵化个牛逼的产品。
- 有了IOS快捷指令体系,可以让人机交互变得更加友好。管理服务器、装依赖、拉镜像、写代码、也不过就是掏出手机,动动嘴皮子的事情
七、吐槽&后续
- 这一套助手整体用下来还是比较满意的,最大的缺点就是,GPT4太贵(虽然最近官方也降价了)
- 后续可以考虑接入私有大模型,比如百川和千问,但效果大概率没有GPT好。
- 自动化一切,感觉有了新的突破点,更多玩法待继续探索
发表回复