0%

当我有了龙虾机器人之后

安装龙虾的步骤可以看:https://mp.weixin.qq.com/s/GP_kiOh5XgDzGE8nWR3JtQ 。我直接用的是公司内部的开发服务器和默认的大模型,默认大模型的是豆包,可以换成别的,但是要付钱,其实默认的豆包也挺紧张的,偶尔会出现限流的情况。

我公司对龙虾还是做了比较严格的权限限制,目前只能让它读邮件、写邮件、写飞书文档、飞书表格。至于我看有些人给龙虾淘宝的账号密码让龙虾给它下单,这个在我公司的开发机里是做不到的。

场景1

我的工作有一部分是对mttr>30mins进行分析和改进,而我公司的应急流程是这样的:告警群里收到告警卡片,然后卡片上有“静音”“拉群”等按钮,然后如果接手的话,就直接点击“创建群聊”拉群处理:

然后每次我都要人工进到对应的群里去人工看“告警触发之后的30分钟内都发生了啥,是没人响应?还是找错了人?还是定位工具不会用?”,这里大量是我来人工阅读群信息,是很累的。

有了龙虾之后,这个问题得到了很大的缓解。首先我让龙虾读取我的飞书群信息,然后让龙虾具备飞书文档的读写权限。

我去创建一个多位表格,然后这个把龙虾配置成为表格的“可编辑”者:

这里注意一下,目前龙虾机器人只能支持普通文档和多位表格,传统的表格它还不支持。

有了以上几个能力,于是我就给我的龙虾说了这么一句:

于是它就会吭哧吭哧去阅读故障群里的信息然后总结为啥故障会MTTR大于30并进行归因,这样就不用我人工去读了,极大的节省了我的效率:

然后按照双周或者三天一次的频率,让龙虾去扫描一下新增的故障群就可以增量的得到MTTR>30的归因,方便进一步的制定下一步优化的策略。

场景2

我公司对应用是有进行等级分级的,其中P0是最高级,为了感知应用等级的变化,重点是“新P0应用的出现”和“其他级别的应用升级成P0”,我这里是做了一个离线数据的邮件通知的。

现在有了龙虾之后,我可以在飞书邮箱里配置“满足XXX条件的邮件转发到龙虾对话里”:

然后龙虾就会从邮件里提取出新的P0应用,然后进一步执行我之前给它的skill,skill的内容就是给“新p0应用添加sli相关的告警规则”。

当然你也可以直接给龙虾邮箱的read权限,不过我觉得这种方式比“龙虾定时任务”更清晰一点。

不过缺点就是龙虾用的是团队的额度,如果限流的话就会产出很慢,但是也能忍一忍。

感谢你请我喝咖啡~

欢迎关注我的其它发布渠道