我觉得每个集团应该把自己的mertics的定义放到一个最规范的文档里,然后系统页面做成选择题而不是填空题,不然谁知道要填什么?
用promethus+grafana来监控GPU
如果说公司有什么让我割舍不下的,那就是这个tesla T4的GPU
使用向量化embedding来做RAG
就这样吧,我们重新再来过。
搞来了一个GPU服务器来爽爽
kubectl get -A看到的资源,如果使用kubectl describe 却提示不存在,那么要加上-n 对应的namespace就可以看到了
给本地的AI大模型增加模型降级、查询历史、RAG定制文档等功能
我这个是CPU服务器,无法做到多模态注入,有点蛋疼。但是向量化我可以试试。
磁盘管理失败导致node的所有pod被逐出
只有亲自下场动手,才能发现各种奇葩问题
从零搭建一个本地ollama
完整的走一遍,面试的时候可以拿来吹牛逼
当我有了龙虾机器人之后
ai的出现,感觉已经完全不需要SRE了,所以赶紧另谋出路吧。
手动搭一个skill
你有没有想过,为啥ai为啥不能当定时任务?
Agent Skill小白入门蓝皮书
运维这种有经常重复的工作的工种,ai真的能极大的释放生产力