周日的时候,收到反馈,说公司对接的一批设备数据批量失效了。所有人的权限在所有设备上都被取消掉了,这并不是第一次出现用户权限莫名奇妙失效的情况,之前的时候局限于个别人,个别设备。解决方案也很简单粗暴,直接重新下发权限。然鹅,这种大面积失效,用户直接炸锅了。
联系设备厂商,厂商问,有那么着急吗? 用户都炸了,你说能不着急吗?终于中午的时候派了技术过来。下午开始查看设备日志,进行一系列的测试工作。
为了保证用户暂时能用,让研发把所有的设备重新下发了用户权限数据。但是,保留了两台,让他们进行调试以及现场故障排查。在折腾了一下午之后,没有得出神马有用的结论,给其中一台测试设备进行升级固件之后,表示要运行测试一段时间看看效果。看他们暂时也拿不出什么更有建设性意义的方案,暂时于其他人合计先这么处理。跟领导汇报后,领导不认可,要求必须给出问题原因。于是只好带着他们的研发继续去现场进行问题排查。终于,在经历了 4 个小时之后,在十点左右,给出了问题的答案,于下午的结论区别不大:
1.我们删除数据,导致数据出现错乱
2.他们的系统于我们的系统共用出现了数据冲突
3.数据下发过快,导致存储过程出现问题。
对于 1 跟 3 我是极度不认可的,也在群里跟他们据理力争。数据删除是经过确认的单个用户权限删除,并且是通过设备方提供的 mqtt 主题进行数据删除,并没有直接修改设备数据。怎么回导致所有设备六十多台,所有用户的权限集体失效?
数据下发也是通过 mqtt 进行主题发布,设备方订阅消息进行权限处理,有哪里存在速度快慢问题?
至于 2,不知道设备上的数据存储逻辑,不好判断。
终于,又过了一个小时,设备方给回了个可能的原因。平台数据于我们的数据可能存在目录一致性问题,导致数据可能出现加载问题。这个结论相对来说比 13 就靠谱了很多,最起码是可能的诱因,但是依然无法解释在一个时间段所有设备全部失效的问题。
跟各种设备方打交道多了,永远不知道对面的水平到底是如何的。如果不懂技术,那么这几个闪烁其词的理由也就搪塞过去了。但是解决不了问题,在自己要求下,设备方今天安排研发过来进行现场调试。
有时候觉得挺离谱的,到底是哪里来的自信,给出这些不着边际的答案。不由得又让我想到了之前另外一个设备方给的算法,
这些莫名奇妙的自信,真的让人很上火。当然,我也没想到这个死鸭子事件薄能写第二件。当然,以后还有第三件,第四件。
于是,人生就让这些死鸭子给浪费掉了!折腾到 11 点,连《2077》都没来得及玩!艹!
48 comments
甩锅现场
真就死活不认
计算器验算这个梗,我印象深刻,一直忘不了,这种逻辑运算能力羡慕死了。我要是会岂不是,什么编程语言我都可以学会了。
计算器好评啊,跟我算的一样哒
都没日志吗?这些设备做得可真low
有日志,查了半天查了个寂寞
曾经和某软员工对接,其居然不会用java发送http请求。给我也是整懵了。
你教他啊,先这样,再这样
哈哈哈,第二次因为他们破大防了
是的,真是让人无语
2077有那么好玩吗
还行啊,偶尔想起来就玩一会儿。
不过卡关了,boss 打不过,被连续打死好几把了。十几分钟干掉一半血,直接一下把我给劈死,几次都是这个死法。
我感觉我对游戏已经没那么挑剔,或者说很挑剔了。
偶尔玩玩英雄联盟打发时间,以前每个暑假都会过一遍故事模式的 GTA5,现在也不打开了。
手游我只玩消消乐,😂
太难了
可不
是我老了么,v2077是啥, 加密可太秀了-。-
赛博朋克
看完了貌似结论还是只是可能找到原因,买别人的设备就有这种风险,是的话找理由让设备商赔偿呗
是的,厂商的研发现在还没到。还得等着
哎哟,换头像了啊,清晰了很多
换了好几天啦
连自己都不知道自己要什么的甲方、胡言乱语已读乱回的对接方、到处甩锅的责任方、只问进度不问难度的产品、一条改八百遍的需求方、以及总认为我很闲的领导。是不是每一个程序员都能遇到。
这都是标配
最后是哪边背锅
技术到了,研究了半天给了个结论,我依然觉得不是关键
对方主打一个嘴硬
是的
设备下来的时候没有给设备数据做个备份嘛😳
不出事还好 一出事 需要找人 找问题的时候 就开始甩锅了
设备数据我们操作不了,平台数据有备份,接口日志也有。
但是,他们这个排查,排查一通感觉效果一般。不专业。
那就是敷衍你们呗😂
没关系,最后要出书面的情况说明的。
如果这次解决不了,再出问题,下次 10 万的罚单真的就开给他们了。
10万 😳 这个方案不错 哈哈
其他的都没震慑力
我在想1与3是哪位大兄弟想出来的故障原因。
大兄弟为了凑数,瞎编的
有没有可能没查出来,再者必须给出原因的条件,给了概率最大的问题了事
2077是什么?赛博朋克哪个吗?
嗯嗯
又是数据对接问题。我感觉。我也不会整。哈哈。
能找对原因就行啦
死鸭子嘴硬
老硬了
甩锅大侠
是的呢 域名不错 嘻嘻
谢谢谢谢
基本都是这样,实锤了他们才承认😅
的确如此,非得证据甩脸上才认