AI与职业
第一次看到文生图这件事,我觉得很诧异,近乎于魔法。短短几年,后面文生图又遍地开花,文生视频、音色、音乐,不可想象。这是我能理解的,最主流与持久的职业方向,完全超过了原来理解的ar,能支持我的职业穿越下一个周期。当时就在想,怎么参与进去呢?
各个模型的迭代与训练,这个门槛已经被拉的很高,已经不是我能进入的了,跟现在的大厂后端一样。作为辅助,怎么加入进去混口汤?我觉得midscene就是一个很好的答案。
我觉得加入ai这件事分成了3块。
第一块是大模型,这个已经被各个叫得上号的公司,迭代的近乎疯狂,几个月就是天翻地覆了,这个对测试来说,只是纯黑盒的发动机,不用关注了,出了牛逼的换就行。ollama本地部署一个,就是一行命令的事。
第二块选测试框架,来操作各个设备。midscene用的是playwright或者puppeteer那种,pc端的js测试框架。H5得换成uiautomator2(还不确定是否合规)。如果用在其他地方,换成对应的即可。
第三块是得重写一个agent,来让前两者交互。这一点原来看起来天方夜谭,但是已经有人做出来了,就像是一条未知的路,上面迷路被人吹开了。还是开源的。我以前从没觉得字节的人有啥好,破工牌天天挂脖子上秀,现在确实刮目相看,特别是顶部的技术佬。
我为什么觉得这个agent肯定能写出来,有2个原因。第一是ai的code能力已经超强,第二是我能看着airtest抄出了一个投屏,那么再抄一个agent,也是可以的。
其实这样看,不只是测试,所有行业都一样,底层是可以替换的,各个公司开源的大模型,外面套一个自己写的工具,来连接各个工具框架,很好的三明治配方!今年一定能有结果。