AI与职业

第一次看到文生图这件事，我觉得很诧异，近乎于魔法。短短几年，后面文生图又遍地开花，文生视频、音色、音乐，不可想象。这是我能理解的，最主流与持久的职业方向，完全超过了原来理解的ar，能支持我的职业穿越下一个周期。当时就在想，怎么参与进去呢？

各个模型的迭代与训练，这个门槛已经被拉的很高，已经不是我能进入的了，跟现在的大厂后端一样。作为辅助，怎么加入进去混口汤？我觉得midscene就是一个很好的答案。

我觉得加入ai这件事分成了3块。

第一块是大模型，这个已经被各个叫得上号的公司，迭代的近乎疯狂，几个月就是天翻地覆了，这个对测试来说，只是纯黑盒的发动机，不用关注了，出了牛逼的换就行。ollama本地部署一个，就是一行命令的事。

第二块选测试框架，来操作各个设备。midscene用的是playwright或者puppeteer那种，pc端的js测试框架。H5得换成uiautomator2（还不确定是否合规）。如果用在其他地方，换成对应的即可。

第三块是得重写一个agent，来让前两者交互。这一点原来看起来天方夜谭，但是已经有人做出来了，就像是一条未知的路，上面迷路被人吹开了。还是开源的。我以前从没觉得字节的人有啥好，破工牌天天挂脖子上秀，现在确实刮目相看，特别是顶部的技术佬。

我为什么觉得这个agent肯定能写出来，有2个原因。第一是ai的code能力已经超强，第二是我能看着airtest抄出了一个投屏，那么再抄一个agent，也是可以的。

其实这样看，不只是测试，所有行业都一样，底层是可以替换的，各个公司开源的大模型，外面套一个自己写的工具，来连接各个工具框架，很好的三明治配方！今年一定能有结果。