Gradinv with self-attention

测试gi模型

weight 竟然全是一样的

更改训练模式(只选一个类)

再次测试

正确的attention