非常棒的工作!我有几个疑惑: 请问residual的泰勒展开和hidden_state的泰勒展开的处理有什么不同吗,我没有在代码中看到特殊处理? 另外请问foca什么时候会支持呀
非常棒的工作!我有几个疑惑:
请问residual的泰勒展开和hidden_state的泰勒展开的处理有什么不同吗,我没有在代码中看到特殊处理?
另外请问foca什么时候会支持呀