1*4882a593Smuzhiyun## RK356X/RK3588/RV1103/RV1106 RKNN SDK 1.4.0 2*4882a593Smuzhiyun 3*4882a593Smuzhiyun### 主要修改 4*4882a593Smuzhiyun 5*4882a593Smuzhiyun#### RKNN Compiler & Runtime v1.4.0: 6*4882a593Smuzhiyun- 新增权重压缩功能支持;(RK3588/RV1106),减少内存消耗 7*4882a593Smuzhiyun- RK3588新增sram功能支持,减少系统DDR负载 8*4882a593Smuzhiyun- RK3588新增单batch多核支持; 9*4882a593Smuzhiyun- 新增NPU直接输出NHWC layout的支持; 10*4882a593Smuzhiyun- 新增Reshape、Transpose、MatMul、 Max、Min、exGelu、exSoftmax13等op部分shape下的npu支持; 11*4882a593Smuzhiyun- 新增rknn_api weight 权重共享的功能; 12*4882a593Smuzhiyun- 完善对非4维输入支持 13*4882a593Smuzhiyun 14*4882a593Smuzhiyun#### RKNN-Toolkit2 1.4.0 15*4882a593Smuzhiyun 16*4882a593Smuzhiyun- 更新对 pytorch 1.10.2 版本的支持 17*4882a593Smuzhiyun- 更新对 tensorflow 2.6.2 版本的支持 18*4882a593Smuzhiyun- 升级相关依赖包到主流版本 (如onnx==1.9.0, onnxruntime==1.10.0等) 19*4882a593Smuzhiyun- 添加对 If / SplitToSequence / SequenceAt / Gelu / HardSwish / group_norm 等OP的支持 20*4882a593Smuzhiyun- 添加 2/3 维 OP 的支持 21*4882a593Smuzhiyun- 添加 config.remove_weight 的功能(用于 runtime 共享 weight 权重) 22*4882a593Smuzhiyun- 更新 onnx_optimzie 接口功能,支持导入自定义量化参数 23*4882a593Smuzhiyun- 优化 simulator 的内存占用,降低转换/推理模型的内存消耗,并提高其性能 24*4882a593Smuzhiyun 25*4882a593Smuzhiyun### 版本号查询 26*4882a593Smuzhiyun 27*4882a593Smuzhiyun- librknnrt runtime版本:1.4.0(strings librknnrt.so | grep version | grep lib) 28*4882a593Smuzhiyun- rknpu driver版本:0.8.2(dmesg | grep rknpu) 29*4882a593Smuzhiyun 30*4882a593Smuzhiyun### 其他说明 31*4882a593Smuzhiyun 32*4882a593Smuzhiyun- rknn-toolkit适用RV1109/RV1126/RK1808/RK3399Pro,rknn-toolkit2适用RK356X/RK3588/RV1103/RV1106 33*4882a593Smuzhiyun- rknn-toolkit2与rknn-toolkit API接口基本保持一致,用户不需要太多修改(rknn.config()部分参数有删减) 34*4882a593Smuzhiyun- rknpu2需要与rknn-toolkit2同步升级到1.4.0的版本。之前客户使用rknn toolkit2 1.3.0版本生成的rknn模型建议重新生成 35*4882a593Smuzhiyun- rknn api里面部分demo依赖MPI MMZ/RGA,使用时,需要和系统中相应的库匹配 36*4882a593Smuzhiyun- 本次发布也支持RV1103/RV1106 37*4882a593Smuzhiyun 38