xref: /OK3568_Linux_fs/docs/cn/Common/NPU/README.md (revision 4882a59341e53eb6f0b4789bf948001014eff981)
1*4882a593Smuzhiyun## RK356X/RK3588/RV1103/RV1106 RKNN SDK 1.4.0
2*4882a593Smuzhiyun
3*4882a593Smuzhiyun### 主要修改
4*4882a593Smuzhiyun
5*4882a593Smuzhiyun#### RKNN Compiler & Runtime v1.4.0:
6*4882a593Smuzhiyun- 新增权重压缩功能支持;(RK3588/RV1106),减少内存消耗
7*4882a593Smuzhiyun- RK3588新增sram功能支持,减少系统DDR负载
8*4882a593Smuzhiyun- RK3588新增单batch多核支持;
9*4882a593Smuzhiyun- 新增NPU直接输出NHWC layout的支持;
10*4882a593Smuzhiyun- 新增Reshape、Transpose、MatMul、 Max、Min、exGelu、exSoftmax13等op部分shape下的npu支持;
11*4882a593Smuzhiyun- 新增rknn_api weight 权重共享的功能;
12*4882a593Smuzhiyun- 完善对非4维输入支持
13*4882a593Smuzhiyun
14*4882a593Smuzhiyun#### RKNN-Toolkit2 1.4.0
15*4882a593Smuzhiyun
16*4882a593Smuzhiyun- 更新对 pytorch 1.10.2 版本的支持
17*4882a593Smuzhiyun- 更新对 tensorflow 2.6.2 版本的支持
18*4882a593Smuzhiyun- 升级相关依赖包到主流版本 (如onnx==1.9.0, onnxruntime==1.10.0等)
19*4882a593Smuzhiyun- 添加对  If / SplitToSequence / SequenceAt / Gelu / HardSwish / group_norm 等OP的支持
20*4882a593Smuzhiyun- 添加 2/3 维 OP 的支持
21*4882a593Smuzhiyun- 添加 config.remove_weight 的功能(用于 runtime 共享 weight 权重)
22*4882a593Smuzhiyun- 更新 onnx_optimzie 接口功能,支持导入自定义量化参数
23*4882a593Smuzhiyun- 优化 simulator 的内存占用,降低转换/推理模型的内存消耗,并提高其性能
24*4882a593Smuzhiyun
25*4882a593Smuzhiyun###  版本号查询
26*4882a593Smuzhiyun
27*4882a593Smuzhiyun- librknnrt runtime版本:1.4.0(strings librknnrt.so | grep version | grep lib)
28*4882a593Smuzhiyun- rknpu driver版本:0.8.2(dmesg | grep rknpu)
29*4882a593Smuzhiyun
30*4882a593Smuzhiyun### 其他说明
31*4882a593Smuzhiyun
32*4882a593Smuzhiyun- rknn-toolkit适用RV1109/RV1126/RK1808/RK3399Pro,rknn-toolkit2适用RK356X/RK3588/RV1103/RV1106
33*4882a593Smuzhiyun- rknn-toolkit2与rknn-toolkit API接口基本保持一致,用户不需要太多修改(rknn.config()部分参数有删减)
34*4882a593Smuzhiyun- rknpu2需要与rknn-toolkit2同步升级到1.4.0的版本。之前客户使用rknn toolkit2 1.3.0版本生成的rknn模型建议重新生成
35*4882a593Smuzhiyun- rknn api里面部分demo依赖MPI MMZ/RGA,使用时,需要和系统中相应的库匹配
36*4882a593Smuzhiyun- 本次发布也支持RV1103/RV1106
37*4882a593Smuzhiyun
38